{"id":1166,"date":"2013-09-22T03:09:42","date_gmt":"2013-09-22T01:09:42","guid":{"rendered":"http:\/\/blog.nebule.org\/?p=1166"},"modified":"2016-03-29T19:02:46","modified_gmt":"2016-03-29T17:02:46","slug":"le-spam-deficience-didentification","status":"publish","type":"post","link":"http:\/\/blog.nebule.org\/?p=1166","title":{"rendered":"Le SPAM, d\u00e9ficience d&rsquo;identification"},"content":{"rendered":"<p style=\"text-align: justify;\">Qu&rsquo;est ce que le <a title=\"SPAM\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Spam\" target=\"_blank\">SPAM<\/a>?<br \/>\n\u00ab\u00a0Le <em>spam<\/em>, <em>pourriel<\/em> ou <em>polluriel<\/em> est une communication \u00e9lectronique non sollicit\u00e9e, en premier lieu via le <a title=\"Courrier \u00e9lectronique\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Courrier_%C3%A9lectronique\">courrier \u00e9lectronique<\/a>. Il s&rsquo;agit en g\u00e9n\u00e9ral d&rsquo;envois en grande quantit\u00e9 effectu\u00e9s \u00e0 des fins publicitaires.\u00a0\u00bb<br \/>\nCF<em> Wikipedia<\/em><\/p>\n<p style=\"text-align: justify;\">La d\u00e9finition est un peu floue. On note cependant plusieurs d\u00e9tails dans la premi\u00e8re phrase. C&rsquo;est d&rsquo;abord une communication, donc un \u00e9change d&rsquo;informations. Ensuite, cela prend une forme \u00e9lectronique, crit\u00e8re correspondant \u00e0 une vision un peu r\u00e9duite. Et enfin, c&rsquo;est quelque chose de non sollicit\u00e9, c&rsquo;est \u00e0 dire une communication initi\u00e9e par l&rsquo;<em>autre<\/em> partie, quelques chose que l&rsquo;on a pas demand\u00e9.<br \/>\nJusque l\u00e0, une communication \u00e9lectronique sur deux rentre dans cette cat\u00e9gorie. Il y a un consensus g\u00e9n\u00e9ral sur ce que cela d\u00e9signe, mais la d\u00e9finition est trop impr\u00e9cise. La pr\u00e9cision concernant le courrier \u00e9lectronique est optionnelle, pas vraiment contraignante. C&rsquo;est surtout un exemple qui aide le lecteur \u00e0 raccrocher le SPAM \u00e0 quelque chose qu&rsquo;il conna\u00eet d\u00e9j\u00e0. Cela veut aussi dire que le SPAM affecte potentiellement d&rsquo;autres m\u00e9dias de communication. Le FAX par exemple&#8230;<br \/>\nLa deuxi\u00e8me phrase reste aussi tr\u00e8s g\u00e9n\u00e9rale, donc tr\u00e8s impr\u00e9cise. Ce serait donc des envois de grandes quantit\u00e9s de messages publicitaires. Ou est le probl\u00e8me ici? La grande quantit\u00e9 d&rsquo;envois? Le caract\u00e8re publicitaire? Il n&rsquo;est fait aucune r\u00e9f\u00e9rence \u00e0 un probl\u00e8me dans cette d\u00e9finition, mais on assimile automatiquement la combinaison quantit\u00e9\/commercial \u00e0 un probl\u00e8me.<br \/>\nLe probl\u00e8me serait-il pas tout simplement de recevoir beaucoup de messages publicitaires que l&rsquo;on n&rsquo;aurait pas sollicit\u00e9 !? On notera la transformation entre l&rsquo;envoie massif de messages et la r\u00e9ception massive de ces m\u00eames messages. Se soucierait-on du SPAM si un envoie massif aboutissait \u00e0 un seul message par semaine dans notre boite aux lettres ? Assur\u00e9ment pas.<\/p>\n<p style=\"text-align: justify;\">Un e-mail non sollicit\u00e9 ventant les propri\u00e9t\u00e9s d&rsquo;une lessive est un SPAM.<br \/>\nUn prospectus papier dans notre boite aux lettres, non. Ce n&rsquo;est pas une communication \u00e9lectronique. Pourtant, en pratique, c&rsquo;est le m\u00eame ph\u00e9nom\u00e8ne : on remplit nos boites aux lettres de messages publicitaires non sollicit\u00e9s. Messages dont il faut se d\u00e9barrasser.<br \/>\nAllons encore plus loin. Un panneau publicitaire, diffusant d&rsquo;autorit\u00e9 un message dans notre environnement, n&rsquo;est pas non plus du SPAM. Ce n&rsquo;est pas une communication \u00e9lectronique et cela ne vous est pas directement adress\u00e9. Pourtant nous sommes bien dans la diffusion massive d&rsquo;un message publicitaire. Elle est massive parce que adress\u00e9e \u00e0 toutes les personnes qui passent devant. Finalement, le panneau publicitaire peut de la m\u00eame fa\u00e7on \u00eatre assimil\u00e9 \u00e0 du SPAM. Mais l\u00e0 on ne peut rien faire, il n&rsquo;y a pas de bouton <em>suppression<\/em>. Bien que la d\u00e9gradation de notre environnement visuel soit manifeste, cela ne rentre pas dans la cat\u00e9gorie SPAM. Je vous laisse en d\u00e9duire la raison.<br \/>\nEn terme informationnel, c&rsquo;est l&rsquo;insertion d&rsquo;informations parasites en grand nombre qui provoques une g\u00e8ne. Tant que cela ne demande pas trop de temps pour \u00eatre trait\u00e9e, c&rsquo;est tol\u00e9r\u00e9. Le traitement de ces informations parasites veut dire d&rsquo;analyser chaque information afin de d\u00e9terminer sa pertinence et la suite \u00e0 donner, c&rsquo;est \u00e0 dire la supprimer ou l&rsquo;ignorer dans le pire des cas.<\/p>\n<p style=\"text-align: justify;\">Revenons au SPAM tel que commun\u00e9ment accept\u00e9. Face au d\u00e9luge de messages \u00e0 trier (\u00e0 supprimer), il est rapidement apparut n\u00e9cessaire de <a title=\"lutte anti-SPAM\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Lutte_anti-spam\" target=\"_blank\">traiter le probl\u00e8me<\/a>. Ce traitement peut intervenir \u00e0 plusieurs niveaux et de plusieurs mani\u00e8res. \u00c9videmment, il est pr\u00e9f\u00e9rable de pouvoir fortement automatiser ce processus de traitement.<br \/>\nIl y a aujourd&rsquo;hui un large panel de m\u00e9thodes diff\u00e9rentes pour traiter ce probl\u00e8me sp\u00e9cifique, des plus artisanales aux plus industrielles. Les r\u00e9sultats ne sont pas toujours \u00e0 la hauteur des investissements en argent ou en temps. Mais comment mesurer l&rsquo;efficacit\u00e9 de ces m\u00e9thodes ?<br \/>\nOn peut mesurer les performances de plusieurs fa\u00e7ons. La premi\u00e8re id\u00e9e est de mesurer le pourcentage de SPAM r\u00e9ellement d\u00e9tect\u00e9s. Oui, mais ce n&rsquo;est pas suffisant, que fait-on du nombre de messages l\u00e9gitimes qui ont \u00e9t\u00e9 supprim\u00e9s en m\u00eame temps? Une soci\u00e9t\u00e9 commerciale doit pouvoir recevoir des messages de toute provenance et doit \u00e9viter un maximum de pertes de messages, sinon ce sont des clients en moins et donc des b\u00e9n\u00e9fices en moins. Ces soci\u00e9t\u00e9s vont donc investir dans des solutions tr\u00e8s sophistiqu\u00e9es qui maximisent la d\u00e9tection et minimise les dommages collat\u00e9raux.<\/p>\n<p style=\"text-align: justify;\">Une des caract\u00e9ristiques que l&rsquo;on retrouve souvent dans les SPAM, c&rsquo;est que l&rsquo;adresse de l&rsquo;exp\u00e9diteur est fantaisiste bien que de forme correcte. Une des m\u00e9thodes de lutte est de renvoyer un message \u00e0 l&rsquo;exp\u00e9diteur pour demander une confirmation. Il n&rsquo;est malheureusement pas infaisable pour un robot de pouvoir r\u00e9pondre positivement \u00e0 cette confirmation, m\u00eame avec un <a title=\"captcha\" href=\"http:\/\/fr.wikipedia.org\/wiki\/CAPTCHA\" target=\"_blank\">captcha<\/a>.<\/p>\n<p style=\"text-align: justify;\">Le particulier \u00e0 potentiellement moins de probl\u00e8me qu&rsquo;une soci\u00e9t\u00e9. Il peut facilement mettre de c\u00f4t\u00e9 tous les messages dont les exp\u00e9diteurs ne lui sont pas connus. Il suffit de temps en temps de regarder le dossier des SPAM (les inconnus) si on attend un message d&rsquo;un nouveau destinataire. Mais m\u00eame cette m\u00e9thode a ses limites. Certaines sources de SPAM essayent de pirater des bo\u00eetes aux lettres d&rsquo;utilisateurs l\u00e9gitimes (vos amis) pour leur faire envoyer \u00e0 leur insu des SPAM. Un certain nombre de virus sont sp\u00e9cialis\u00e9s, une fois qu&rsquo;un nouvel ordinateur est contamin\u00e9, pour aller d\u00e9pouiller le carnet d&rsquo;adresse. Et pour rendre plus difficile la d\u00e9tection du poste contamin\u00e9, d&rsquo;envoyer les SPAM en se faisant pass\u00e9 pour un des contacts du carnet d&rsquo;adresse.<br \/>\nSi la m\u00e9thode du filtrage est assez efficace tant en d\u00e9tection quand tant que rejet de messages l\u00e9gitimes, elle peut au besoin \u00eatre compl\u00e9t\u00e9e par une autre m\u00e9thode comme un filtre <a title=\"filtre bayesien\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Lutte_anti-spam#Filtrage_bayesien\" target=\"_blank\">bayesien<\/a> par exemple.<\/p>\n<p style=\"text-align: justify;\">Les filtres de type <a title=\"filtre RBL\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Lutte_anti-spam#RBL\" target=\"_blank\">RBL<\/a> sont un moyen de d\u00e9fense dynamique assez performant avec peu de dommages collat\u00e9raux. Mais d&rsquo;un autre c\u00f4t\u00e9,\u00c2\u00a0si ils bloquent des plages enti\u00e8res d&rsquo;adresses IP (plages IP des clients des ISP), ils deviennent catastrophiques par le nombre de messages l\u00e9gitimes bloqu\u00e9s.<br \/>\nLe filtre <a title=\"filtre greylist\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Lutte_anti-spam#Liste_grise_.28Greylisting.29\" target=\"_blank\">greylist<\/a> est quand \u00e0 lui bas\u00e9 sur le bon fonctionnement du serveur \u00e9metteur du SPAM. \u00c7a marche encore tr\u00e8s bien aujourd&rsquo;hui avec aucun rejet de message l\u00e9gitime, mais cela ne tient qu&rsquo;\u00e0 la volont\u00e9 des diffuseurs de SPAM d&rsquo;am\u00e9liorer (un peu) leurs outils.<\/p>\n<p style=\"text-align: justify;\">On voit que la lutte contre le SPAM utilise des outils qui ont tous leurs limites. Ils sont tous par principe faibles parce que le protocole n&rsquo;a pas \u00e9t\u00e9 pr\u00e9vu pour lutter contre ce probl\u00e8me.<br \/>\nDans la plupart des SPAM, on a clairement une <span style=\"text-decoration: underline;\">carence dans l&rsquo;identification de l&rsquo;exp\u00e9diteur<\/span>.<\/p>\n<p style=\"text-align: justify;\">Le moyen naturel d&rsquo;y r\u00e9pondre est d&rsquo;\u00eatre capable d&rsquo;identifier tous les acteurs g\u00e9n\u00e9rateurs d&rsquo;information. Cela veut dire que, n&rsquo;\u00e9tant pas capable de pouvoir identifier toutes les sources possibles et l\u00e9gitimes dans le monde, on va devoir se fier \u00e0 un syst\u00e8me plus global qui se base sur des autorit\u00e9s de confiances. Un syst\u00e8me sur le principe du <em>DNS<\/em> mais aussi des certificats <em>x509<\/em>.<br \/>\nMais imposer une identification globale remet directement en cause l&rsquo;anonymat. Et se reposer sur des autorit\u00e9s de confiance n&rsquo;est pas sans cons\u00e9quences. Les probl\u00e8mes r\u00e9currents de piratage des autorit\u00e9s de certification nous montre que c&rsquo;est loin d&rsquo;\u00eatre infaillible.<\/p>\n<p style=\"text-align: justify;\">Que faire? Comment palier le manque d&rsquo;identification sans remettre en question l&rsquo;anonymat? Vu comme \u00e7a, cela semble impossible.<br \/>\nLa r\u00e9ponse la plus simple serait de couper toute communication. Mais l&rsquo;\u00eatre humain a la n\u00e9cessit\u00e9 (absolue) d&rsquo;accepter des \u00e9changes, qu&rsquo;ils soient de forme \u00e9lectronique ou pas d&rsquo;ailleurs. Et l&rsquo;\u00eatre humain sait naturellement faire le tri des informations, de juger le risque de s\u00e9lectionner une information plut\u00f4t qu&rsquo;une autre. Il sait aussi se tromper et se faire manipuler.<br \/>\nL&rsquo;humain doit revenir au centre de la d\u00e9cision lorsque le temps et la quantit\u00e9 d&rsquo;informations ne sont pas saturantes. Il faut afficher l&rsquo;information qui permet la prise de d\u00e9cision. Et si certaines actions sont fortement automatis\u00e9es, il faut afficher le r\u00e9sultat de ces actions que l&rsquo;automatisme a jug\u00e9 n\u00e9cessaires.<\/p>\n<p style=\"text-align: justify;\">Comment se positionne <em>nebule<\/em> vis-\u00e0-vis de ce probl\u00e8me?<br \/>\nIl propose un syst\u00e8me capable de g\u00e9rer des utilisateurs localement mais qui peuvent \u00eatre reconnus globalement. Ainsi, un utilisateur n&rsquo;est valide que parce-qu&rsquo;il est reconnu par ses paires, en gros ses voisins. Mais on est capable d&rsquo;adresser un utilisateur \u00e0 l&rsquo;autre bout du monde, ce m\u00eame si on ne le conna\u00eet pas. On peut \u00e9ventuellement se fier \u00e0 des autorit\u00e9s locales de confiance qui d\u00e9terminent qui sont de vrais utilisateurs et qui ne le sont pas. On peut aussi dire que l&rsquo;on accepte ou rejette certains utilisateurs en fonctions de crit\u00e8res comme la proximit\u00e9 sociale ou g\u00e9ographique.<br \/>\nMais le risque, c&rsquo;est la manipulation de ces r\u00e8gles de s\u00e9lections \u00e0 l&rsquo;avantage du diffuseur de SPAM. Diffuseur qui peut \u00eatre plus facilement bannis aussi.L&rsquo;autre risque, c&rsquo;est la compromission du poste de l&rsquo;utilisateur, et donc l&rsquo;envoie de SPAM \u00e0 son insu. Mais \u00e7a c&rsquo;est un probl\u00e8me d&rsquo;une toute autre dimension&#8230;<\/p>\n<p style=\"text-align: justify;\">Liens :<br \/>\n&#8211; <a title=\"http:\/\/fr.wikipedia.org\/wiki\/Spam\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Spam\" target=\"_blank\">http:\/\/fr.wikipedia.org\/wiki\/Spam<\/a><br \/>\n&#8211; <a title=\"http:\/\/fr.wikipedia.org\/wiki\/Courrier_%C3%A9lectronique\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Courrier_%C3%A9lectronique\" target=\"_blank\">http:\/\/fr.wikipedia.org\/wiki\/Courrier_%C3%A9lectronique<\/a><br \/>\n&#8211; <a title=\"http:\/\/fr.wikipedia.org\/wiki\/Lutte_anti-spam\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Lutte_anti-spam\" target=\"_blank\">http:\/\/fr.wikipedia.org\/wiki\/Lutte_anti-spam<\/a><br \/>\n&#8211; <a title=\"http:\/\/fr.wikipedia.org\/wiki\/CAPTCHA\" href=\"http:\/\/fr.wikipedia.org\/wiki\/CAPTCHA\" target=\"_blank\">http:\/\/fr.wikipedia.org\/wiki\/CAPTCHA<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Qu&rsquo;est ce que le SPAM? \u00ab\u00a0Le spam, pourriel ou polluriel est une communication \u00e9lectronique non sollicit\u00e9e, en premier lieu via le courrier \u00e9lectronique. Il s&rsquo;agit en g\u00e9n\u00e9ral d&rsquo;envois en grande quantit\u00e9 effectu\u00e9s \u00e0 des fins publicitaires.\u00a0\u00bb CF Wikipedia La d\u00e9finition est un peu floue. On note cependant plusieurs d\u00e9tails dans la premi\u00e8re phrase. C&rsquo;est d&rsquo;abord &hellip; <a href=\"http:\/\/blog.nebule.org\/?p=1166\" class=\"more-link\">Continuer la lecture de <span class=\"screen-reader-text\">Le SPAM, d\u00e9ficience d&rsquo;identification<\/span><\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[93,23],"tags":[305],"_links":{"self":[{"href":"http:\/\/blog.nebule.org\/index.php?rest_route=\/wp\/v2\/posts\/1166"}],"collection":[{"href":"http:\/\/blog.nebule.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.nebule.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.nebule.org\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.nebule.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=1166"}],"version-history":[{"count":1,"href":"http:\/\/blog.nebule.org\/index.php?rest_route=\/wp\/v2\/posts\/1166\/revisions"}],"predecessor-version":[{"id":2244,"href":"http:\/\/blog.nebule.org\/index.php?rest_route=\/wp\/v2\/posts\/1166\/revisions\/2244"}],"wp:attachment":[{"href":"http:\/\/blog.nebule.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=1166"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.nebule.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=1166"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.nebule.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=1166"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}