identification – Page 2

Nommage multiple et protÃ©iforme

Dans nebule, les objets ont forcÃ©ment un identifiant. Ils ont aussi parfois un nom. Typiquement, c’est le cas lorsque l’objet a pour source un fichier nÃ©bulisÃ©.

Le nom est un texte de caractÃ¨res comprÃ©hensible par les humains. DÃ©jÃ , en fonction des langues, il se peux que ce texte ne soit pas comprÃ©hensible pas tout le monde. Mais on exclut dÃ©jÃ par principe les caractÃ¨res non imprimables, mÃªme si en rÃ©alitÃ© Ã§a n’a pas beaucoup d’importance. Il vaut mieux que le texte n’ai pas de retour Ã la ligne, mais Ã§a peut Ãªtre interprÃ©tÃ©, traduit et pris en compte Ã l’affichage.

Pour un fichier, le nom (qui inclus le chemin) a deux rÃ´les :

le classement sommaire par sujets en fonction du chemin et parfois du nom ;
la description sommaire du contenu, un peu comme un titre.

Dans nebule, le nom que l’on peut donner Ã un objet a le mÃªme rÃ´le que le nom pour un fichier. Il donne un titre Ã l’objet. Par contre, le classement des objets intervient peu avec le nom que ceux-ci pourraient avoir. Ce serait plutÃ´t le rÃ´le de groupes et de nÅ“uds, concept encore en cours d’affinement. Pour un objet, lui donner un nom c’est le lier Ã un autre objet qui contient le nom avec un lien de type l.

Si un fichier ne peut avoir qu’un seul nom, un objet peut en avoir plus. Il est possible de crÃ©er plusieurs liens vers diffÃ©rents objets Ã utiliser comme noms. Les propriÃ©tÃ©s de liens multiples et concurrents sont valables aussi pour le nommage.
Lors de l’affichage, comme dans l’exemple ci-dessus, il faut faire un choix. Soit on affiche tous les noms, ce qui peut rapidement devenir problÃ©matique et difficilement comprÃ©hensible par l’utilisateur. Soit on affiche qu’un seul nom, celui affichÃ© Ã©tant celui qui a le plus grand score dans le calcul des relations sociales. C’est cette derniÃ¨re solution qui est adoptÃ©e aujourd’hui.

Mais on peut faire encore mieux. Rien n’interdit un lien pour un titre de renvoyer vers une image. D’ailleurs, ce peut Ãªtre tout objet sans distinction. C’est l’interprÃ©tation du titre qui ici prend son importance. Si on nâ€™interprÃ¨te que du texte alphanumÃ©rique sur une seule ligne, les autres objets seront ignorÃ©s comme titre.
Si on dÃ©cide de prendre en compte aussi les images, il ne sera peut-Ãªtre pas opportun d’utiliser une image de grande rÃ©solution, lourde. On peut utiliser Ã la place les miniatures, des images dÃ©rivÃ©es, pour l’affichage comme titre. Les miniatures d’images seront d’ailleurs trÃ¨s rÃ©guliÃ¨rement utilisÃ©es lors de l’affichage.
Pour un film, on va peut-Ãªtre utiliser soit une image fixe soit une petite sÃ©quence animÃ©e, l’une comme l’autre extraite du film.

L’affichage final peut dans certains cas prendre en compte simultanÃ©ment plusieurs objets titres mais de types diffÃ©rents. Par exemple accepter une image et un texte, ou un morceau de film, un son et un texte…
ProtÃ©iforme ne veut pas dire en forme de protÃ©ine mais bien de formes multiples.
Tout est question d’interprÃ©tation et de stratÃ©gie d’affichage. Tout est possible, aussi.

Dans sylabe, comme dans nebule, une entitÃ© a un nom constituÃ© d’un petit texte, un prÃ©nom et mÃªme un prÃ©fixe sur le mÃªme principe. Mais elle peut aussi depuis peu avoir une image, typiquement une photo d’identitÃ©. Le nommage multiple et protÃ©iforme existe donc dÃ©jÃ .

Google+ et l’anonymat

Dans un article, le rÃ©seau social Google+ revient sur les restrictions de nommage de ses utilisateurs. Il va maintenant Ãªtre possible de choisir des pseudonymes de faÃ§on Ã profiter du rÃ©seau social en ligne tout en permettant un certain anonymat.

Il Ã©tait temps…

L’Ã©tape suivant serait de permettre Ã tout utilisateur de pouvoir nativement crÃ©er des pseudonymes partiellement autonomes. L’idÃ©e est en cours de mise en place sur le projet sylabe. La condition du succÃ¨s est bien sÃ»r que qu’un pseudonyme puisse avoir une vie propre, ses propres relations et groupes (cercles sur G+) et que l’on bascule de faÃ§on Ã©quivoque de l’entitÃ© principale vers un pseudonyme. C’est un bon moyen de rÃ©pondre Ã des besoins d’anonymisation tout en facilitant la gestion de l’anonymisation par les vrais utilisateurs.
Il faudra aussi dÃ©terminÃ© si un pseudonyme apparait clairement comme tel dans les utilisateurs ou si sa vraie nature reste cachÃ©e pour prÃ©server son efficacitÃ©.
Bien sÃ»r, il faudra garder Ã l’esprit que monsieur Google aura accÃ¨s Ã toutes les entitÃ©s, que ce soit les vrais utilisateurs ou leurs pseudonymes. Cela rÃ©pond dans ce cas aux problÃ¨mes lÃ©gaux pour pouvoir remonter, sur dÃ©cision d’un juge, Ã la personne physique derriÃ¨re un pseudonyme.

Prise d’empreinte homomorphique

Les objets manipulÃ©s par nebule sont identifiÃ©s, et donc rÃ©fÃ©rencÃ©s, par leurs empreintes respectives. Ces empreintes sont cryptographiques afin de pouvoir s’assurer que c’est bien le bon objet, afin de pouvoir avoir confiance dans l’intÃ©gritÃ© de son contenu. Il est possible dans un seul cas d’avoir plus d’une empreinte par objet, c’est si celles-ci sont calculÃ©es avec des algorithmes diffÃ©rents (cf Collisions dâ€™empreintes multi-algorithmique).

Cependant, si la propriÃ©tÃ© cryptographique des empreintes est indispensable Ã la confiance, elle entraÃ®ne un manque de souplesse dans le rÃ©fÃ©rencement des objets. Rien dans la valeur de l’empreinte ne trahis une partie de son contenu. L’empreinte cryptographique reflÃ¨te uniquement l’intÃ©gralitÃ© de l’objet. On ne peux pas s’en servir pour retrouver des objets proches dans leur contenu. Tout au plus peut-on vÃ©rifier si deux objets sont identiques… ce qui n’a pas d’intÃ©rÃªt puisque dans ce cas c’est tout simplement le mÃªme objet.

Sub-division d’objet

La premiÃ¨re solution pour rÃ©soudre ce problÃ¨me est d’utiliser des sous-parties d’un objet comme des objets propres, et de les identifier comme tels. Le lien de type s permet justement de liÃ© l’objet principal Ã ses morceaux.

C’est notamment ce qui est fait dans les logiciels de Paire-Ã -Paire (P2P – Peer to Peer). Pour qu’un fichier puisse Ãªtre tÃ©lÃ©chargÃ© depuis de multiples sources, celui-ci est prÃ©-dÃ©coupÃ© en morceaux de taille identique prÃ©-dÃ©finit. Chaque morceau Ã une empreinte propre et peut Ãªtre vÃ©rifiÃ© Ã la rÃ©ception. Chaque morceau est tÃ©lÃ©chargÃ© sur une et une seule source, mais plusieurs morceaux sont tÃ©lÃ©chargÃ©s simultanÃ©ment depuis plusieurs sources. On augmente ainsi le dÃ©bit rÃ©el de rÃ©ception du fichier voulu mÃªme si les sources ont individuellement un faible dÃ©bit d’Ã©mission. Ã‰videmment, si chaque morceau est valide, le fichier dans son ensemble ne peut qu’Ãªtre valide.

Une recherche sur mot clÃ© peut avantageusement tirer partie de ce systÃ¨me puisqu’une recherche se fera uniquement sur l’empreinte du morceau correspondant Ã la recherche. Toute la difficultÃ© est de bien choisir ces morceaux.

Pour du texte, c’est facile. Pour une recherche sur des images ou des vidÃ©os, c’est dÃ©jÃ beaucoup moins Ã©vident. Mais quoique l’on trouve, c’est toujours une liste d’objets qui contiennent cette petite sous-partie mÃªme si le reste n’a absolument aucun rapport.

Empreinte homomorphique

Une autre solution consiste Ã essayer de trouver des objets qui ont le plus de contenu en commun. Ce serait une sorte de reprÃ©sentation miniature du contenu de l’objet. On veut quelque chose qui se rapproche plus de l’empreinte des doigts de pieds. On regarde d’abord que cela Ã bien la forme d’un pied, puis on regarde plus en dÃ©tail certaines parties morphologiques pour dÃ©terminer si les deux pieds sont proches.

On pourrait partir sur le systÃ¨me de sous-dÃ©coupage utilisÃ© par le P2P. Chaque objet est dÃ©coupÃ© en petits morceaux de taille identique. Ainsi, si deux objets ont un ou des morceaux en commun, on pourra en dÃ©duire que ceux-ci sont proches.
Mais cette mÃ©thode pose un problÃ¨me. Si on prend un objet et que l’on en fait une copie avec pour seule diffÃ©rence un caractÃ¨re supplÃ©mentaire dans le premier bloc de donnÃ©es, alors tous les blocs seront vus comme diffÃ©rents alors que les objets ont clairement des parties communes.
On pourrait imaginer essayer d’optimiser la mÃ©thode en travaillant sur des blocs de tailles variables. Mais quels critÃ¨res adopter pour ajuster les tailles de blocs en fonction des donnÃ©es ?

Je propose une mÃ©thode comme base de rÃ©flexion Ã dÃ©faut pour l’instant d’Ãªtre adoptÃ©e.
Si on regarde le travail d’un logiciel de compression de donnÃ©es, on constate qu’il recherche les occurrences multiples de donnÃ©es dans l’ensemble d’un document. Il le fait sans tenir compte de la sÃ©mantique de ce qu’il trouve. Ainsi des mots trÃ¨s proches sÃ©mantiquement ne seront pas agrÃ©gÃ©s parce que diffÃ©rents. Ensuite, le logiciel de compression fait un classement statistique pour dÃ©terminer les occurrences multiples qu’il serait avantageux de rÃ©duire. Une phrase qui apparaÃ®t quelques fois permet une bonne optimisation. Un mot qui apparaÃ®t plusieurs permet aussi un gain de place facile.
Si on reprend le mÃªme principe d’analyse, mÃªme sans tenir compte de la sÃ©mantique des mots, on peut s’attendre Ã ce que les plus grandes occurrences de mots ou de phrases reprÃ©sentent le ou les sujets du document. C’est ce que fontnotamment les moteurs de recherches (Google, Bing, Yahoo…) lorsqu’ils moulinent les pages web, mais avec l’analyse sÃ©mantique en plus.
L’empreinte homomorphique est constituÃ©e des 20 premiÃ¨res occurrences redondantes avec leur poids respectifs. L’occurrence peut Ãªtre reprÃ©sentÃ©e par une petite empreinte (CRC) de faÃ§on Ã avoir une taille fixe, mettons 16 caractÃ¨res hexadÃ©cimaux. Le poids peut Ãªtre reprÃ©sentÃ© en pourcentage sur 4 caractÃ¨res hexadÃ©cimaux (entre 0000 et ffff).
Vue comme Ã§a, l’empreinte gÃ©nÃ©rÃ©e n’est plus tout Ã fait homomorphique et n’a pas de propriÃ©tÃ©s cryptographique.On obtient une empreinte homomorphique de 400 caractÃ¨res hexadÃ©cimaux.

Ainsi, plusieurs documents parlants d’un mÃªme sujet ont de fortes chances d’avoir une mÃªme empreinte parque bien que diffÃ©rents ils auront les mÃªmes occurrences redondantes.

Un certain nombre de donnÃ©es annexes vont figurer dans les donnÃ©es utilisÃ©es pour la comparaison. Par exemple on peut retrouver les en-tÃªtes internes des documents bureautique. Il faut peut-Ãªtre prÃ©-filtrer les documents en fonction de leur type pur. Par exemple, un simple fichier texte et un fichier complexe de traitement de texte se verront expurgÃ©s de tout ce qui est en-tÃªte et donnÃ©es internes, puis on en gardera que les caractÃ¨res imprimables convertis en minuscule, sans ponctuation…

Conclusion

Une empreinte homomorphique peut Ãªtre utilisÃ©e avantageusement en complÃ©ment de l’empreinte cryptographique. Elle n’a d’intÃ©rÃªt que pour des objets ayant suffisamment de contenu. Il faut prÃ©voir un seuil minimum en dessous duquel elle n’est pas calculÃ©e. Cette empreinte homomorphique est liÃ©e Ã l’objet par un lien de type l avec comme objet mÃ©ta « nebule/objet/homomorphe ». Cet objet Ã usage rÃ©servÃ© est ajoutÃ© Ã la documentation.

Mais dans tous les cas, en l’absence de propriÃ©tÃ©s cryptographique, une empreinte homomorphique ne doit pas Ãªtre utilisÃ©e dans les liens. L’usage n’est pas le mÃªme, on fait soit de l’intÃ©gritÃ©, soit du rÃ©fÃ©rencement.

Marqueur de groupe multidimensionnel

Les objets sont aujourd’hui identifiÃ©s par une valeur unique qui, de part ses propriÃ©tÃ©s, n’est pas prÃ©-calculable ou prÃ©visible. Ce comportement est indispensable pour distinguer parfaitement et de faÃ§on univoque les objets, et donc leur contenu. Il rÃ©sulte de ces propriÃ©tÃ©s que toute modification d’un objet, quelle qu’elle soit et aussi infime qu’elle soit, entraÃ®ne un changement complet et quasi-alÃ©atoire de son empreinte, et donc de l’identifiant correspondant.

Mais il peut Ãªtre aussi intÃ©ressant de disposer d’une autre valeur plus prÃ©visible. On va essayer de dÃ©finir ici ce que l’on appellera un marqueur.
On peut imaginer par exemple que deux images trÃ¨s proches puissent avoir un marqueur de valeur identique ou proche. Pour de la musique, le marqueur peut Ãªtre un dÃ©rivÃ© atemporel du spectre de frÃ©quences. Ce marqueur doit avoir une structure en accord avec la structure de l’objet. On doit pouvoir comparer les marqueurs de deux objets diffÃ©rents et dÃ©terminer rapidement si ils ont une structure proche, donc si ils sont ressemblants. La structure doit Ãªtre multidimensionnelle et de profondeur variable. L’ajustement de la profondeur de comparaison des marqueurs doit permettre de retrouver les objets trÃ¨s proches ou au contraire vaguement ressemblants.

Une notion de groupe apparaÃ®t. On fait un regroupement Ã gÃ©omÃ©trie variable des objets par rapport Ã leur contenu.

Le cÃ´tÃ© multidimensionnel du marqueur doit reflÃ©ter les caractÃ©ristiques multidimensionnelles d’un objet. Voici quelques exemples :

Un texte simple contient des donnÃ©es qui s’expriment en deux dimensions : la position spatial et pour chaque position une valeur (caractÃ¨re).
Un texte enrichit contient des donnÃ©es qui s’expriment en trois dimensions : la position spatial et pour chaque position deux valeurs (caractÃ¨re et encodage).
Un son mono contient des donnÃ©es en deux dimensions : la position temporelle et pour chaque position une valeur (amplitude).
Un son stÃ©rÃ©o contient des donnÃ©es en trois dimensions : la position temporelle et pour chaque position deux valeurs (amplitude).
Une image en noir et blanc contient des donnÃ©es en trois dimensions : la position spatial horizontale, la position spatial vertical et pour chaque couple de position spatial on a une valeur (amplitude).
Une image en couleur (RVB) contient des donnÃ©es en cinq dimensions : la position spatial horizontale, la position spatial vertical et pour chaque couple de position spatial on a trois valeurs (amplitude).
Un film en couleur muet contient des donnÃ©es en six dimensions : la position spatial horizontale, la position spatial vertical, la position temporelle et pour chaque couple de position spatial/temporelle on a trois valeurs (amplitude).
Un film en couleur avec son stÃ©rÃ©o contient des donnÃ©es en huit dimensions : la position spatial horizontale, la position spatial vertical, la position temporelle et pour chaque couple de position spatial/temporelle on a cinq valeurs (amplitude).

Ce marqueur n’est pas destinÃ© Ã remplacÃ© l’identifiant !
L’identifiant reste le seul moyen de discerner sans ambiguÃ¯tÃ© tous les objets, y compris les plus ressemblants.

Ne reste plus qu’Ã formaliser prÃ©cisÃ©ment ce marqueur.

Renouveler son entitÃ©

Pour l’instant, les entitÃ©s sont figÃ©es. Mais il faudra prÃ©voir de changer leurs mots de passes et de les migrer vers de nouvelles entitÃ©s au besoin.

Le changement de mot de passe nÃ©cessite de rÃ©gÃ©nÃ©rer l’objet de clÃ© privÃ© qui change. Il faut Ã©videmment prÃ©alablement dÃ©verrouiller l’entitÃ©, donc sa clÃ© privÃ©e. Une fois le mot de passe changÃ©, il faut lier la nouvelle clÃ© privÃ©e Ã la clÃ© publique puis supprimer le lien de l’ancienne clÃ© privÃ©. Il faut marquer Ã supprimer l’objet de l’ancienne clÃ© privÃ©e.

Dans le cas d’une migration d’entitÃ©, c’est un peu plus complexe. Ce besoin rÃ©pondra souvent suite Ã un problÃ¨me de compromission ou de corruption d’entitÃ©.
Il faut gÃ©nÃ©rer une nouvelle entitÃ© autonome. Faire un lien de mise Ã jour de l’ancienne entitÃ© vers la nouvelle. Dans la mesure du possible, ce lien de mise Ã jour doit Ãªtre signÃ© Ã la fois par l’ancienne et la nouvelle entitÃ©. Puis l’objet de la clÃ© privÃ©e de l’ancienne entitÃ© doit Ãªtre marquÃ© Ã supprimer Ã la fois par l’ancienne et la nouvelle entitÃ©.
Si l’entitÃ© avait Ã©tÃ© corrompue, c’est Ã dire qu’il Ã©tait impossible de la dÃ©verrouiller, c’est un vrai problÃ¨me. Dans ce cas, les liens de mise Ã jour d’entitÃ© et de suppression de clÃ© privÃ©e ne pourront Ãªtre signÃ©s par l’ancienne entitÃ©. rien ne permet de distinguer une opÃ©ration lÃ©gitime suite Ã un problÃ¨me d’une tentative de dÃ©tournement par une autre entitÃ©. Il peut tout au plus Ãªtre possible de regarder si l’entitÃ© gÃ©nÃ¨re de l’activitÃ©, donc qu’elle n’est pas corrompue.
En cas de compromission de l’entitÃ©, on peut faire une mise Ã jour vers une nouvelle entitÃ©. Mais celui qui a volÃ© la clÃ© privÃ©e de l’entitÃ© peut le faire aussi de son cÃ´tÃ©. Il est difficile dans ce cas de dÃ©terminer qui est la vÃ©ritable nouvelle identitÃ© et pas une usurpation… Peut-Ãªtre le cÃ´tÃ© sociale, comportemental, d’une entitÃ© peut nous aider Ã posteriori?

Le SPAM, dÃ©ficience d’identification

Qu’est ce que le SPAM?
« Le spam, pourriel ou polluriel est une communication Ã©lectronique non sollicitÃ©e, en premier lieu via le courrier Ã©lectronique. Il s’agit en gÃ©nÃ©ral d’envois en grande quantitÃ© effectuÃ©s Ã des fins publicitaires. »
CF Wikipedia

La dÃ©finition est un peu floue. On note cependant plusieurs dÃ©tails dans la premiÃ¨re phrase. C’est d’abord une communication, donc un Ã©change d’informations. Ensuite, cela prend une forme Ã©lectronique, critÃ¨re correspondant Ã une vision un peu rÃ©duite. Et enfin, c’est quelque chose de non sollicitÃ©, c’est Ã dire une communication initiÃ©e par l’autre partie, quelques chose que l’on a pas demandÃ©.
Jusque lÃ , une communication Ã©lectronique sur deux rentre dans cette catÃ©gorie. Il y a un consensus gÃ©nÃ©ral sur ce que cela dÃ©signe, mais la dÃ©finition est trop imprÃ©cise. La prÃ©cision concernant le courrier Ã©lectronique est optionnelle, pas vraiment contraignante. C’est surtout un exemple qui aide le lecteur Ã raccrocher le SPAM Ã quelque chose qu’il connaÃ®t dÃ©jÃ . Cela veut aussi dire que le SPAM affecte potentiellement d’autres mÃ©dias de communication. Le FAX par exemple…
La deuxiÃ¨me phrase reste aussi trÃ¨s gÃ©nÃ©rale, donc trÃ¨s imprÃ©cise. Ce serait donc des envois de grandes quantitÃ©s de messages publicitaires. Ou est le problÃ¨me ici? La grande quantitÃ© d’envois? Le caractÃ¨re publicitaire? Il n’est fait aucune rÃ©fÃ©rence Ã un problÃ¨me dans cette dÃ©finition, mais on assimile automatiquement la combinaison quantitÃ©/commercial Ã un problÃ¨me.
Le problÃ¨me serait-il pas tout simplement de recevoir beaucoup de messages publicitaires que l’on n’aurait pas sollicitÃ© !? On notera la transformation entre l’envoie massif de messages et la rÃ©ception massive de ces mÃªmes messages. Se soucierait-on du SPAM si un envoie massif aboutissait Ã un seul message par semaine dans notre boite aux lettres ? AssurÃ©ment pas.

Un e-mail non sollicitÃ© ventant les propriÃ©tÃ©s d’une lessive est un SPAM.
Un prospectus papier dans notre boite aux lettres, non. Ce n’est pas une communication Ã©lectronique. Pourtant, en pratique, c’est le mÃªme phÃ©nomÃ¨ne : on remplit nos boites aux lettres de messages publicitaires non sollicitÃ©s. Messages dont il faut se dÃ©barrasser.
Allons encore plus loin. Un panneau publicitaire, diffusant d’autoritÃ© un message dans notre environnement, n’est pas non plus du SPAM. Ce n’est pas une communication Ã©lectronique et cela ne vous est pas directement adressÃ©. Pourtant nous sommes bien dans la diffusion massive d’un message publicitaire. Elle est massive parce que adressÃ©e Ã toutes les personnes qui passent devant. Finalement, le panneau publicitaire peut de la mÃªme faÃ§on Ãªtre assimilÃ© Ã du SPAM. Mais lÃ on ne peut rien faire, il n’y a pas de bouton suppression. Bien que la dÃ©gradation de notre environnement visuel soit manifeste, cela ne rentre pas dans la catÃ©gorie SPAM. Je vous laisse en dÃ©duire la raison.
En terme informationnel, c’est l’insertion d’informations parasites en grand nombre qui provoques une gÃ¨ne. Tant que cela ne demande pas trop de temps pour Ãªtre traitÃ©e, c’est tolÃ©rÃ©. Le traitement de ces informations parasites veut dire d’analyser chaque information afin de dÃ©terminer sa pertinence et la suite Ã donner, c’est Ã dire la supprimer ou l’ignorer dans le pire des cas.

Revenons au SPAM tel que communÃ©ment acceptÃ©. Face au dÃ©luge de messages Ã trier (Ã supprimer), il est rapidement apparut nÃ©cessaire de traiter le problÃ¨me. Ce traitement peut intervenir Ã plusieurs niveaux et de plusieurs maniÃ¨res. Ã‰videmment, il est prÃ©fÃ©rable de pouvoir fortement automatiser ce processus de traitement.
Il y a aujourd’hui un large panel de mÃ©thodes diffÃ©rentes pour traiter ce problÃ¨me spÃ©cifique, des plus artisanales aux plus industrielles. Les rÃ©sultats ne sont pas toujours Ã la hauteur des investissements en argent ou en temps. Mais comment mesurer l’efficacitÃ© de ces mÃ©thodes ?
On peut mesurer les performances de plusieurs faÃ§ons. La premiÃ¨re idÃ©e est de mesurer le pourcentage de SPAM rÃ©ellement dÃ©tectÃ©s. Oui, mais ce n’est pas suffisant, que fait-on du nombre de messages lÃ©gitimes qui ont Ã©tÃ© supprimÃ©s en mÃªme temps? Une sociÃ©tÃ© commerciale doit pouvoir recevoir des messages de toute provenance et doit Ã©viter un maximum de pertes de messages, sinon ce sont des clients en moins et donc des bÃ©nÃ©fices en moins. Ces sociÃ©tÃ©s vont donc investir dans des solutions trÃ¨s sophistiquÃ©es qui maximisent la dÃ©tection et minimise les dommages collatÃ©raux.

Une des caractÃ©ristiques que l’on retrouve souvent dans les SPAM, c’est que l’adresse de l’expÃ©diteur est fantaisiste bien que de forme correcte. Une des mÃ©thodes de lutte est de renvoyer un message Ã l’expÃ©diteur pour demander une confirmation. Il n’est malheureusement pas infaisable pour un robot de pouvoir rÃ©pondre positivement Ã cette confirmation, mÃªme avec un captcha.

Le particulier Ã potentiellement moins de problÃ¨me qu’une sociÃ©tÃ©. Il peut facilement mettre de cÃ´tÃ© tous les messages dont les expÃ©diteurs ne lui sont pas connus. Il suffit de temps en temps de regarder le dossier des SPAM (les inconnus) si on attend un message d’un nouveau destinataire. Mais mÃªme cette mÃ©thode a ses limites. Certaines sources de SPAM essayent de pirater des boÃ®tes aux lettres d’utilisateurs lÃ©gitimes (vos amis) pour leur faire envoyer Ã leur insu des SPAM. Un certain nombre de virus sont spÃ©cialisÃ©s, une fois qu’un nouvel ordinateur est contaminÃ©, pour aller dÃ©pouiller le carnet d’adresse. Et pour rendre plus difficile la dÃ©tection du poste contaminÃ©, d’envoyer les SPAM en se faisant passÃ© pour un des contacts du carnet d’adresse.
Si la mÃ©thode du filtrage est assez efficace tant en dÃ©tection quand tant que rejet de messages lÃ©gitimes, elle peut au besoin Ãªtre complÃ©tÃ©e par une autre mÃ©thode comme un filtre bayesien par exemple.

Les filtres de type RBL sont un moyen de dÃ©fense dynamique assez performant avec peu de dommages collatÃ©raux. Mais d’un autre cÃ´tÃ©,Â si ils bloquent des plages entiÃ¨res d’adresses IP (plages IP des clients des ISP), ils deviennent catastrophiques par le nombre de messages lÃ©gitimes bloquÃ©s.
Le filtre greylist est quand Ã lui basÃ© sur le bon fonctionnement du serveur Ã©metteur du SPAM. Ã‡a marche encore trÃ¨s bien aujourd’hui avec aucun rejet de message lÃ©gitime, mais cela ne tient qu’Ã la volontÃ© des diffuseurs de SPAM d’amÃ©liorer (un peu) leurs outils.

On voit que la lutte contre le SPAM utilise des outils qui ont tous leurs limites. Ils sont tous par principe faibles parce que le protocole n’a pas Ã©tÃ© prÃ©vu pour lutter contre ce problÃ¨me.
Dans la plupart des SPAM, on a clairement une carence dans l’identification de l’expÃ©diteur.

Le moyen naturel d’y rÃ©pondre est d’Ãªtre capable d’identifier tous les acteurs gÃ©nÃ©rateurs d’information. Cela veut dire que, n’Ã©tant pas capable de pouvoir identifier toutes les sources possibles et lÃ©gitimes dans le monde, on va devoir se fier Ã un systÃ¨me plus global qui se base sur des autoritÃ©s de confiances. Un systÃ¨me sur le principe du DNS mais aussi des certificats x509.
Mais imposer une identification globale remet directement en cause l’anonymat. Et se reposer sur des autoritÃ©s de confiance n’est pas sans consÃ©quences. Les problÃ¨mes rÃ©currents de piratage des autoritÃ©s de certification nous montre que c’est loin d’Ãªtre infaillible.

Que faire? Comment palier le manque d’identification sans remettre en question l’anonymat? Vu comme Ã§a, cela semble impossible.
La rÃ©ponse la plus simple serait de couper toute communication. Mais l’Ãªtre humain a la nÃ©cessitÃ© (absolue) d’accepter des Ã©changes, qu’ils soient de forme Ã©lectronique ou pas d’ailleurs. Et l’Ãªtre humain sait naturellement faire le tri des informations, de juger le risque de sÃ©lectionner une information plutÃ´t qu’une autre. Il sait aussi se tromper et se faire manipuler.
L’humain doit revenir au centre de la dÃ©cision lorsque le temps et la quantitÃ© d’informations ne sont pas saturantes. Il faut afficher l’information qui permet la prise de dÃ©cision. Et si certaines actions sont fortement automatisÃ©es, il faut afficher le rÃ©sultat de ces actions que l’automatisme a jugÃ© nÃ©cessaires.

Comment se positionne nebule vis-Ã -vis de ce problÃ¨me?
Il propose un systÃ¨me capable de gÃ©rer des utilisateurs localement mais qui peuvent Ãªtre reconnus globalement. Ainsi, un utilisateur n’est valide que parce-qu’il est reconnu par ses paires, en gros ses voisins. Mais on est capable d’adresser un utilisateur Ã l’autre bout du monde, ce mÃªme si on ne le connaÃ®t pas. On peut Ã©ventuellement se fier Ã des autoritÃ©s locales de confiance qui dÃ©terminent qui sont de vrais utilisateurs et qui ne le sont pas. On peut aussi dire que l’on accepte ou rejette certains utilisateurs en fonctions de critÃ¨res comme la proximitÃ© sociale ou gÃ©ographique.
Mais le risque, c’est la manipulation de ces rÃ¨gles de sÃ©lections Ã l’avantage du diffuseur de SPAM. Diffuseur qui peut Ãªtre plus facilement bannis aussi.L’autre risque, c’est la compromission du poste de l’utilisateur, et donc l’envoie de SPAM Ã son insu. Mais Ã§a c’est un problÃ¨me d’une toute autre dimension…

Liens :
– http://fr.wikipedia.org/wiki/Spam
– http://fr.wikipedia.org/wiki/Courrier_%C3%A9lectronique
– http://fr.wikipedia.org/wiki/Lutte_anti-spam
– http://fr.wikipedia.org/wiki/CAPTCHA

Localisation de fichiers

Une Ã©tape importante dans l’utilisation de nebule, c’est d’importer des donnÃ©es. Ces donnÃ©es sont typiquement des fichiers existants. Cette opÃ©ration d’importation de fichiers, c’est la nÃ©bulisation de fichiers.

La nÃ©bulisation de fichiers ne prÃ©sente pas Ã priori de difficultÃ©s. On calcule son empreinte et on lui associe tout un tas d’informations telles que son type mime, sa taille, etc…

Il y a cependant une propriÃ©tÃ© des fichiers qui pose un problÃ¨me.
Un fichier est classiquement reconnu par son nom. ce nom est une propriÃ©tÃ© du fichier au mÃªme titre que sa taille par exemple. L’extension de fichier n’est qu’un indicateur, peu fiable, de son type. L’extension de fichier est repris comme suffixe du nom.
Il peut y avoir plusieurs fichiers qui portent le mÃªme nom (et mÃªme suffixe) et qui ont ou non le mÃªme contenu. Ils doivent dans ce cas Ãªtre disposÃ©s dans des emplacements diffÃ©rents. Cet emplacement peut Ãªtre repris comme prÃ©fixe. L’emplacement est la traduction textuelle de l’arborescence de rÃ©pertoires dans lequel se trouve un fichier. Et l’emplacement peut Ãªtre soit relatif (Ã un autre emplacement), soit absolu. Dans tous les cas, il fait implicitement ou explicitement rÃ©fÃ©rence au disque, la distinction entre les deux dÃ©pendant de la notation faite par les diffÃ©rents systÃ¨mes d’exploitations. Nous ne prendrons ici que l’emplacement absolu, seul Ã pouvoir discriminer de faÃ§on certaine deux fichiers au mÃªme nom.
On peut aussi avoir deux fichiers de mÃªme nom/suffixe dans le mÃªme rÃ©pertoire, mais sur deux machines diffÃ©rentes. Dans les diffÃ©rentes notations, il est donc prÃ©fÃ©rable de se restreindre Ã l’utilisation de notations impliquant le nom de machine. Sinon on risque de pouvoir restaurer correctement un fichier en cas de besoin (si c’est le but).

Le problÃ¨me de la notation des noms de fichiers peut se poser aussi dans le cas de deux fichiers identiques au mÃªme emplacement sur deux machines diffÃ©rentes. Si un des fichiers est modifiÃ©, cela va entraÃ®ner la crÃ©ation d’un lien u pour l’objet correspondant. Si rien ne distingue les deux fichiers, cela implique que l’autre fichier non modifiÃ© sera marquÃ© comme lui aussi modifiÃ©…

RÃ©fÃ©rences :
– Nebule blog – Empreinte dâ€™objets et URI
– Nebule blog – Fiches perforÃ©es
– Nebule blog – Fichiers et chemins
– Nebule blog – SystÃ¨me de fichiers
– Nebule wiki – RÃ©flexion – analyse des applications – SystÃ¨me de fichiers

Le maÃ®tre des poupÃ©es et le gardien de l’enfer

1/Le maÃ®tre des poupÃ©es

Le maÃ®tre des poupÃ©es, alias puppetmaster, vient de rÃ©voquer son ancienne incarnation :

63864e42204080051f524d5be0171920e0117a0e83d2131ac506ce3cbff7f1f4

Contrairement Ã ce qui avait Ã©tÃ© annoncÃ©, c’est un lien de type d qui Ã Ã©tÃ© utilisÃ©, et non un lien de type u. Ceci pour un problÃ¨me de sÃ©curitÃ©. Ainsi son ancienne incarnation ne peut pas rÃ©voquer ce type de lien… et ressusciter.
Le dÃ©tail ici : puppetmaster.nebule.org/l/63864e42204080051f524d5be0171920e0117a0e83d2131ac506ce3cbff7f1f4

D’autres anciennes incarnations ont elles aussi Ã©tÃ© rÃ©voquÃ©es, Ã la fois pour la clÃ© publique et la clÃ© privÃ©e :
– 70668497b6a0ad481aa7e0c08131bc0d0be40cd7dde30a7de8613290d7c35543 puppetmaster (priv)
– 9e85d7d25af97760f8611b85c2765912606c7eec8307dc58c7782e34cc373c18 cerberus (pub)
– 905296b7070b8e7d601d9509893683d072bb22083006a9e545ceaf0228787c8c cerberus (priv)
– d756efe28847a3723639aed49a40f08c22a576ff3f002750a18ad6a192717621 kronos (pub)
– 5f951d41db3b18001fbc8baf895d84cb4d460a6143b273b4f5b2d0e9b0d5c67b kronos (priv)

Dans le mÃªme temps, puppetmaster a reconnu plusieurs nouvelles entitÃ©s :
– 01351dd781453092d99377d94990da9bf220c85c43737674a257b525f6566fb4 cerberus cerberus.nebule.org
– abdbaa31e404463ecc644f1eecdeb9b5f94428eb140fa5c66a7687ee96ed47aa kronos kronos.nebule.org
– 975571a8a470a6d975662e284f5ef1bd0396c06b31a2207b81bef2e24c5bf0c5 stÃ©phane stephane.nebule.fr
Voir le dÃ©tail ici : puppetmaster.nebule.org/l/88848d09edc416e443ce1491753c75d75d7d8790c1253becf9a2191ac369f4ea

2/Le gardien de l’enfer

Le gardien de l’enfer, alias cerberus, vient d’Ãªtre rÃ©gÃ©nÃ©rÃ© en tant que :

01351dd781453092d99377d94990da9bf220c85c43737674a257b525f6566fb4
cerberus.nebule.org

Il est reconnu par puppetmaster. cf Cerberus et la mise en quarantaine dâ€™objets.

Pour son rÃ´le spÃ©cifique, il dispose de deux objets spÃ©cifiques :
– nebule/danger
– nebule/warning

Actuellement, les enfers n’ayant pas encore officiellement ouverts, cette entitÃ© est au chÃ´mage.
Seul le temps nous dira pour combien de temps…

Yubikey et la double authentification

Une des bÃªtes noires de la sÃ©curitÃ© des utilisateurs et de leurs informations sur l’Internet est le mot de passe. Ou plutÃ´t devait-on dire la multitude de mots de passes et de comptes utilisateurs qui vont avec.

Chaque service web nÃ©cessite un compte utilisateur pour Ãªtre utilisÃ©, normal. Ce qui est moins normal, c’est que cette identification reste assez strictement localisÃ©e au service en question. A part quelques tentatives qui n’ont remportÃ©e qu’un succÃ¨s d’estime, chaque service gÃ¨re jalousement ses utilisateurs. Il en rÃ©sulte un multitude de comptes utilisateurs diffÃ©rents avec potentiellement autant de mots de passes.
La gestion de l’identitÃ© sur l’Internet est un vrai problÃ¨me. La gestion des mots de passes associÃ©s encore plus. MÃªme si l’on met le mÃªme mots de passe partout, il faut rÃ©guliÃ¨rement le retaper. Et bien sÃ»r, avec un mot de passe unique, on devient vulnÃ©rable au premier service qui ne sÃ©curiserait pas correctement ceux-ci.

Yubico propose une solution basÃ© sur le mot de passe Ã usage unique (OTP – One Time Password). L’ensemble fonctionne sur le principe de ‘ce que je connais‘ et ‘ce que j’ai‘. La double authentification repose donc sur deux moyens combinÃ©s de prouver son identitÃ©. On doit fournir les deux ou prouver que l’on dÃ©tient les deux.

‘Ce que je connais‘, c’est typiquement un nom d’utilisateur et un mot de passe.
‘Ce que j’ai‘, c’est un objet dont je dispose. Cet objet doit Ãªtre capable de prouver sa prÃ©sence de faÃ§on numÃ©rique. C’est ici la YubiKey.
‘Ce que je suis‘, c’est le plus dur Ã obtenir… puisque c’est gÃ©nÃ©ralement ce que l’on cherche.

La clÃ© YubiKey branchÃ©e en USB Ã©mule un clavier et envoie un mot de passe OTP lorsque l’on appuie sur un bouton de la clÃ©. Ce mot de passe unique est dÃ©rivÃ© de l’identifiant de la clÃ©, d’un numÃ©ro de sÃ©quence, d’une empreinte CRC et de divers autres champs. Le tout est converti en caractÃ¨res imprimables et envoyÃ© comme si il Ã©tait tapÃ© sur un clavier.
Ce OTP est transmis au serveur en mÃªme temps que le nom d’utilisateur et Ã©ventuellement un autre mot de passe (double authentification). Le serveur le transmet au YubiCloud pour vÃ©rification et attend une rÃ©ponse positive ou nÃ©gative sur la validitÃ© de l’OTP pour donner l’accÃ¨s au service Ã l’utilisateur… ou pas.
L’OTP change Ã chaque fois et ne peut Ãªtre rejouÃ©. Il peut donc Ãªtre divulguÃ© une fois utilisÃ©.
La YubiKey peut Ãªtre volÃ©e, sans le compte Ã utiliser (ou le deuxiÃ¨me mot de passe) elle est inutilisable.
Si double authentification, le mot de passe peut Ãªtre volÃ© (keylogger), il n’est pas utilisable sans la YubiKey Ã cÃ´tÃ©.

Une des propriÃ©tÃ©s intÃ©ressante de cet implÃ©mentation, c’est que l’on peut voir l’ensemble comme la transmission de messages chiffrÃ©s (symÃ©trique) entre la YubiKey et la YubiHSM. Toutes les clÃ©s connaissent l’unique (ou pas loin) mot de passe secret de chiffrement. On fait confiance au matÃ©riel (les clÃ©s USB) pour savoir garder le secret.

Le systÃ¨me est de loin prÃ©fÃ©rable Ã la simple authentification par mot de passe. Mais il n’en prÃ©sente pas moins des problÃ¨mes :

Une petite polÃ©mique est apparue sur la robustesse rÃ©elle du systÃ¨me. Un CRC16 permet de vÃ©rifier la validÃ© du paquet. Ce CRC est inclus dans les donnÃ©es chiffrÃ©es et couvre donc 128-16=112bits. En jouant des paquets au hasard, il y a 1/(2*2^16) chances que la signature du CRC16 soit cohÃ©rente avec le reste. Si l’on compte qu’il faut statistiquement parcourir la moitiÃ© des valeurs pour en trouver une bonne, cela donne une probabilitÃ© de 1/(2^16). Cependant, dans les donnÃ©es chiffrÃ©es, il y a aussi le champ private identity de 6 bytes=48bits. Ce champs Ã©tant vÃ©rifiÃ© comme nul ou valide par les serveurs, la probabilitÃ© remonte Ã 2*1/(2^(16+48)) soit 1/(2^63). Ce qui sauve les meubles c’est que l’attaque doit passer par le rÃ©seau, la soliditÃ© rÃ©elle de l’ensemble est de 2^63 et non de 2^128…
Il faut la coopÃ©ration active des services qui authentifient les utilisateurs. La mÃ©thode d’authentification doit Ãªtre modifiÃ©e pour supporter la vÃ©rification de l’OTP en liaison avec le YubiCloud, l’infrastructure qui valide rÃ©ellement l’authentification. Pour les personnes qui gÃ¨rent elles-mÃªme leurs blogs ou autres services, c’est un rÃ©el gain. Mais pour un gros acteur de l’Internet c’est plutÃ´t une ingÃ©rence sur un sujet sensible que sont les utilisateurs et tout ce qu’ils rapportent. Cela Ã donc autant de chance d’Ãªtre adoptÃ© que d’autres solutions par le passÃ© comme OpenID, faible.
La solution nÃ©cessite une connectivitÃ© vers l’Internet et le YubiCloud pour valider l’authentification. Impossible donc de travailler hors-ligne. Il y a 5 serveurs dans le monde, c’est dÃ©jÃ pas mal mais c’est aussi encore trop peu pour rÃ©sister Ã un DDOS ciblÃ©. Et en cas d’absence de connexion prolongÃ©e aux serveur, tous les services associÃ©s sont eux-aussi paralysÃ©s. On a un point de dÃ©faut unique.
Comment va se comporter l’ensemble lorsque le compteur anti-rejeu va boucler ? La clÃ© ne marchera plus. La taille du compteur est de 15bits=32768 utilisations (avec branchement de la clÃ©).
Volontairement, la YubiKey ne peut Ãªtre mise Ã jour. La clÃ© est accessible en lecture seule, ce qui empÃªche la diffusion de virus et rÃ©duit la surface d’attaque de celle-ci. Mais que se passera-t-il quand, inÃ©vitablement, une faille sera trouvÃ©e sur cette clÃ© ? Poubelle.

D’autres questions restent en suspend. L’analyse rapide de la documentation sur le site web de Yubico ne permet pas d’y rÃ©pondre.

ClÃ© unique de chiffrement AES entre toutes les clÃ©s YubiHSM ? Ou une clÃ© AES par YubiHSM ? Ce systÃ¨me de clÃ©s secrÃ¨tes interdit notamment toute concurrence avec les mÃªmes clÃ©s. Utiliser la cryptographie asymÃ©trique plutÃ´t que symÃ©trique aurait permit bien plus de choses et relevÃ© la sÃ©curitÃ© Ã plus long terme.
Et si un serveur d’authentification du YubiCloud rÃ©pond toujours OK mÃªme si les OTP sont invalides ? Quelle est la robustesse de l’infrastructure du YubiCloud ? La liaison entre les API cÃ´tÃ© clients et les serveurs API Validation Servers est chiffrÃ©e avec une clÃ© partagÃ©e. Les serveurs KSM avec leurs YubiHSM sont indÃ©pendants des API Validation Servers. Mais si la clÃ© AES semble bien protÃ©gÃ©e dans les YubiHSM, je n’ai pas vu de mÃ©canisme de signature de la rÃ©ponse.
Yubico ne semble pas aimer la cryptographie symÃ©trique, elle n’est employÃ©e nulle part. Dans un contexte entiÃ¨rement centralisÃ© autour de quelques serveurs, la cryptographie symÃ©trique appliquÃ©e Ã tous les Ã©changes reste cependant acceptable. Mais on en revient Ã une critique prÃ©cÃ©dente, cela renforce l’unicitÃ© du point de dÃ©faillance de ces serveurs.

Qu’en penser ?
Toute la sÃ©curitÃ© repose sur la/les clÃ©s AES des YubiHSM, la robustesse de la clÃ© YubiKey et sur l’implÃ©mentation du chiffrement de l’OTP. La solution semble viable Ã court terme. Trop de dÃ©fauts la condamne malheureusement Ã long terme.
Bref, c’est mieux que de se reposer uniquement sur le user/password, mais il faudra l’abandonner sans regrets au premier signe de faiblesse.

Liens :
– http://www.yubico.com/
– http://www.wired.com/wiredenterprise/2013/01/google-password/all/
– http://www.yubico.com/products/yubikey-hardware/
-Â http://static.yubico.com/var/uploads/pdfs/YubiKey_manual-2.0.pdf
– http://www.yubico.com/wp-content/uploads/2012/10/YubiCloud-OTP-Validation-Service-v1.1.pdf
– http://www.schneier.com/blog/archives/2013/01/googles_authent.html
– http://gonzague.me/yubico-yubikey#axzz2IzWaf5Dr
– https://bitcointalk.org/index.php?topic=85648.msg943612#msg943612
– http://openid.net/

Identification/authentification sur l’internet des objets

Un interview de R.Haladjian revient sur l’Internet des objets.

L’internet des objets, c’est en gros la capacitÃ© d’interagir Ã distance avec des objets de notre environnement, et Ã ces objets de communiquer sur le rÃ©seau de faÃ§on autonome.

Une des remarques concerne la connectivitÃ© en IPv6. Ils sont revenus Ã IPv4 parce que « par exemple une prise Ã©lectrique disposait d’un serveur et n’importe qui ayant obtenu l’adresse de cette prise Ã©lectrique pouvait la pinger pour l’allumer et l’Ã©teindre Ã distance. Il fallait donc mettre un pare-feu pour empÃªcher l’accÃ¨s… Donc finalement il est plus intÃ©ressant de rester en IPV4 avec un DHCP qui distribue des adresses« .
Il est Ã©tonnant que l’on revienne Ã une solution dont on sait pertinemment qu’elle ne supportera pas la mise Ã l’Ã©chelle (de l’internet, et donc du monde) des objets connectÃ©s sur le rÃ©seau (internet). On se contente d’une vision de ces objets Ã courte distance, en gros de l’ordre de grandeur de la maison.
Ce recul est je pense une mauvaise rÃ©ponse Ã un problÃ¨me mal posÃ©. Le problÃ¨me concerne l’identification de qui peut dans l’exemple allumer/Ã©teindre la lampe. Si il n’y a pas d’identification, c’est normal que tout le monde puisse le faire, une adresse IP n’est pas Ã considÃ©rer comme un secret mÃªme en IPv6. Mais mettre en place une identification/authentification forte sur les mÃ©thodes actuelles est fastidieux pour un grand nombre d’objets. Le problÃ¨me est d’ailleurs dÃ©jÃ un problÃ¨me commun sur les ordinateurs rÃ©sidentiels. Donc parce que l’on ne sait pas mettre en place une identification correcte, on bride l’ensemble du systÃ¨me.
Je n’ai pas regardÃ© comment est faite l’identification/authentification sur leurs objets. Mais cette remarque m’incite Ã penser qu’elle n’est pas innovante, et donc pas Ã la hauteur. Et, en regardant du cÃ´tÃ© de nebule, le problÃ¨me semble du coup beaucoup plus facile Ã rÃ©soudre…

Il y a un autre aspect de l’internet des objets, c’est la gestion des objets physiques inertes d’un point de vue numÃ©rique. Ils sont reconnus par un identifiant unique, mais ils n’interagissent pas. C’est l’exemple du code barre sur les articles Ã vendre d’un magasin, ou la puce RFID qui les remplacera, ou la plaque d’immatriculation d’une voiture. La vision primaire de l’internet des objets avec des Ã©tiquettes collÃ©es partout me semble ubuesque : le monde deviendrait une poubelle recouverte d’Ã©tiquettes en tout genre que plus personne ne regarderait…
Pour nebule, ces identifiants numÃ©riques, quel qu’en soit leur forme ou norme, sont encodÃ©s dans des objets avant de pouvoir Ãªtre liÃ©s et donc gÃ©rÃ©s. On peut mÃªme penser qu’ils seront attachÃ© virtuellement Ã des positions gÃ©ographiques.

Liens :
– http://mobile.clubic.com/technologies-d-avenir/actualite-528965-leweb-12-haladjian-pere-nabaztag-internet-objets.html
– http://fr.wikipedia.org/wiki/Internet_des_objets
– http://fr.wikipedia.org/wiki/Web_3.0

L’internet des objets et les objets de l’internet

Les objets physiques qui peuplent notre environnement habituel ont une caractÃ©ristique particuliÃ¨re, ils sont uniques. On peut certes faire une copie, voire reproduire un objet en plusieurs millions d’exemplaires, chaque objet restera unique avec sa matiÃ¨re propre et ses dÃ©fauts propres. Chaque objet peut Ãªtre ainsi assemblÃ©, remodelÃ© ou refondu dans un autre objet, cela n’a aucun impact sur ses congÃ©nÃ¨res.

Et les objets du monde numÃ©rique?
Ceux-ci ont l’Ã©quivalent d’une forme propre comme un objet physique. On peut distinguer un objet numÃ©rique d’un autre par cette forme que l’on appellera plutÃ´t empreinte, mais aussi par sa localisation. La localisation est souvent reprÃ©sentÃ© par un identifiant dans une arborescence ou sur un rÃ©seau, c’est un classement humanisÃ© et peu fiable. Ainsi cette dualitÃ© de l’objet dans l’espace numÃ©rique a une consÃ©quence importante immÃ©diate, le mÃªme objet exactement peut exister simultanÃ©ment en plusieurs endroits. Il faut donc considÃ©rer que chaque emplacement de l’objet reÃ§oit une copie exacte de l’objet, c’est Ã dire sans altÃ©ration, sinon cela devient un autre objet.

Continuer la lecture de L’internet des objets et les objets de l’internet

nous = toi + moi

Ce matin, en me connectant Ã Facebook sur l’ordinateur commun Ã nous, je me suis fait la rÃ©flexion que certaines choses Ã©taient faites bizarrement. Je suis sur ma session Linux Ã moi mais dans Firefox, c’est toi Diana qui est connectÃ©e Ã FB…
L’ordinateur est multi-session, mais on ne voit simultanÃ©ment qu’une seule session, soit moi soit toi. Si tu veux ouvrir ton Firefox avec ta connexion FB, tu dois ouvrir une autre session de l’ordinateur. Le problÃ¨me est que l’on ne peut pas ouvrir facilement deux navigateur pour deux utilisateurs diffÃ©rents dans la mÃªme session, une session Ã nous.

Continuer la lecture de nous = toi + moi

Localisation web

Chaque entitÃ© dispose par nature d’un identifiant unique, invariant et non cessible. C’est une clÃ© cryptographique publique.

Cependant cet identifiant ne prÃ©cise pas la place de l’entitÃ©, ou plutÃ´t la place oÃ¹ on peut la joindre.
Les entitÃ©s, pour pouvoir Ã©changer, doivent avoir une place publique, c’est la localisation.

Cette place est-elle unique d’ailleurs?
En fait non, l’entitÃ© peut Ãªtre prÃ©sente en de multiples places, soit par le biais de relais, soit parce que la clÃ© privÃ© aura Ã©tÃ© volÃ© et exploitÃ©.

Ce qui diffÃ©rencie fortement l’entitÃ© d’une ressource web classique, c’est que l’entitÃ© est unique quelque soit sa localisation, et n’existe pas uniquement du fait de lâ€™existence du serveur web qui l’hÃ©berge. Cette entitÃ© survira Ã la disparition d’un serveur web, sa rÃ©silience est grandement amÃ©liorÃ© et ne dÃ©pend que faiblement de sont environnement.

Continuer la lecture de Localisation web

Empreinte d’objets et URI

L’Uniform Resource Identifier (URI) est une chaÃ®ne de caractÃ¨res permettant l’identification d’un objet de faÃ§on univoque et permanente.

(Wikipedia – Licence CC BY-SA v3.0)

Continuer la lecture de Empreinte d’objets et URI

Fichiers et chemins

Sous nebule, les objets sont rÃ©fÃ©rencÃ©s par leur empreinte. Ã‡a ressemble quelque part au rÃ©fÃ©rencement des fichiers par des inodes sur les systÃ¨mes de fichiers UNIX. Continuer la lecture de Fichiers et chemins

Annuaires

La faÃ§on dont les objets sont liÃ©s entre eux est importante. Mais il y a aussi la faÃ§on dont les entitÃ©s sont liÃ©es entre elles. Les liens entre ses entitÃ©s suivent-ils la forme des liens entre objets? A priori oui, puisque une entitÃ© est avant tout un objet aussi.

Un autre problÃ¨me qui lui est spÃ©cifique aux entitÃ©s, c’est la localisation. C’est Ã dire la faÃ§on de retrouver une entitÃ© dans un vaste rÃ©seau. C’est le rÃ´le de ce que l’on appelle un annuaire. Cela doit Ãªtre vu comme un systÃ¨me similaire au DNS dans sa fonction.

Suite Ã un article fort intÃ©ressant sur un blog, je me rends compte que le problÃ¨me est plus difficile qu’il n’en a l’air.

Pour rÃ©sumer et pour reprendre l’article de Wikipedia sur le triangle de Zooko, un systÃ¨me de nommage ou un systÃ¨me d’annuaire doit :
1: Secure, doit Ãªtre sÃ©curisÃ©.
2: Memorable, doit Ãªtre facilement mÃ©morisable par un Ãªtre humain.
3: Global, doit garantir l’unicitÃ©.

Jusque lÃ , rien de nouveau sous le soleil, sauf que l’article prÃ©cise aussi que l’on ne peut satisfaire qu’Ã deux des trois conditions simultanÃ©ment au maximum.

On peut ajouter aussi, en autre (cf premier lien), l’aspect stabilitÃ© dans le temps. Je pense que, l’entitÃ© pouvant Ãªtre mobile, seule la stabilitÃ© dans le temps de l’unicitÃ© de l’entitÃ© est Ã assurer. Or, c’est dÃ©jÃ le rÃ´le de l’identifiant unique (clÃ© privÃ©) de l’objet entitÃ©.

Je serais bien tentÃ© de penser que pour Nebule, l’aspect globale est le moins « nÃ©cessaire ». Quoique l’aspect user friendly peut Ãªtre dÃ©volu Ã une autre fonction, dans ce cas l’annuaire s’assure juste de faire le lien entre entitÃ© et ressources physiques (rÃ©seau). A voir…

Continuer la lecture de Annuaires

Je ne suis pas trÃ¨s familiarisÃ© avec les problÃ¨mes lÃ©gaux liÃ©s au vote Ã©lectronique, donc sans le petit bout de papier. Mais il semble que les polÃ©miques actuelles sur les Ã©quipements testÃ©s tiennent surtout Ã la faÃ§on dont ceux-ci sont conÃ§us.
Et surtout, les critiques tournent autour de l’utilisation de logiciels fermÃ©s, donc dont le fonctionnement ne peut Ãªtre vÃ©rifiÃ© par tout citoyen. Comment peut-on Ãªtre sÃ»r que la machine de plante pas, comptabilise bien les votes, et surtout les comptabilise bien Ã la bonne personne? Voir, comment vÃ©rifier que personne n’a faussÃ© le score (nÃ©cessite un re-dÃ©comptage)?

Je bouquine un livre en ce moment :
« Gestion des identitÃ©s » de OCTO Technology, ISBN:978-2-9525895-1-2, avril 2007, www.octo.com

Au cours du dÃ©veloppement de l’Identifiant Unique Personnel (IUP), il est notÃ© que trois contraintes doivent absolument Ãªtre respectÃ©es.
L’IUP doit Ãªtre :

stable (dans le temps).

On commence Ã voir des sites communautaires bien fait qui vous identifient (diffÃ©rente de l’authentification) sur quelque chose que vous possÃ©dez, par exemple une adresse email. Le nom et toute autre caractÃ©ristique est Ã votre (presque) libre discrÃ©tion. Continuer la lecture de Premier arrivÃ© premier servi

Catégorie : identification