UPTIME 708

J’interviens sur un serveur Linux cet après midi. Je regarde les logs pour voir ce qui c’est passé. Les logs ne sont gardés que 7 jours par défaut, pas grand chose quoi. Et puis je jète un Å“il à l’uptime (délai écoulé depuis le dernier démarrage).

Et la valeur retournée : 708 jours et des brouettes.

Gasp, ça fait toujours plaisir de voir un serveur tourner dans son coin tranquillement sans rien réclamer à personne. Presque 2 ans!

Autant le constater tout de suite, pas de mise à jours du noyau depuis 2 ans, donc. Et sûrement du reste non plus, aussi…

L’autre chose qui m’interpelle, c’est que l’on a plus aucun historique des incidents au delà de 7 jours, donc que l’on ne sais plus quels problèmes a pu avoir ce serveur depuis qu’il tourne. Et donc que peut-être l’incident du jour avait déjà eu lieu par le passé. Et qu’il y avait peut-être aussi eu des signes précurseurs.

Certe, on ne garde que très rarement un historique sur 2 ans, même pour des raisons légales. Et puis cela peu rapidement prendre énormément de place sur disque en fonction du type de service. Autant de place qui n’est du coup plus disponible pour les services utiles aux utilisateurs alors qu’une très grande partie de cet historique n’est d’aucune utilité.

Là où cela rejoint Nebule, c’est sur la capacité d’effacement et surtout la méthode. On ne peut pas se permettre de garder tous les objets, il faut régulièrement en « oublier ». Mais on ne peut se permettre non plus de tout supprimer passé un certain « temps de vie » de ces objets. Il faut trouver une méthode plus sélective. Un peu comme le cerveau humain, il faut trier par ordre d’importance.

Pour assurer ce tri sélectif, on peut se baser sur le nombre de liens de ou vers un objet, avec un seuil dans le temps progressivement plus large pour la suppression. En espérant qu’il y ai une majorité d’objets peu liés. On peut aussi utiliser la notion d’affection ou d’importance assigné par l’entité. Sur un système, c’est la gravité de l’événement qui lui donne du poids pour perdurer dans le temps. Sur des données utilisateur, c’est celui-ci qui va donner un poids aux objets, ou à défaut les objets vont hériter d’un poids à partir de la moyenne des objets qui lui sont liés.

A approfondir…

Laisser un commentaire