Download your copy of “Accelerating Digitization to Meet the Demands of Hybrid Work” and take the next step toward a stronger, more future-ready workplace.
Disposer d’un grand nombre de données, sous quelque forme que ce soit – documents papier traditionnels, microfilms, fiches ou format électronique – est sans doute une bonne idée… Sinon, à quoi bon les avoir? Après tout, nous vivons dans une société de l’information où presque tout ce que nous faisons dépend, d’une manière ou d’une autre, de la capacité de quelqu’un à accéder à de grandes quantités de données très rapidement et avec exactitude.
Mais l’utilité de ces données dépend de votre capacité à les trouver au moment voulu. Vous avez donc besoin d’une méthode d’organisation pour pouvoir les trouver facilement. Plus l’ensemble de données est grand, plus c’est vrai. Vous pouvez feuilleter une pile de quelques dizaines de feuilles de papier pour trouver ce dont vous avez besoin sans trop de difficulté. Si vous en avez cent, c’est beaucoup plus dur. Quelques milliers, et c’est une tâche très difficile, chronophage et sujette aux erreurs. Un million, aucune chance. En réalité, un système de dossiers commercial, même petit, ressemble à ces millions de pages, qu’il soit électronique, papier, ou un mélange de types de dossiers.
Les répercussions sont simples, mais profondes : vous avez besoin d’une méthode d’organisation, sinon vous ne trouverez jamais rien. La plupart de vos informations seront effectivement perdues pour vous. Si vous avez une méthode d’organisation, l’utilité de vos informations dépend directement de la qualité de votre méthode. Les index, l’indexation des métadonnées et les structures de données sont essentiels pour établir un ordre dans votre ensemble de données.
Si vous avez déjà conduit une voiture dans une très grande et très vieille ville – Londres, par exemple –, vous savez que c’est très difficile, c’est le moins que l’on puisse dire. Les rues ne sont pas organisées selon un schéma particulier, elles ne sont qu’un amalgame qui s’est accumulé au fil des ans. Cependant, il est toujours possible de naviguer dans les rues, car elles possèdent une balise de métadonnées, leur nom. Ainsi, ceux d’entre nous qui n’ont pas mémorisé toute la carte (comme les chauffeurs de taxi londoniens) peuvent y naviguer à l’aide d’une carte ou d’indications détaillées.

L’absence de noms de rues rendrait la navigation impossible. Cependant, ces métadonnées (les noms de rues) ne sont en aucun cas organisées, ce qui limite leur valeur. C’est pourquoi les chauffeurs de taxi mémorisent tout.
Comparez cela à Denver, au Colorado. La ville entière est organisée selon une grille numérotée. Ce simple fait organisationnel simplifie la navigation. Il y a un coin de rue qui est le point zéro : zéro est-ouest, zéro nord-sud. En plus d’un nom, chaque rue a un numéro, 100, 200, etc.

Ainsi, si je vous dis que l’avenue Pennsylvania est au 500 Est, vous comprendrez facilement où elle se trouve. Si je vous dis d’aller au 4 340 South Pennsylvania, vous savez que c’est 5 blocs à l’est et 43 blocs au sud. La ville a également nommé les blocs de rues sous forme d’avenues numérotées consécutivement d’après des arbres, des personnages historiques, etc. Une fois que l’on connaît le système et les conventions de dénomination, il est très facile de se déplacer dans Denver. En effet, la ville entière dispose d’une méthode d’organisation cohérente des métadonnées, et les objets qu’elle contient sont disposés de manière systématique et ordonnée.
Les techniques organisationnelles pour gérer les ensembles de données ne sont pas très éloignées de ce type de comparaison. Sans information sur le contenu de l’ensemble de données, vous devez fouiller au hasard, comme si vous conduisiez dans Londres sans carte ni panneaux de signalisation. Les métadonnées sont nécessaires, et plus l’indexation de vos métadonnées est cohérente et ordonnée, plus elle devient efficace pour vous.
Il existe toute une série de systèmes de classement pour les documents physiques couramment utilisés, numériques, alphanumériques, chiffres terminaux et ainsi de suite, mais ils permettent tous d’atteindre les mêmes grands objectifs :
Les systèmes à usage spécial, comme les systèmes de chiffres terminaux, peuvent ne pas sembler logiques pour les non-initiés, mais cette méthode d’organisation permet d’atteindre les objectifs susmentionnés. Si vous avez déjà eu affaire à un système de classement physique dont l’étiquetage et le classement sont imprécis, vous comprenez l’importance de cette méthode d’organisation et de son application cohérente.

Download your copy of “Accelerating Digitization to Meet the Demands of Hybrid Work” and take the next step toward a stronger, more future-ready workplace.
La même logique s’applique également aux systèmes électroniques. Le dossier de votre ordinateur est simplement la version numérique d’un système de classement sur papier. Vous pouvez penser qu’une structure de données systématique n’est pas nécessaire et préconiser l’utilisation d’étiquettes de métadonnées libres comme seul outil. Cependant, cette perspective s’estompe rapidement, car le fait de se baser uniquement sur des métadonnées de forme libre devient insuffisant à mesure que les objets de données de la collection augmentent. Pour illustrer ce propos, prenons l’exemple d’un système d’archivage papier comportant un millier de classeurs. Si vous les remplissez au hasard avec des dossiers non étiquetés, vous obtiendrez un système chaotique et inutile.
En étiquetant les dossiers de manière aléatoire, c’est un peu mieux… mais pas beaucoup. Vous aurez toujours du mal à trouver un dossier particulier. Ce n’est qu’en étiquetant et en classant systématiquement les dossiers que la méthode d’organisation commence vraiment à fonctionner. Dans les systèmes électroniques, les objets de données ne sont pas nécessairement contigus physiquement, mais le système de métadonnées les relie logiquement.
Vous entendrez peut-être quelqu’un dire « Nous n’utilisons pas d’index, nous avons un schéma de métadonnées ». Les métadonnées sont-elles différentes d’un index?
Le schéma de métadonnées définit les attributs et les caractéristiques des données, tandis que l’index fournit un moyen rationalisé d’accéder rapidement à ces données. Un système de données robuste utilise souvent à la fois un schéma de métadonnées bien structuré pour des informations détaillées et un index pour une récupération rapide et efficace. Prenons l’exemple d’un index simple :
Chaque objet de données de ce système sera associé à au moins deux balises de métadonnées, par exemple « ressources humaines » et « dossiers du personnel ». La première place l’objet dans un groupe particulier d’objets de données, et la seconde le place dans un sous-groupe plus petit. Chaque dossier du personnel comporterait alors au moins une balise de métadonnées supplémentaire sous la forme d’un nom ou d’un numéro d’identification de l’employé pour permettre l’identification d’un dossier particulier. Avec à la fois un index et un schéma de métadonnées, les documents peuvent être trouvés rapidement et facilement.
La beauté d’un système électronique bien conçu est que cette hiérarchie logique peut être associée à toutes sortes de métadonnées supplémentaires : date et heure, mots-clés, auteur, la liste est pratiquement infinie. Ensuite, ces champs de métadonnées peuvent être associés, triés, filtrés et affichés de multiples façons qui ne sont pas possibles avec un système de classement physique, vous permettant d’effectuer des recherches puissantes.
Pour utiliser ce pouvoir, votre système doit être systématique, ordonné et appliqué de manière cohérente. Si vous ne qualifiez pas systématiquement les documents de factures ou si vous n’y apposez pas systématiquement le nom de Joe, le système ne fonctionnera pas efficacement.
Quelle est donc la meilleure façon de présenter un index? Eh bien, il n’y en a pas. Envisagez l’index simple ci-dessous pour les formulaires fiscaux des entreprises. Quelle est la meilleure structure : par numéro de formulaire ou par année?
Structuré par numéro de formulaire
|
Structuré par année
|
La supériorité d’une méthode d’organisation dépend de la nature des recherches effectuées au sein du système. Votre objectif en construisant l’index est de fournir le chemin de recherche le plus court possible aux personnes effectuant une recherche dans le système. Vous ne pouvez pas optimiser l’index pour chaque type de recherche, donc vous l’optimisez pour les plus courants.
Si vous recherchez principalement tous les formulaires fiscaux d’une seule année, le second schéma est plus logique. Si vous traitez essentiellement un seul type de formulaire sur plusieurs années, le premier choix est plus logique. Par conséquent, une méthode d’organisation optimisée pour le travail comptable quotidien est susceptible d’être très différente d’une méthode optimisée pour répondre à des audits ou à des poursuites judiciaires.
Lors de la création d’un index et d’autres balises de métadonnées, vous devez d’abord vous faire une idée de qui effectue les recherches, de comment ils travaillent et de comment ils recherchent les choses. Il en va de même pour les termes de l’index eux-mêmes : ils doivent être significatifs pour vos utilisateurs, sinon ils chercheront au hasard. Il convient également de noter que, dans un bon système électronique, vous pouvez réorganiser votre index et l’afficher d’autres manières, par exemple en le réorganisant, en le combinant avec d’autres champs de métadonnées ou en le simplifiant. Ainsi, dans notre exemple de comptabilité, vous pouvez disposer des deux présentations selon vos besoins.
La réflexion et le soin apportés à l’élaboration des termes et de la structure de vos métadonnées, ainsi qu’un degré élevé de cohérence dans leur application, sont des clés essentielles de réussite. Le défi réside toujours dans la construction du capital intellectuel – index, structure de données, ensemble de métadonnées – qui pilotera le système. Construisez-le bien, et il sera efficace dans n’importe quel environnement, car il contiendra les informations et les relations clés qui permettent une recherche efficace.
Share