Styles

mercredi 6 août 2008

Le contenu n'est pas une donnée

Il n'est pas toujours facile d'expliquer la différence entre du contenu et des données. Surtout à un développeur. Non, du contenu n'est pas simplement des données à stocker dans une base de données. Il faut prendre de la distance avec l'outil informatique. C'est ce qu'a très bien expliqué Seth Gottlieb dans son article "Content is not Data" :
1. Le contenu a une voix : le contenu essaie de communiquer quelque chose (exprimer une idée, convaincre quelqu'un). Cette communication demande un processus créatif et en entreprise, des approbations sont peut-être nécessaires avant sa diffusion.

2. Le contenu a un propriétaire : Les données n'ont généralement pas de copyright mais le contenu si.

3. Le contenu est destiné à un auditoire humain : les auteurs de contenu ont un souci constant d'un bonne présentation de leur contenu.

4. Le contenu a un contexte : En plus de savoir qui écrit le contenu, savoir où le contenu est présenté est aussi important.
Toutes ces caractéristiques du contenu implique des fonctionnalités que doivent proposer les CMS (Content Management Systems) notamment les plate-formes WCM :
1. Gestion des versions : le but est de suivre l'évolution d'un contenu. Selon le type de contenu, il peut y avoir de nombreux changements sur un même contenu. Il est important de pouvoir revoir des anciennes versions, comparer des versions, annoter des versions...

2. Gestion de la publication : la maîtrise de la diffusion et de la présentation du contenu implique des fonctionnalités importantes à offrir à l'auteur (éditeur WYSIWYG, prévisualisation, ...)

3. Feedback : il est important qu'un auteur ai un retour sur son contenu (commentaires, votes, statistiques, systèmes d'analyse d'influence...)

4. Métadonnées : stockage et exploitation des caractéristiques du document comme la source, le propriétaire, ...

5. Utilisabilité du système : pour faciliter la création et l'exploitation de contenu, car il est coûteux et difficile de produire du contenu de qualité.
Le terme de gestion de contenu chevauche la notion de gestion électronique de document (GED), qui elle, vise à stocker/indexer des documents électroniques (pdf, word...) ou des images de document papier.

On parle souvent de GED dans le cas de la numérisation d'un stock de documents papier existant. Dans ce dernier cas, on tombe souvent dans des problèmes de numérisation de vieux documents agrafés, recto-verso, A3, couleur, etc.

Des sociétés spécialisées, comme Jouve ou Xerox Global Services, s'occupent de ce genre de travail. On mesure le nombre de documents à traiter au mètre cube (m3). Il est assez difficile de s'engager sur une charge et des délais quand on ne connaît que le nombre de m3 à numériser, il faut alors donner une fourchette haute à l'estimation.

Aucun commentaire: