Les Dark Data : opportunités et risques

David CHASSAN
Directeur Marketing et Stratégie, Outscale

À certains égards, le Cloud est une lame à double tranchant. La facilité avec laquelle les serveurs peuvent être mis en route permet aux entreprises d’aligner leur infrastructure sur leurs besoins opérationnels en temps quasi réel. Par contre, sans une bonne gestion, les ressources déployées ne pourront pas être utilisées à leur plein potentiel.

Il est vrai que les serveurs Cloud inutilisés posent problème. Cependant, il ne faut pas oublier que le Cloud est à la fois un outil de stockage de données et de traitement informatique, d’où la montée en puissance des Dark Data.

L’expression Dark Data fait encore l’objet de discussions chez les analystes. Sa signification n’a donc pas encore été stabilisée. Les Dark Data ont été définies par certains comme des données potentiellement utiles qui pourraient être obtenues à partir de processus métier, mais ne sont actuellement pas mises à profit. C’est en revanche une définition relative qui nous intéresse ici : des données qui ont été obtenues et se trouvent dans le stockage Cloud, générant des frais alors que les entreprises ne s’en servent pas.

Les raisons pour lesquelles des Dark Data sont générées sont très diverses : les données ont été collectées pour un certain objectif qui n’a jamais été accompli, pour des exigences de conformité, par des politiques de conservation et de suppression de données inefficaces, pour des projets oubliés, et ainsi de suite. Si les entreprises souhaitent optimiser la rentabilité de leur infrastructure Cloud, elles doivent mettre en œuvre des politiques pour gérer les données avant qu’elles ne se transforment en Dark Data. Elles doivent également les gérer une fois transformées en Dark Data.

Pensez à vos données stockées

Les entreprises ne savent souvent pas quoi faire avec les données qu’elles ont recueillies et, bien souvent, elles ne savent pas non plus ce qu’elles contiennent. Elles rechignent pourtant à s’en défaire, invoquant de futurs avantages possibles. Ce n’est pas nécessairement une stratégie perdante. Ces données pourraient s’avérer utiles dans le futur, mais il y a des limites à la quantité de données que l’on peut raisonnablement stocker.

Si les données peuvent être exploitées, alors elles devraient l’être. Sinon, il est temps d’envisager leur archivage ou leur suppression. La décision pourrait être de conserver les données en raison d’une valeur future attendue, ce qui est parfait. L’important est d’avoir en place des processus pour prendre des décisions au sujet des données.

Une quantité toujours croissante de Dark Data, même avec le faible coût de stockage du Cloud, peut imposer une dépense inutile et présenter un risque pour la sécurité.

Traiter et filtrer

La valeur des données réside dans leur capacité à influer sur la prise de décision et sur d’autres processus. Une fois les données regroupées et analysées, il n’est souvent pas nécessaire d’en stocker la totalité, qui n’est composée pour la plus grande part que d’informations sans intérêt.

Archiver

Les Dark Data qui n’ont pas besoin d’être immédiatement disponibles pour traitement, mais ne peuvent pas être supprimées, doivent être déplacées vers des archives à long terme, sur bande ou sur disque. La conservation de supports de stockage actifs et connectés aux serveurs Cloud génère des dépenses. Bien sûr, la gestion d’archives peut elle-même être un processus complexe, mais les coûts impliqués sont inférieurs à ceux des supports de stockage requis, que l’on pourrait dédier à d’autres applications plus utiles. Les données archivées ne seront pas immédiatement disponibles, mais ce n’est pas un problème puisqu’elles ne sont de toute façon pas utilisées.

Ne pas les ignorer

Les Dark Data n’ont pas reçu ce nom par hasard. Pour tous les avantages potentiels, il existe un côté obscur qui va bien au-delà des coûts de stockage. Si les entreprises ne connaissent pas le contenu de leurs lacs de données, elles risquent des problèmes de réglementation et de conformité, et l’exposition de leurs données client et des données sensibles de l’informatique décisionnelle. Les entreprises devraient atténuer ce risque en mettant en lumière leurs Dark Data.

Haut