Sur les conseils d'un des auteurs, j'ai acheté un ouvrage publié par Cnrs Editions, et je n'ai pas été déçu. C'est un livre pour un public averti et pour les chercheurs en général, tant il ouvre l'esprit simplement sur des domaines divers de l'application des Big Data. L'ouvrage de mars 2017 a 350 pages avec le titre "Les Big Data à découvert", et le communiqué de presse du Cnrs le présente. Il contient 148 courts chapitres (2 pages face/face par chapitre) répartis en 10 parties : 1) Big data : enjeux et défis ; 2) Données, acquisition, stockage ; 3) traitement des données ; 4) Analyse de données et apprentissage ; 5) Web, réseaux sociaux et recherche d'information ; 6) De l'infiniment petit à l'infiniment grand ; 7) Santé humaine ; 8) Individu et société ; 9) Conclusions et perspectives ; 10) Compléments. Le glossaire est bienvenu.
Le format de chapitres courts avec illustrations et 3 à 5 références pour compléter le sujet rend la lecture facile. Il y a toutes les disciplines scientifiques, et la santé est une petite partie. J'ai lu avec plaisir des thèmes éloignés de ma pratique, par exemple les données dans l'art, l'archéologie, la gouvernance urbaine, etc…. Je reprends quelques citations de cet ouvrage :
- Le volume, la variété et la vitesse ne sont que quelques-uns des volets du défi des données. D'autres "V" mériteraient d'être abordés : véracité…, visibilité…, valeur…, vie privée… (page 25) ;
- En effet, même si on parle aujourd'hui d'exaoctets (1018 octets), la durée de vie des moyens de stockage fait pâle figure au regard de la pierre de Rosette ou des papyrus de la mer Morte (page 77) ;
- La question énergétique liée au développement des Big Data devient de plus en plus sensible : elle constitue un défi majeur de la société de l'information (page 82) ;
- Nous laissons des traces de notre activité humaine, et les types d'information sont : démographie, traits psychologiques, profil sexuel, opinions politiques, croyances religieuses, éléments de santé, localisation, profil consommateur (page 91) ;
- Vous apprendrez les termes hypertexte, hypermédia, ancres, liens, etc.. (page 171) ;
- Il n'existe cependant pas de fatalité à tous ces formats possibles de Big Data, il conviendrait "seulement" de reprendre la main sur la technologie (page 279) ;
- Obtenir du sens à partir des données ne dépend par que de leur taille (page 317) ;
- Comme vous, je produit des "Miettes de données", définies comme : "Sous-produit numérique de nos activité quotidiennes".
Tout n'est pas nouveau car depuis longtemps, des supermarchés ont développé de nombreux scores, par exemple le 'score de prévisibilité de grossesse', basé sur des changements de comportement des consommateurs (cartes de fidélité)… Si votre fille reçoit une pub pour des couches culottes ou des vêtements d'enfants, avant de croire que le supermarché s'est trompé, questionnez votre fille… Le supermarché a détecté la grossesse avant vous, en suivant les changements de comportements des clients….