La revue PLOS Computational Biology a une série d'articles sur les 10 règles simples, et j'ai souvent évoqué ces articles. Fin mars 2017, un nouvel article intitulé "Ten simple rules for responsible big data research". En fait cet article est le résultat de 2 ans de concertations pour le Council of Big Data supporté par la National Science Foundation aux USA. L'objectif est d'encourager des pratiques éthiques dans l'utilisation et l'analyse des big data. Il y a trop de dangers non connus dans ce domaine, et je cite deux phrases de l'introduction de l'article. Sur le site du Council of big data, il y a des ressources utiles.
We exhort researchers to recognize the human participants and complex systems contained within their data and make grappling with ethical questions part of their standard workflow. Towards this end, we structure the first five rules around how to reduce the chance of harm resulting from big data research practices; the second five rules focus on ways researchers can contribute to building best practices that fit their disciplinary and methodological approaches.
Allez découvrir les 10 règles simples que j'ai essayé de traduire :
- Reconnaissez que les données sont des personnes et peuvent faire du mal
- Reconnaître que la vie privée est plus qu'une valeur binaire
- Prendre des précautions contre la réidentification de vos données
- Pratiquer le partage éthique des données
- Considérez les points forts et les limites de vos données; "Grand" ne signifie pas automatiquement mieux
- Débattez les choix éthiques difficiles
- Élaborer un code de conduite pour votre organisation, votre communauté de recherche ou votre industrie
- Concevez vos données et vos systèmes pour qu'ils puissent être audités
- S'engager dans les conséquences plus larges des pratiques de données et d'analyse
- Savoir quand rompre ces règles
La conclusion : "In short, responsible big data research is not about preventing research but making sure that the work is sound, accurate, and maximizes the good while minimizing harm. The problems and choices researchers face are real, complex, and challenging and so too must be our response. We must treat big data research with the respect that it deserves and recognize that unethical research undermines the production of knowledge. Fantastic opportunities to better understand society and our world exist, but with these opportunities also come the responsibility to consider the ethics of our choices in the everyday practices and actions of our research."
Dans ce numéro de mars, il y a deux autres articles de la série : "Ten simple rules for short and swift presentations" et "Ten simple rules for forming a scientific professional society".
Un commentaire
Bonjour,
Il y a bien évidement des aspects éthiques à prendre en considération dans les projets utilisant des données massives (Big Data). En 2008, la revue Nature a publié le premier numéro spécial Big Data qui aborde ces questions [1].
Cependant, certains messages trop alarmistes risquent de bloquer la recherche et la valorisation de grandes quantités de données. En science de la vie, par exemple, les méthodes des Big Data ne portent pas souvent sur les données brutes, mais plutôt sur des résultats où ce n’est pas possible de ré identifier les personnes.
Pour moi, le plus grand problème qui existe aujourd’hui en France, que la CNIL devrait rapidement résoudre, est qu’un jeux de données anonyme produit en France et soumis à une base de données américaine (NCBI) peut être facilement exploité par une startup de Big Data si elle se trouve aux USA ou dans une autre région du monde mais pas en France !
Cela ne facilite pas la tâche des sociétés technologiques françaises face aux GAFAMA (Google, Apple, Facebook, Amazon, Microsoft et Ali Baba).
La raison n’est pas liée à l’utilisation des données à caractère personnel ou le risque de ré identifier les participants à une étude. C’est plutôt à cause de l’hypothèse qui a été utilisée pour collecter les données.
J’explique :
En 2008, j’ai publié une étude transcriptomique dont les données ont été générées à l’INSERM. Pour publier l’article, l’éditeur a exigé de soumettre les données brutes et traitées à une base de données publique en respectant le standard MIAME (nous n’avons pas une base de données en France, donc il faut choisir entre NCBI GEO et EBI Array Express). Cette exigence est plutôt une bonne chose et elle suit un appel qui a été publié en 2001 dans la revue Nature Genetics [2] par des chercheurs experts dans le domaine des données « omiques » et des bases de données biologiques.
Aujourd’hui, ce jeux de données est exploitable facilement par les startup de Big Data américaines, mais si je dois réutiliser mes données dans une startup française, je dois passer par la CNIL !
Cette dernière m’explique qu’une autorisation est nécessaire parce que le jeux données a été initialement collecté pour un autre objectif de recherche!
Lorsque on parle des Big Data, la collecte des données des réseaux sociaux est un sujet très important. Des équipes de recherche recrutent désormais des patients sur les réseaux sociaux et on peut même utiliser Twitter pour l’identification des effets indésirables liés à l’usage des médicaments (pharmacovigilance en temps réel utilisant les données des réseaux sociaux) [3]. Pour moi, c’est là où il y a un retard et un vide réglementaire en France.
L’Office britannique pour l’intégrité (UK RIO) a publié, en décembre dernier, un guide sur ce qu’on appelle l’ « internet-mediated research » [4]. En France, L’AFNOR fait un très bon travail sur les Big Data, en priorité les aspects de normalisation, mais les aspects éthiques sont également traités [5].
C’est important de rappeler aussi qu’en recherche en sciences de la vie, certaines chercheurs qui s’opposent à la libération des accès aux données en réalité ils ont peur de découvrir que leur résultats ne sont pas reproductibles.
Bien cordialement,
SM
[1] http://www.nature.com/news/specials/bigdata/index.html
[2] https://www.ncbi.nlm.nih.gov/pubmed/11726920
[3] https://www.lesechos.fr/idees-debats/cercle/cercle-154901-big-data-loiseau-bleu-a-fait-son-nid-en-sante-et-en-recherche-biomedicale-sur-le-cancer-1205495.php
[4] https://ukrio.org/new-guidance-from-ukrio-internet-mediated-research/
[5] https://marketing.afnor.org/livre-blanc-big-data