Santé : big data, révolution ou danger ?

Avec la démocratisation du séquençage du génome, la masse de données de santé explose littéralement. Mais si le big data est un levier majeur au service de la recherche scientifique, des questions se posent, liées notamment à l'anonymisation des données et aux capacités de stockage. Les données sur notre état de santé sont-elles en sécurité ? À Toulouse, plusieurs spécialistes s'emparent de la question.
La recherche médicale est aujourd'hui à l'origine d'une foule de données

Dans son ouvrage La défaite du cancer, paru fin 2014 aux éditions JC Lattès, Laurent Alexandre, fondateur du site Doctissimo et médecin spécialisé dans le décodage du génome, fait un constat : la recherche médicale est aujourd'hui à l'origine d'une foule de données.

"La lecture de l'ADN d'une seule tumeur génère 10 000 milliards de données brutes, écrit-il. Pour traiter et analyser ce tsunami d'informations, l'ordinateur est évidemment au cœur du système. La cancérologie 2.0 est une techno-médecine dont la 'loi de Moore' - théorie selon laquelle la puissance de l'informatique double tous les dix-huit mois - est le puisant moteur."

Un phénomène de big data (méga-données) directement lié à la démocratisation du séquençage du génome, notamment dans le cas de la recherche contre le cancer. "À l'heure actuelle, 25 000 tumeurs ont été séquencées, rappelle Laurent Alexandre. Les chercheurs ont ainsi à leur disposition un répertoire de centaines de milliers de mutations actives dans les cancers. Un travail pharaonique les attend désormais pour analyser cette multitude de données et trouver les meilleures thérapies personnalisées. Mais l'explosion de la puissance informatique permettra la réalisation de cette tâche."

"À qui peut-on faire confiance ?"

Ainsi, le traitement des données de santé serait à même d'améliorer, voire de révolutionner le traitement des patients. L'accumulation de données issues de sources multiples pourrait de même permettre de décloisonner les savoirs.

"Nous sommes encore au début de ce phénomène et cela va encore s'amplifier, analyse Bertrand Monthubert, président de l'université Toulouse III - Paul Sabatier. Mais plusieurs questions vont se poser : Comment croise-t-on ces données ? Quels acteurs vont se positionner ? À qui peut-on faire confiance ?"

Car l'homme le martèle : "Pour que l'innovation soit réussie, il faut qu'elle soit acceptable. La question de l'innovation, c'est une rencontre entre un besoin et une réglementation."

Des données "presque" anonymes

En l'espèce, la réglementation est claire, comme l'explique Emmanuelle Rial-Sebbag, juriste chargée de recherche à l'Inserm, à Toulouse.

"Les données récoltées sont mises à disposition d'équipes de recherche et d'évaluation dans une perspective d'amélioration de la santé humaine, rappelle-t-elle. Et le principe du big data est l'anonymisation des données à partager."

Reste que si la règle est claire, le croisement de certaines bases de données, à l'origine anonymes, pourrait permettre in fine de retrouver l'identité des cas étudiés. Et donc des patients. "C'est une faille et, sur ce point, la loi n'est pour le moment pas d'un grand secours, admet volontiers Emmanuelle Rial-Sebbag. Bien sûr, il faudrait des intentions malveillantes pour réaliser ce genre de prouesse technique. Mais il y a eu des précédents dans la génétique : pour démontrer le caractère sensible de cette question, des scientifiques sont parvenus, à l'aide de certains calculs, à retrouver l'identité des patients, en étudiant des données pourtant anonymisées." Se pose alors la question de la sécurisation du stockage de ces données.

"Il faut prévoir des mécanismes de surveillance de l'accès à ces données sensibles, estime la juriste. Et il faudrait que la question du big data soit envisagée dès le départ. Il faut des garde-fous !"

Une course à l'espace de stockage

De son côté, Christine Gaspin, responsable de la plateforme bioinformatique du Genopole de Toulouse Midi-Pyrénées (GenoToul), stocke - notamment - des données médicales, mais ne les archive pas sur de la longue durée.

"Et elles sont toujours anonymisées, insiste-t-elle. Notre mission consiste à offrir des moyens mutualisés à la communauté des chercheurs (750 utilisateurs en France, NDLR). Nous sommes au service des programmes scientifiques. Les autres acteurs, comme les CHU, par exemple, préfèrent investir dans leurs propres outils de stockage des données."

Aujourd'hui, la plateforme, qui dispose de 5 000 cœurs de calcul et d'un espace de stockage de 1,4 pétaoctets, anticipe l'avenir. "Nous avons déjà investi plus de 2 millions d'euros dans nos infrastructures, explique Christine Gaspin. Et nous prévoyons de nouveaux investissements à l'horizon 2018. C'est un peu une course à l'espace de stockage..."

Afin de mettre en avant les atouts et les perspectives de la filière santé locale et d'expliquer l'enjeu de la compétition internationale et de la rivalité Toulouse / Montpellier, La Tribune-Objectif News organise le 25 septembre le 1er forum santé Innovation (inscription ici).

Sujets les + lus

|

Sujets les + commentés

Commentaire 0

Votre email ne sera pas affiché publiquement.
Tous les champs sont obligatoires.

Il n'y a actuellement aucun commentaire concernant cet article.
Soyez le premier à donner votre avis !

-

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.