#08 - Processing health data in research

Ecosystem

Episode duration 00:26

For this eighth episode, "100 Days to Succeed" focuses on data processing in health research and innovation.

00:00:00
Voix Off : "Cent jours pour réussir". C'est le podcast de G_NIUS, le Guichet national de l'innovation et des usages en e-santé. Autour de Lionel Reichardt, retrouvez les innovateurs de la e-santé et les experts incontournables pour vous aider à réussir dans vos projets.

00:00:20
Lionel Reichardt : Bonjour à tous et bienvenue sur le podcast "Cent jours pour réussir". Le podcast à destination des innovateurs et entrepreneurs dans le numérique en santé, mais aussi de toute personne curieuse de ce domaine. Ce podcast est produit par G_NIUS, le Guichet national de l'innovation et des usages en e-santé. Dans cet épisode, nous parlerons du traitement des données dans la recherche et l'innovation en santé. Pour ce faire, nous recevons Alexandre Vainchtock, pharmacien, cofondateur de HEVA, une société d'études et de conseil en santé. Il est également personnalité qualifiée à l'assemblée générale du Groupe d'intérêt public, plateforme des données de santé, plus connue sous le nom du Health Data Hub. Nous recevons également Emmanuel BACRY acry, directeur de recherche au CNRS et directeur scientifique du Health Data Hub.

00:01:08
Lionel Reichardt : Alexandre Bonjour et merci de partager avec nous votre expérience. Pouvez-vous tout d'abord nous présenter votre formation et votre parcours ?

00:01:16
Alexandre VAINCHTOCK :Bonjour et merci pour votre invitation. Je suis donc pharmacien, économiste de la santé. J'ai commencé ma carrière dans le Conseil en économie de la santé et j'ai ensuite cofondé en 2005 la société HEVA avec Ludovic Marsal. Je suis par ailleurs membre d'un certain nombre de groupes de travail autour de la donnée de santé à l'afro, le Elster Data Institute ou le Syntec Numérique.

00:01:42
Lionel Reichardt : Vous dirigez donc la société HEVA, une société créée en 2005. Pouvez-vous nous la présenter ?

00:01:47
Alexandre VAINCHTOCK :Oui, bien sûr. Non, que la société est un bureau d'études spécialisé dans la donnée de santé et en particulier les bases de données médico administratives. On est aujourd'hui une trentaine de collaborateurs avec un large panel d'expertises, aussi bien des bio statisticiens, des épidémiologistes, des data managers, des data scientists, mais également des développeurs et des designers.

00:02:11
Alexandre VAINCHTOCK :Et j'ai l'habitude de dire au-delà de l'ancienneté de l'entreprise, qui est relativement importante et assez innovante puisque la donnée de santé au début des années 2000 n'était pas forcément le sujet. J'ai l'habitude de dire que la société a un ADN à triple brin, c'est à dire l'expertise dans la data, la volonté de faire de la datavisualisation pour rendre les données accessibles aux non experts et d'être toujours dans l'innovation technologique aussi bien sur des statistiques avancées que sur l'intelligence artificielle.

00:02:39
Lionel Reichardt : On l'a bien compris, vous êtes un expert en données de santé. La France est souvent présentée comme un champion dans ce domaine. Pouvez-vous nous rappeler la genèse de cette construction ?

00:02:48
Alexandre VAINCHTOCK :Oui, bien entendu. Si on parle des données médico administratives, effectivement, ça commence à dater un peu puisque le fameux SNIIRAM dont on entend beaucoup parler a été créé par la loi de finances de 1999. Et puis, au fil des années, l'entrepôt des données a été créé. Puis le chaînage des données entre la Ville et l'hôpital a été fait.

00:03:09
Alexandre VAINCHTOCK :Mais le vrai changement de paradigme est arrivé en 2016 avec la fameuse loi de modernisation des systèmes de santé appelée loi Touraine, qui a vraiment changé les choses en dix ans. Il y a une ouverture des données aux acteurs publics comme aux acteurs privés dès lors qu'ils poursuivent un intérêt public. Et donc, c'est vrai que ça a grandement facilité l'accès à la donnée.

00:03:35
Alexandre VAINCHTOCK :Même si cet accès est régulé dans un cadre bien précis. Mais il est, il est vrai que ça nous a permis de travailler sur ces bases qui ont peu d'égal dans le monde. Pour être franc avec vous, parce que d'une part, on a un système centralisé de l'assurance maladie et donc la base recouvre la quasi exhaustivité des 67 millions de Français.

00:03:58
Alexandre VAINCHTOCK :Et c'est vrai que l'on a l'habitude de parler des pays nordiques, mais on n'est pas du tout sur les mêmes tailles de population et les accès dans des pays comme l'Allemagne ou l'Angleterre sont ne sont pas forcément plus aisés que chez nous. Quant aux Etats-Unis, où il y a des expériences, on travaille également avec ces données là.

00:04:15
Alexandre VAINCHTOCK :Et bien, il y a un système public Medicare et Medicaid, mais après plein d'assureurs privés. L'avantage de cette base de données, c'est qu'elle permet vraiment de travailler sur une pathologie, sur l'exhaustivité de la population. Par ailleurs, on parle de ces données de remboursement qui sont des données bien particulières.

00:04:33
Alexandre VAINCHTOCK :Mais si on regarde au-delà, la donnée de santé est telle qu'elle est définie aujourd'hui par la CNIL et qui prend effectivement en compte à la fois les informations qui sont collectées lorsque vous allez chercher un soin, les informations qui sont obtenues au cours d'un examen ou qui sont retenues au moment de la prise en charge d'une pathologie.

00:04:54
Alexandre VAINCHTOCK :Ces données là aussi sont globalement des données de santé que l'on va retrouver au sein des registres des études cliniques, des [inaudible] et ces bases de données là sont aussi complémentaires de ces fameuses bases de données publiques médico administratives sur lesquelles on travaille.

00:05:09
Lionel Reichardt : Vous avez parlé du SIIRAM, le système national d'information inter régimes de l'assurance maladie. Il y a également le PMSI, Programme de médicalisation des systèmes d'information. On a la DREES, la Direction de la recherche des études et de l'évaluation et des statistiques, j'en passe et des meilleures. Pouvez-vous nous faire un décryptage des principales bases de données ?

00:05:30
Alexandre VAINCHTOCK :Pour faire simple, on va dire qu'il y a les bases en ville et les bases à l'hôpital. Donc la base en ville, c'est DCIR, la base à l'hôpital, c'est le PMSI. Et l'ensemble de ces deux bases constituent ce qu'on appelle le SNIIRAM. Et puis après, vous avez d'autres bases, vous avez la base du CPDC sur les causes médicales de décès. Et puis, il y a une ribambelle de bases de données qui existent, qui ont été développées par des chercheurs, par des cliniciens, des registres.

00:05:55
Alexandre VAINCHTOCK :Et c'est toute la philosophie du Health Data Hub que de dire on crée cette plateforme pour mettre à disposition non seulement les bases de données publiques et médico administratives, mais de donner envie aux producteurs d'autres bases de données de mettre à disposition encore une fois pour des projets de recherche publique, ces bases de données dans le cadre de projets scientifiques.

00:06:15
Lionel Reichardt : Vous mentionnez [inaudible] qui a incarné par voie législative en 2019 et l'ouverture des données datent de 2014 2015. Pouvez-vous nous rappeler les objectifs de cette ouverture des données de santé et ce qui a entraîné la création du Health Data Hub ?

00:06:28
Alexandre VAINCHTOCK :Avant le Health Data Hub, il y avait l'Institut national des données santé et avant l'Institut national des données de santé, il y avait l'Institut des données de santé. Je pense que la loi, et même un peu avant, puisque cette loi s'est préparée dès 2014. La loi et le législateur et les experts ont fait le constat qu'il y avait beaucoup, beaucoup de bases de données en France et que l'accès à ces bases n'était pas forcément très simple, d'une part, et pas forcément homogène en fonction du statut du demandeur public et privé.

00:06:56
Alexandre VAINCHTOCK :Et donc, cette loi a remis tout ça à plat en disant peu importe le statut du demandeur, ce qui est important, c'est la finalité de la demande, et qu'est-ce que l'on veut faire. Et effectivement, ce qui est intéressant, c'est qu'aujourd'hui, dès lors que l'on écrit un protocole, on décrit la recherche, on décrit l'objectif, on décrit la méthodologie et on peut avoir accès à cette base. Et le Health Data Hub est finalement là l'aboutissement de tout ça. Avec Comme il y avait avant, avec l'Institut national des données de santé, un guichet.

00:07:23
Alexandre VAINCHTOCK :Donc, cela veut dire que vous avez un interlocuteur qui va pouvoir répondre à vos questions et vous guider dans la recherche de la donnée existe- t-elle ? Et dans quel cadre je peux y avoir accès. Par ailleurs, la philosophie du Health Data Hub dans les années à venir et on est vraiment là, au milieu du gué, c'est encore une fois d'enrichir les bases de données publiques par d'autres bases de données qui ont été développées à la fois par des acteurs publics et privés, mais là, de manière beaucoup plus spécifique sur une pathologie donnée. On pense aux pathologies orphelines.

00:07:54
Alexandre VAINCHTOCK :On pense à tous les registres qui existent dans la chirurgie et qui ont des profondeurs historiques extrêmement intéressantes, mais qui sont des bases très cliniques, très médicales, ce qui est parfois manquant dans nos bases médico administratives. Qui ont elles, a contrario, l'avantage d'être extrêmement exhaustives à la fois dans la population qui est suivie, mais également dans l'exhaustivité des soins qui ont été remboursées.

00:08:18
Alexandre VAINCHTOCK :Et c'est donc par l'appariement de ces deux types de bases de données qu'on va pouvoir réellement enrichir nos recherches et pouvoir développer des projets extrêmement innovants, à la fois en épidémiologie, à la fois en statistiques, mais également ce à quoi on croit beaucoup chez nous, dans tout ce qui est modèles prédictifs à partir de l'intelligence artificielle.

00:08:40
Lionel Reichardt : Vous l'avez bien dit Alexandre, il s'agit de bases de données médico administratives. Elles concernent souvent le remboursement et ne sont pas strictement des données médicales. Comment fait on alors pour utiliser ces données dans un objectif purement médical ?

00:08:53
Emmanuel BACRY : Vous avez raison. Sur la partie hospitalière, il y a quand même des informations médicales avec la Classification internationale des maladies. Même si elle n'est pas extrêmement fine. Et ce n'est pas une classification anatomo-pathologique. Par contre, il est clair que ville, pour tous les gens qui nous écouteront lorsque vous allez chez le médecin, vous prescrit des médicaments, mais il ne vous marque pas le diagnostic de votre maladie, sauf quand vous êtes en affection longue durée.

00:09:17
Alexandre VAINCHTOCK :Comment fait ? on travaille avec des experts. Encore une fois, on ne peut pas travailler seul. Alors l'Assurance maladie a publié ce qu'on appelle la Carto de la CNAM dans notre jargon, c'est-à-dire que c'est une liste de 56 pathologies, des algorithmes qui ont été développés avec des chercheurs et qui nous permettent donc de travailler là-dessus. Et puis, lorsque ces algorithmes n'existent pas, eh bien, on travaille avec des cliniciens en amont du projet pour finalement définir au mieux l'algorithme qui permettra de repérer la pathologie qui nous intéresse ou le stade de la maladie qui nous intéresse.

00:09:51
Alexandre VAINCHTOCK :Et puis, lorsque la base médico administrative seul ne le permet pas, c'est là où on va faire ce qu'on appelle un appariement avec d'autres bases de données. Et on en revient à ce que je disais précédemment sur un appariement avec des données cliniques, avec des registres. Et tout l'intérêt de la loi de 2016, c'est qu'elle permet désormais de faire des appariements. Et aujourd'hui, il y a un certain nombre de projets qui ont été déposés au Wells Data Hub, où on l'a fait également. Et je pense que c'est vraiment l'avenir de ces projets appariés ces deux types de données.

00:10:23
Lionel Reichardt : On compte plus de 3000 projets référencés par le Health Data Hub. Quelle grande typologie retrouve-t-on dans ces projets ?

00:10:29
Alexandre VAINCHTOCK :Désormais, le Health Data Hub reçoit tous les projets qui n'impliquent pas la personne humaine. C'est un peu un jargon compliqué, pour faire simple, vous avez tout sauf les études cliniques qui sont là pour prouver l'efficacité d'un médicament on n'administre un produit. Donc vous avez à la fois des projets qui sont basés sur ces bases de données médico administratives. Et puis, vous avez aussi plein de projets qui sont basés sur des dossiers médicaux, sur des registres, etc.

00:10:55
Alexandre VAINCHTOCK :Ce qui est assez intéressant, et j'invite les gens qui nous écoutent à aller sur le site du Health Data Hub puisqu'il y a une rubrique spécifique qui existe avec une Data visualisation de grande qualité qui permet de voir à la fois la typologie des projets, mais également la typologie des demandeurs pour ces projets là ou des financeurs. En tout état de cause, ce que l'on voit et ce qui est un vrai changement, c'est que globalement, plus du tiers des projets aujourd'hui ont trait ou utilisent de près ou de loin les données du SNDS, ce qui prouve vraiment qu'il y a une prise de conscience collective des acteurs de santé sur l'intérêt de ces bases.

00:11:31
Lionel Reichardt : Ça veut donc dire qu'un porteur de projet peut être amené à utiliser cette base de données médico administratives, à déposer un projet auprès du Health Data Hub. Quelles sont alors les obligations pour déposer un projet ?

00:11:42
Alexandre VAINCHTOCK :Dans quels cas ? ça va dépendre du profil de demandeurs. Si on regarde les établissements de santé qui font beaucoup de projets à partir de ces données, on va être plus sûr de la recherche fondamentale. Et encore une fois, des appariements avec des registres. Lorsqu'on regarde les industriels de santé, que ce soit l'industrie pharmaceutique ou l'industrie du dispositif médical et des biotechnologies, ils vont mener ce type de projet, soit en amont du lancement d'un produit de santé afin de déterminer la population cible, de connaître le parcours du patient, de connaître le coût de la maladie ou à l'inverse,

00:12:21
Alexandre VAINCHTOCK :à postériori du lancement dans le cadre des discussions qu'il peut y avoir avec les autorités sanitaires pour voir en vie réelle comment est utilisé le produit. Est-ce qu'il est utilisé, comme il l'a dit qu'il aurait été utilisé ? À quelle fréquence ? À quelles doses ? Quels sont les profils des patients dans la vraie vie ? Et ça, effectivement, c'est aujourd'hui largement utilisé pour ces objectifs là. Donc ça permet largement de voir beaucoup, beaucoup de choses en vie réel , sur une population qui est exhaustive. Après, en termes d'obligations, la loi est très claire.

00:13:02
Alexandre VAINCHTOCK :Elle impose donc aux producteurs de produits de santé de travailler avec un laboratoire de recherche ou un bureau d'études qui, lui de son côté, s'engage sur un référentiel en termes d'expertise, d'indépendance, de confidentialité. Sauf si cet industriel peut démontrer que les modalités de mise en œuvre du traitement lui rendent impossible toute utilisation pour des finalités interdites qui seraient des finalités purement commerciale, de promotion, etc.

00:13:30
Alexandre VAINCHTOCK :Dans les faits, depuis trois ans, on se rend compte que l'ensemble des industriels préfère travailler avec des bureaux d'études et des laboratoires de recherche qui sont d'une part des experts de la donnée et, d'autre part, qui apportent un certain gage de qualité et d'indépendance sur les études et les résultats qui vont ensuite être fournis soit aux autorités de santé, soit aux soignants, soit même au patient.

00:13:53
Lionel Reichardt : Est-ce à la portée de toutes les Starts Up, de déposer un projet et de demander l'utilisation de ces données de santé ?

00:13:58
Alexandre VAINCHTOCK :Je pense que c'est la philosophie qu'on poursuit tous, et notamment le health Data Hub, que ça ne soit plus réservé aux experts et je peux encourager ces entrepreneurs qui voudraient travailler sur les données d'une part, à ne pas hésiter à prendre contact avec le health Data Hub. Je crois que j'ai utilisé le mot tout à l'heure de guichet. C'est tout sauf péjoratif. Il y a aujourd'hui une équipe de gens extrêmement compétents qui sont là pour répondre aux questions des gens qui n'y connaissent pas grand chose.

00:14:27
Alexandre VAINCHTOCK :Après, une fois qu'on a dit ça, il y'a comment concrètement mettre en place une étude. Et là, je pense qu'effectivement, il est préférable pour ces entrepreneurs, pour ces gens qui sont dans l'innovation, de faire appel aux experts du domaine, que ce soit des bureaux d'études, que ce soit des laboratoires de recherche, parce que je pense que eux vont connaître sans doute la base de données qu'ils ont peut6être produite. Mais après, c'est un métier le data management, etc.

00:14:54
Alexandre VAINCHTOCK :Et ce qui est assez intéressant, c'est qu'on a l'habitude de dire avec les ingénieurs dans l'équipe qu'aujourd'hui l'ingénieur seul, il est pas grand chose finalement, et que c'est vraiment le triptyque entre le data manager qui va décortiquer la data, le clinicien qui va la médicaliser, qui va lui donner tout son sens médical et enfin, l'ingénieur data scientist qui va lui l'exploiter. Et je reste convaincu que c'est ce triptyque là qui permettra demain de développer des projets. Je pense que les gens aujourd'hui qui veulent travailler sur la donnée, on doit travaille tous main dans la main.

00:15:23
Lionel Reichardt : Pour conclure, quel conseil donneriez-vous à un porteur de projet qui voudrait travailler sur ses données de santé ?

00:15:28
Alexandre VAINCHTOCK :Je pense que je viens de vous répondre précédemment, c'est à dire qu'encore une fois c'est contacter les experts. Aujourd'hui, tous les experts et tous les bureaux d'études sont référencés sur le site du Health Data Hub. Et encore une fois le Health Data Hub est là pour les accompagner. Je pense que quand on regarde dans le rétroviseur, il y a énormément qui a été fait en 3 ans. Quand je dis 3 ans, c'est depuis la mise en place de l'INDS, suite à la loi de modernisation de santé 2016.

00:16:20
Alexandre VAINCHTOCK :Bien sûr que tout n'est pas parfait, on peu encore améliorer les choses dans les délais d'accès aux données. Mais quand on regarde avec l'expérience qu'est la mienne depuis près de 20 ans maintenant, le travail est gigantesque et je pense que vraiment la France n'a pas a rougir de ces voisins européens voir plus large et il faut qu'on capitalise tous là-dessus parce que la France peu vraiment être le leaders de la donnée de santé dans en Europe et le monde.

00:16:20
Lionel Reichardt : Alexandre Weinstock, merci pour votre témoignage. Vous poser des questions sur les prises de contact auprès de l Internet pour utiliser les données de santé. Eléments de réponse avec Emmanuel BACRY akery, directeur de recherche au CNRS et directeur scientifique du Health Data hub, plate forme, qui met en œuvre les grandes orientations stratégiques relatives au système national des données de santé fixés par l'Etat, notamment par le ministère des Solidarités et de la Santé. Emmanuel BACRY akery, Bonjour, pouvez-vous nous présenter le Health Data Hub ?

00:16:52
Emmanuel BACRY : En France, on a de très, très belles bases de données de santé qui peuvent être utilisées pour faire de beaux projets de recherche souvent, mais qui restent encore, à mon avis, très sous exploitées, à cause de trois principaux problèmes. Tout d'abord, parce qu'elles sont dispersées à travers énormément de centres. Deuxièmement, parce qu'elles ont des gouvernances qui sont très hétérogènes et parfois extrêmement complexes. Donc, ça peut être très difficile pour un chercheur ou pour une entreprise d'accéder à ces bases là. Et troisièmement, parce qu'elles sont très peu interopérables. Or, interopérables, ça veut dire quoi ?

00:17:27
Emmanuel BACRY : Ça veut dire qu'on peut faire discuter les bases de données entre elles. Et on sait qu'à l'heure du Big Data, oui, c'est bien d'avoir des très grosses bases de données. Bien sûr, grossir les bases, c'est bien, mais en fait, il y a quelque chose qui permet de les enrichir infiniment plus que simplement les grossir, c'est de les coupler avec des données qui sont de sources extrêmement hétérogènes, extrêmement diverses. Voilà donc ça c'est trois problèmes qui font que nos bases sont sous exploitées. Et le Health Data Hub est là pour essayer de répondre à ces trois problématiques.

00:17:58
Emmanuel BACRY : En pratique, ça se passe comment ? On va publier un catalogue de grandes bases de données qui seront disponibles pour opérer de la recherche d'intérêt public sur la plateforme du Health data hub. Donc, en pratique, on va publier un catalogue de grandes bases de données qui sera mis à jour au fil de l'eau, donc de grandes bases de données qui seront disponibles pour opérer de la recherche d'intérêt public sur la plateforme du Health Data Hub. Bien sûr, parmi ces bases là, la première base, je dirais, c'est la base historique du SNDS.

00:18:34
Emmanuel BACRY : Donc, la base médico administrative qui correspond à la base de la carte Vitale et du parcours hospitalier. Mais il va y avoir aussi beaucoup de bases qui seront mis en qualité dans le hub et qui seront interopérables, notamment avec la SNDS. Je veux parler de d'interopérabilité. Typiquement, elles seront un unique lieu et interopérable. Toute entreprise ou tout groupe de recherche pourra déposer un projet pour opérer de la recherche d'intérêt public sur une de ses bases du catalogue ou plusieurs de ses bases du catalogue qui pourront être chaîné entre elles. Ils vont déposer ce protocole de projet au Health Data Hub, qui jouera le rôle de guichet.

00:19:17
Emmanuel BACRY : Le guichet va passer ce protocole à un comité qui s'appelle le CSRS, qui va faire une validation de la qualité scientifique et éthique du projet. Si il y a avis favorable du CSRS, le projet va être envoyé à la CNIL, qui donnera un avis final si l'avis final de la CNIL est favorable. Le Health Data Hub mettra en place un espace sécurisé sur la plateforme dans lequel uniquement les données qui seront nécessaires à la conduite de ce projet là seront déposées. Espace sécurisé qui sera accessible à distance par les porteurs de projet pour opérer leur recherche.

00:20:04
Lionel Reichardt : Quels sont les délais de mise en place de ces différentes étapes ?

00:20:08
Emmanuel BACRY : Les délais ont déjà été beaucoup réduits par rapport à ce qu'ils pouvaient être dans les dernières années et, j'espère sont encore amenés à diminuer. Le CSRS, lui se réunit tous les mois, donc vous avez normalement, sauf si beaucoup trop de projets sont déposés, une réponse du CSRS au bout d'un mois, vous pouvez avoir une réponse qui est défavorable auquel cas le projet est bloqué. Vous pouvez avoir une réponse qui est réservée avec des remarques, des membres du CSRS

00:20:40
Emmanuel BACRY : qui vont vous demander de faire des modifications au projet auquel cas vous avez un mois pour répondre à ces remarques et redéposer le projet ou vous pouvez avoir un projet qui est noté comme favorable tout de suite. Auquel cas, ça va être envoyé à la CNIL. A partir de là, la CNIL a deux mois pour formuler une réponse qui est potentiellement renouvelable. C'est un délai qui est renouvelable deux mois supplémentaires jusqu'à quatre mois. Si vous n'avez pas de réponse au bout de quatre mois, c'est un oui implicite de la CNIL.

00:21:08
Emmanuel BACRY : Donc, au bout de quatre mois, si vous n'avez pas de réponse, ils y a une réponse qu'ils considèrent comme implicite, comme favorable. Et vous pouvez effectivement opérer votre projet. Et ensuite, bien évidemment, il y a le temps de mise à disposition des données dans l'espace sécurisé, donc le temps d'ouverture de l'espace sécurisé de vérification que vos méthodes d'accès seront conforme au référentiel de sécurité, ça, c'est vraiment des choses qui sont très importantes. Ça peut prendre un petit peu de temps, mais ça, ça va dépendre aussi de votre activité, de leur activité, du porteur de projet et effectivement, de la facilité à mobiliser les données. Normalement si ce sont des données du catalogue, elles seront facilement mobilisables parce qu'elles seront déjà dans le Health Data Hub.

00:21:47
Lionel Reichardt : Quels conseils donneriez-vous à un porteur de projet qui voudrait traiter des données de santé pour la recherche ?

00:21:51
Emmanuel BACRY : Premier conseil : bien comprendre de quelles données ou vous avez besoin pour opérer votre recherche. Cela veut dire qu'il faut quand même que vous connaissez bien les données auxquelles vous allez demander accès et pas juste rêver en disant, Ah tiens, je sais que cette base a l'air bien, je vais mobiliser cette bases là et ça va me permettre de répondre je pense. S'il faut faire une étude quand même assez poussée. Sinon, de toute façon, même le CSRS ne sera pas passé votre projet.

00:22:15
Emmanuel BACRY : Vous devez montrer que vous connaissez bien les bases de données auxquels vous demandez accès et qu'elles vont bien permettre de répondre aux questions que vous vous poser. C'est quelque chose de très important. Maintenant, vous devez bien écrire votre protocole, bien sûr, de demandes d'accès et pour cela, vous pouvez être aidé par tous les formulaires qui sont accessibles aujourd'hui sur le site du Health Data Hub et qui vous expliquent bien toutes les étapes de ce processus de gouvernance jusqu'à l'accès effectif aux données.

00:22:40
Emmanuel BACRY : Je vous conseille de lire toutes ces étapes là si vous avez besoin d'informations supplémentaires. Bien sûr, le guichet du Hub est à votre disposition pour échanger avec vous sur les espaces, sur les forums de discussion qui sont disponibles. Ne pas négliger le fait qu' une fois que vous avez l'accord CNIL, vous allez devoir définir un responsable de traitement, qui portera la responsabilité pénale de potentielles malversations que pourrait être fait dans l'opération de votre projet.

00:23:15
Emmanuel BACRY : C'est quelque chose qui est important et notamment, vous devez fournir un audit de sécurité sur les données sur les ordinateurs qui auront accès, dans le cadre de votre projet, à la plateforme sécurisée du Health Data Hub. Il peut y avoir des gens qui sous estiment cette étape là. Mais on vous accompagne aussi là-dessus. On peut vous fournir des noms d'auditeurs si vous n'êtes pas capable de faire cet audit de vous même qui peuvent vous accompagner dans cette phase là. Mais c'est vraiment très important.

00:23:43
Emmanuel BACRY : Mais mon conseil avant tout, c'est identifier réellement quelles sont les bases qui sont nécessaires pour répondre aux questions que vous poser et quel est le périmètre de ces bases dont vous avez besoin. Si vous avez besoin d'informations du SNDS historique de la base Medico-Administrative, ne dites pas dans votre protocole je veux tout le SNDS. Bien sûr, vous devez montrer que vous connaissez bien le SNDS et vous dites je vais avoir besoin de tant de personnes, des gens qui sont topé avec tel signal, avec telle variable et ainsi de suite.

00:24:14
Emmanuel BACRY : Et j'ai besoin de ces variables là, de cette table et ainsi de suite. Si vous montrez une très bonne connaissance des bases de données auxquelles vous voulez avoir accès, vous augmentez vos chances d'avis favorables au CSRS. Et on donne aussi, bien sûr, beaucoup d'informations sur les bases de données sur le SNDS historique. Mais sur les autres bases du catalogue, vous trouverez beaucoup d'informations de métadonnées qui vous permettront de comprendre justement ce qui se trouve comme information dans ces bases là pour vous guider justement dans votre protocole.

00:24:42
Emmanuel BACRY : Bien entendu, dans les espaces sécurisés auxquels les porteurs de projet auront accès, les données qui sont mises à disposition sont des données qui ne sont pas directement identifiantes. Ce sont des données qui sont pseudonyme. Donc, vous n'aurez pas le nom de la personne numéro de sécurité sociale des personnes. Le Health Data Hub a une interdiction formelle d'héberger sur sa plate forme des données directement identifiantes. Le processus de dépôt de projet jusqu'à la validation et l'opération effectivement du projet sur la plateforme du Health Data Hub.

00:25:14
Emmanuel BACRY : Dans ce projet là, vous allez avoir besoin de ressources humaines avec des spécialités très différentes. Il va falloir avoir des gens qui vont être capables effectivement de comprendre réellement comment est-ce que le protocole doit être écrit. Ensuite, vous accompagner dans l'audit de sécurité. Qu'est-ce que ça veut dire être responsable de traitement ? En fait, il y a tout un panel de ressources humaines qu'il faut prévoir et qu'il ne faut pas négliger. On a vu beaucoup de projets être extrêmement ralenti, voire ne pas aboutir à cause de manque de bonnes ressources humaines.

00:25:52
Lionel Reichardt : Notre épisode touche à sa fin. Nous remercions nos deux invités pour leur disponibilité, ainsi que vous pour votre écoute. N'hésitez pas à vous abonner au podcast sur les plateformes d'écoute. Nous vous donnons rendez-vous très bientôt pour un nouvel épisode de "Cent jours pour réussir".

00:26:10
Voix Off : Celles et ceux qui font la e-santé d'aujourd'hui et de demain sont sur le podcast de G_NIUS et toutes les solutions pour réussir sur gnius.esante.gouv.fr

 

Description

With Alexandre Vainchtock (HEVA) and Emmanuel Bacry (CNRS / Health Data Hub).

For this eighth episode, "100 Days to Succeed" focuses on data processing in health research and innovation.

We're talking with Alexandre Vainchtock, pharmacist and co-founder of HEVA, a health research and consulting company. He is also a Qualified Person at the General Assembly of the Public Interest Group "Plateforme des données de santé", better known as the Health Data Hub.

We also welcome Emmanuel Bacry, research director at CNRS and scientific director of the Health Data Hub.