Les données de santé artificielle : dans les essais cliniques et l’évaluation des produits de santé ?

Posted by

Et si le recours aux données générées par des systèmes d’Intelligence artificielle  (SIA) s’imposait comme la solution aux problèmes inhérents à la recherche, à l’évaluation des produits de santé ? La réponse est positive pour la  Professeure Stéphanie Allassonnière, directrice adjointe de l’institut de recherche en intelligence artificielle (IA) PRAIRIE, et coordinatrice du livre blanc consacré à la question « les données de santé artificielles : analyse et pistes de réflexion ». Pour elle, « Les données artificielles sont des informations ou des ensembles de données créés numériquement pour simuler des caractéristiques et des structures similaires à celles des données réelles ».

Actuellement, des essais ayant recourt à des bras de contrôle synthétiques ont déjà été autorisés par les autorités de régulation (FDA ou Food and Drug Administration, EMA ou European Medicines Agency). On peut citer, par exemple, l’Alecensa® (alectinib) , développé par le laboratoire Roche, indiqué en monothérapie dans le traitement du cancer du poumon non à petites cellules (CPNPC). Ce médicament avait reçu une approbation conditionnelle par l’EMA en 2017. Le niveau de preuve a été reconnu comme robuste par l’EMA et a permis la mise sur le marché de l’alectinib 18 mois plut tôt que s’il avait fallu attendre les données d’une étude clinique « traditionnelle ». L’utilisation de données artificielles pourrait jouer un rôle identique à ces données synthétiques, avec l’avantage d’être temporellement équivalentes au bras traité. Le recours aux données artificielles ouvrent des perspectives notamment pour faciliter la recherche dans le domaine des maladies rares.

Cependant, le recours aux tests cliniques in silico interroge sur la fiabilité des données artificielles, et tout particulièrement sur leur capacité à reproduire des données réelles. Qui pourra attester que ces données artificielles sont « similaires  dans leurs caractéristiques et leurs structures» aux données réelles et selon quel protocole, quelles règles ? Sous quelles conditions intégrer les données artificielles dans les essais cliniques ou l’évaluation des produits de santé afin de garantir la sécurité des patients ? L’intégration du virtuel dans la recherche clinique conduit à adapter voir à redéfinir les règles éthiques. Quel sera le rôle du règlement sur l’Intelligence Artificiel[1], adopté le 21 mai dernier par le Conseil de l’Union européenne, (ci-après l’IA Act) et tout particulièrement comment implémenter le principe de garantie humaine, dans les Recherches Impliquant la Personne Humaine (RIPH) et les méthodologies d’essais cliniques ? Quelle sera la place du Règlement Général sur la protection des données à caractère personnel[2] (ci-après RGPD) dans cette nouvelle donne ? Comment devront être validés « ces patients d’un nouveau genre » pour la recherche ?

Ce livre blanc interroge tous les acteurs de l’écosystème, chercheurs, industriels, entrepreneurs, régulateurs pour réfléchir et proposer des pistes pour identifier les conditions d’usage des cohortes de patients virtuels dans les essais cliniques, le recours aux données artificielles dans l’évaluation des innovations en santé.

Génération d’une donnée de santé artificielle et un patient artificiel ?

Comment définir une donnée artificielle

Les nombreux contributeurs à ce livre blanc, tous experts dans leur domaine de compétence, posent le problème de la définition des données de santé générées par un système d’intelligence artificielle à partir de données médicales réelles. Il ne s’agit pas de reproduire des données réelles à l’identique, mais de créer des données artificielles annotées ayant les mêmes caractéristiques que la population d’origine. Elles sont générées à l’aide d’algorithmes implémentant des modélisations mathématiques, basées soit sur des modèles dits mécanistiques reposant sur la modélisation des systèmes physiques, chimiques et biologiques considérés ou des méthodes d’apprentissage, visant à reproduire des caractéristiques similaires à celles d’une population observée.

Comment définir ce patient artificiel ?

Le livre blanc évoque le patient artificiel, mais ne le définit pas. Le patient artificiel n’existe pas en général, il doit être défini et généré par des paramètres pertinents en fonction des situations, des pathologies étudiées, des spécificités de la population à augmenter. Les bases de données utilisées pour générer les patients artificiels devront être le plus proche possible du contexte dans lequel se déroule l’essai et le plus représentatives de la population étudiée. Il sera nécessaire de calibrer la quantité de données nécessaire et suffisante pour capter les signaux faibles dans la population à augmenter. Selon le livre blanc, le plus gros défi résidera sans doute dans la génération des potentiels évènements indésirables.

Le rôle RGPD dans la génération de cohortes de patients artificiels : Phase de développement de l’Algorithme

Une donnée de santé artificielle est générée sur la base d’une donnée de santé réelle dite donnée d’apprentissage. Cette génération de data renvoie à la protection des données à caractère personnel et donc au Règlement Général sur la Protection des Données au sein de l’Union européenne (RGPD ). L’accès aux données de patients nécessaires au développement de ces modèles est très complexe et limité. Dès lors, la difficulté de créer des cohortes de patients servant de base d’entrainement des systèmes d’Intelligence Artificielle rend plus complexe la constitution de données de santé artificielle et donc la phase de développement de l’Algorithme. Selon le livre blanc, Les questions relatives à l’utilisation d’un algorithme permettant de générer des cohortes virtuelles dans un essai clinique n’ont pas été arbitrées par le collège de la Cnil.

Le RGPD a donc vocation à s’appliquer dans la phase de développement de l’Algorithme destiné à générer des cohortes de patients virtuels dans un contexte médical 

Les formalités

Il s’agit d’une recherche, une étude ou une évaluation dans le domaine de la santé relevant de l’article 66 de la « loi informatique et libertés », conformité à une MR ou décision individuelle de la CNIL (après avis du comité compétent).

Un protocole scientifique doit décrire le traitement et documenter la méthodologie pour faire en sorte d’avoir un traitement fiable, robuste dans le temps et démontrer que le traitement envisagé poursuit une finalité d’intérêt public.

Conformité au RGPD

Comme tout traitement de données, le traitement relatif aux données d’entraînement d’un SIA doit être conforme aux exigences du RGPD :

Le RGPD est-il exclu de la phase de déploiement du SIA ?

En ce qui concerne les données des patients virtuels, engendrées par le modèle d’intelligence artificielle, une analyse, devra démontrer que les données des patients virtuels ne reproduisent pas des données de patients réels (méthode de généralisation ou de randomisation). Si les données sont anonymes, le RGPD ne s’appliquera pas.

En revanche, l’IA Act a vocation à s’appliquer dans la phase de déploiement.

Les dispositions des Systèmes d’IA à haut risque de l’IA Act, seront applicables aux DMN avec IA  dont notamment, la qualité des données, la documentation et la traçabilité, la transparence, le contrôle humain, l’exactitude, la cybersécurité et la robustesse.

Cette évaluation devra être répétée en cas de modification substantielle du système ou de sa finalité. Les fournisseurs de systèmes d’intelligence artificielle à haut risque devront mettre en œuvre des systèmes de gestion de la qualité et des risques afin de garantir qu’ils respectent les nouvelles exigences et de minimiser les risques pour les utilisateurs et les personnes concernées, même après la mise sur le marché du produit.

L’usage des données de santé artificielle : absence de règles

Cohorte augmentée : un complément intéressant

Ces données de santé artificielles pourraient compléter les cohortes de patients réels, notamment pour les populations difficilement accessibles ou fragiles.

L’inclusion d’un nombre suffisant de patients dans l’essai est un des facteurs qui garantit la puissance statistique et la robustesse des résultats, sans garantir la pertinence clinique de ces résultats. La taille d’effet attendue est également un élément clé dans un protocole : plus elle est importante et moins il faudra de patients. Dans la recherche clinique, la génération de données artificielles permettrait d’aider au design pertinent des essais cliniques, de constituer des cohortes de patients artificiels qui pourraient renforcer les bras contrôles d’études de phase 3 et/ou les patients inclus dans les phases 2. On peut également envisager que ces données artificielles puissent un jour compléter les bras actifs des phases 3, permettant d’augmenter la puissance statistique des tests comparatifs de deux bras, et les patients. Dans les phases 4, les données artificielles pourraient aussi permettre de rendre plus « visibles » des signaux faibles.

En outre, la génération de patients artificiels permettrait de réduire le coût et la durée des études. Ces traitements pourraient être mis sur le marché plus rapidement et donc plus rapidement accessibles aux patients.

Les études in silico dans les évaluations

Cependant, l’absence d’un processus de validation de génération des données artificielle et donc la généralisabilité des modèles d’IA générative, limite l’utilisation de ces données de santé. En effet, il n’existe actuellement pas de recommandations émanant d’agences ou d’autorités de régulation définissant les critères d’acceptabilité de cohortes de patients artificiels pour l’évaluation des produits de santé ou des dispositifs médicaux, le concept même de recours à des cohortes de patients artificiels dans cet objectif ne faisant pas consensus. Les expériences d’utilisation de ce type de cohortes dans les études soumises aux agences sont d’ailleurs, à ce stade, limitées.

Le guide méthodologique de la HAS pour le développement clinique des dispositifs médicaux, mis à jour en 2021, évoquait aussi les études in silico. Il concluait toutefois qu’à ce jour, les études in silico devaient être considérées comme des outils complémentaires aux méthodologies existantes lorsqu’il existe un modèle physiopathologique et qu’elles devaient être réservées aux études de faisabilité.

La FDA a formulé des recommandations sur l’utilisation des bras synthétiques ou externes construits à partir de données observationnelles[3].

Les travaux en cours au niveau européen sur le recours aux méthodes de modélisation et de simulation (M&S)

Un cadre d’évaluation de la crédibilité des modèles mécanistiques a été développé récemment par un groupe de travail coordonné par l’EMA, Modelling and Simulation Working Party, pour l’utilisation d’études in silico reposant des modèles mécanistiques[4].

En 2023, la Commission Européenne a publié dans le cluster santé d’Horizon Europe un appel à projets afin de proposer des méthodes de simulations, modélisation et essais cliniques in silico avec un but d’être compatible et accepté d’un point de vue réglementaire pour les petits effectifs maladies rares, pédiatriques, etc.).

Deux projets ont été financés et ont démarré en 2024, ERAMET et INVENTS.

Dans les prochaines années, des méthodes de modélisation et de simulation (M&S) seront donc disponibles dans ce cadre.

L’éthique : vers un contrôle de la génération des données artificielles jusqu’aux résultats produits par leur utilisation

Lire la suite …..


[1] RÈGLEMENT DU PARLEMENT EUROPÉEN ET DU CONSEIL établissant des règles harmonisées concernant l’intelligence artificielle et modifiant les règlements (CE) n° 300/2008, (UE) n° 167/2013, (UE) n° 168/2013, (UE) 2018/858, (UE) 2018/1139 et (UE) 2019/2144 et les directives 2014/90/UE, (UE) 2016/797 et (UE) 2020/1828 (règlement sur l’intelligence artificielle)

[2] Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016 relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données, et abrogeant la directive 95/46/CE (règlement général sur la protection des données)

[3] https://www.fda.gov/regulatory-information/search-fda-guidance-documents/considerations-design-and-conduct-externally-controlled-trials-drug-and-biological-products 42 41 42

[4] Toward good simulation practice: best practices for the use of computational modelling & simulation in the regulatory process of biomedical products. Version: R6, 06-05-2023. https://insilico.world/sito/wp-content/uploads/2023/06/Position-Paper-GSP-R6.pdf 41

[5] https://cordis.europa.eu/project/id/101137141

[6] https://ecrin.org/projects/invents

Laisser un commentaire