Skip to main content

{:fr}

Clinical Data Manager

Rédigé par Fateh Cheklat, ARC/TEC/Data Manager at Pharmaspecific

Chers ARC, par cette article, je voudrais vous parler d’un métier, peu connu dans le domaine de la Recherche Clinique, et qui pourtant, travaille en étroite collaboration avec vous tout au long d’un essai clinique. Le métier que j’exerce depuis maintenant 4 ans « Clinical Data Manager » ou de « Gestionnaire de données s ». Les ARCs ne savent pas toujours ce en quoi consiste le métier de Data Manager, hormis via les queries laissées sur le CRF électronique…, je voudrais donc vous expliquer en quoi consiste ce métier dans cet article.

Pour devenir Data manager, il faut avoir un niveau d’étude de bac+3 à +5, scientifique ou informatique, pour pouvoir intégrer une formation d’un an dans une école privée ou dans une université : 6 mois de cours théoriques sont dispensés, suivi de 4 à 6 mois de stage pratique. Un rapport de stage est nécessaire pour valider le diplôme (RNCP I).

Les objectifs du Data Manager (DM) sont de structurer les données cliniques des patients inclus dans un essai clinique dans une base de données, de vérifier la cohérence de ces données et leur fiabilité, et de nettoyer la base de données avant qu’elle soit transmise au statisticien pour l’analyse statistique. (1)

En recherche clinique, l’étape de Data Management est cruciale pour la validation statistique. Plus la base de données est propre, cohérente, complète et de haute qualité, plus l’interprétation et l’analyse des données seront précises et la décision prise sera meilleure. Le contraire donnera forcément une analyse médiocre et incomplète, et par conséquent, la décision prise sera mauvaise : Pour cela, et comme tout acteur de la recherche clinique, le DM doit respecter les Bonnes Pratiques Cliniques (http://www.arcat-sante.org/a/essais/annexes/bonne.html) . De plus, il doit respecter les directives de la CNIL personnelles (loi n°78-17 du 6 janvier 1978 et modifié le 6 août 2004 : https://www.cnil.fr/fr/loi-78-17-du-6-janvier-1978-modifiee ) (Voir figure n°1).

Figure 1

1. Les différentes tâches du Data Manager : (Voir figure n°2 et n°3)

A partir du protocole de l’essai clinique, le Data Manager repère les données à recueillir à chaque visite et tout au long de la période de participation du patient (avant « screening », pendant et après le traitement dans le cadre du suivi du patient). Il se réunira avec le Chef de Projet de l’étude, afin de valider la liste des données à recueillir, ainsi que l’ergonomie du cahier d’observation (CRF).

Une fois la liste des données validée, le DM conçoit dans un premier temps , selon les Bonnes Pratiques de Data Management (http://libraries.ucsd.edu/services/data-curation/data-management/best-practices.html). Eh oui, la création d’un CRF passe toujours par une version papier, même en cas d’un CRF électronique.

Une fois le CRF papier conçu, le DM l’annote en regroupant des données dans des tableaux : démographique (DM), signes vitaux (VS), antécédents médicaux (MH), traitements concomitants (CM), événements indésirables (AE), etc. Puis il attribue un nom et un format ou un code pour chaque donnée. Pour cela, soit le DM suit les standards CDISC soit il se met d’accord avec le Les standards CDISC sont des normes qui ont été mises au point afin d’harmoniser les pratiques des Data Manager.

Exemple : l’annotation de la date de naissance : appartient au tableau « Démographie » (DM). Le nom correspondant est « BRTHDT » (pour « Birthday date). Sur le CRF, le DM note à côté de la date de naissance : « DM. BRTHDT »,   et son format est « DDMMMYYYY » (pour Day-Month-Year).

Le DM conçoit une base de données via des logiciels dédiés à la gestion de données cliniques (de type Oracle Clinical, Inform, Clintrial, Clinsight,..etc) identiques au CRF version papier.

Ces logiciels comportent plusieurs modules pour

Sous mode « draft » (brouillon) et à partir ue CRF annoté, le DM construit la base de données qui est un ensemble d’écrans de saisie (égal au nombre de pages du CRF papier) et il programme les tests de cohérence et de présence. Ce mode nous permet d’effectuer des changements si nécessaire, contrairement au mode « production ».

Le DM réalise des tests sur la base en utilisant des patients fictifs, pour contrôler sa fiabilité et celle des tests programmés en essayant tous les cas de figures possibles.

Si le test est bon, le CRF sera compilé en mode « production » utilisable pour les vrais patients.

Le CRF final peut être soit sous format papier, soit sous format électronique :

1- Si le projet a besoin d’une version papier pour la collecte des données, ce CRF sera imprimé en plusieurs exemplaires selon le nombre de patients à inclure (un CRF pour chaque patient) et envoyé aux centres participants pour remplissage.

Dans ce cas, des opérateurs de saisie reporteront les données des patients dans la base de données conçu par le DM, d’où l’utilité d’une base identique au CRF pour faciliter la tâche des opérateurs de saisie.

Ce dernier vérifie et valide la saisie au moyen de logiciel de gestion de données.

Les personnes qui ont lu cet article ont lu aussi  {:fr}Questions-Réponses Noël : Chapitre 2 (Partie 1){:}{:en}Christmas Q&A: Chapter 2 (Part 1){:}

Toujours par le logiciel cité, il lance les tests de présence et de cohérence. Ces tests permettent de vérifier si toutes les données obligatoires ont été complétées et si ces données sont cohérentes. Par exemple, si une donnée obligatoire n’est pas renseignée, une query apparaitra sous forme d’un message d’erreur en demandant le remplissage de cette donnée. De même, pour une donnée qui ne serait pas cohérente avec une autre ou plusieurs données (le test est programmé sur les deux ou plusieurs variables), comme une date de naissance indiquée en 1800, par exemple.

Le DM imprime ensuite les queries et les envoie aux centres concernés pour correction ou explication.

Au retour de ces queries, si la réponse est c’est_à_dire que les explications ou la réponse fournie est adéquate le DM corrige les données sur la base. Sinon, il relance le centre jusqu’à obtenir une réponse claire et convaincante.

2- Si le projet a besoin d’un CRF en ligne, le DM met les pages CRF sous format HTML et met le tout dans le site web accessible par internet.

Dans ce cas, il n’y aura pas besoin d’opérateur de saisie, ou de confronter et valider les saisies, puisque l’investigateur lui-même remplit (ou son ARC/TEC) et valide en ligne les pages du CRF de ses patients.

De plus, en cas d’existence des données calculées, le DM met en place des champs automatiquement calculables en associant des formules à cette donnée, ce qui permet d’éviter des erreurs de calcul et de faire gagner du temps à l’investigateur.

De même, pour les queries, . Les queries seront directement transmises aux centres en ligne. L’investigateur ou le TEC répondront à ces queries, soit en corrigeant ou en confirmant la donnée. Si la réponse est « convaincante », la querie disparaitra du circuit lors du prochain lancement des tests ; sinon, la querie sera récréée par le système.

Il y a des tests er tel que les champs texte, où le centre inscrit le nom des lésions à suivre, par exemple…. Dans ce cas, il faut générer un listing des données à vérifier visuellement, un ordinateur ne sait pas analyser ces données. Si en trouve des incohérences ou des erreurs, on génère une querie manuelle via l’eCRF, qui sera envoyée à l’investigateur concerné. Si la réponse est bonne, le DM corrige et ferme la query ; sinon il relance l’investigateur.

Une fois l’étude terminée au niveau des centres, les queries résolues, et la base propre et de bonne qualité, le DM « gèleen la verrouillant, afin d’empêcher des éventuelles modifications du CRF alors que les données ont déjà été validées. Les données sont accessibles seulement en lecture seule. Le DM fait des extractions de données et les transfèrent au statisticien pour analyse avant l’étape finale, « la publication ». (Voir figure n°2 et n°3)

Figure 2

Figure 3

2. Ce que nous disent les BPC bonnes pratique :

Gestion de la recherche, traitement des données et archivage […]

Si les données de la recherche biomédicale font l’objet d’un traitement ou sont gérées par des systèmes informatisés, le promoteur

  • S’assure et documente le fait que les systèmes informatisés utilisés dans la recherche sont conformes aux exigences qu’il a établies en matière d’intégrité, d’exactitude, de fiabilité des données et de respect des performances attendues (c’est-à-dire la validation) ;
  • Met en place et assure le suivi des procédures opératoires standardisées relatives à l’utilisation de ces systèmes ;
  • S’assure que la conception de ces systèmes permet la modification de données de telle sorte que les modifications soient documentées et qu’aucune donnée saisie ne soit supprimée (c’est-à-dire conserve un tracé d’audit des données et des modifications) ;
  • Met en place et assure le suivi d’un système de sécurité qui empêche tout accès non autorisé aux données ;
  • Tient à jour la liste des personnes autorisées à modifier les données ;
  • Effectue des copies de sauvegarde appropriées des données ;
  • Préserve l’insu, s’il y a lieu (par exemple lors de la saisie et du traitement des données);
  • S’assure que les traitements de données à caractère personnel mis en œuvre dans le cadre de la recherche sont réalisés dans les conditions définies par la loi no 78-17 du 6 janvier 1978 susvisée et des textes réglementaires pris pour son application et, le cas échéant, la décision de la Commission nationale de l’informatique et des libertés du 5 janvier 2006 portant homologation d’une méthodologie traitements de données personnelles opérées dans le cadre des recherches biomédicales.

Si les données sont transformées en cours de traitement, il doit toujours être possible de comparer les données et observations originales et les données après transformation.» (2)

J’espère que cet article t’aura aidé à voir plus clair dans le métier de Data manager. Si tu es Data Manager, partage ton expérience dans les commentaires. Oui si tu es ARC et que tu as des questions, n’hésite pas à nous en faire part !

Les personnes qui ont lu cet article ont lu aussi  {:fr}Conseils à suivre pour choisir son assurance essai clinique{:}{:en}Clinical trials insurance, how to choose it well?{:}

Références :

Figure n° 1 : http://www.acadm.fr/pages/metier-formation/qui-est-le-data-manager.html

Figure n° 2 : http://www.recherchecliniquepariscentre.fr/wp-content/uploads/2012/12/gestion-bdd_cours_20121111_FGN.pdf

Figure n° 3 : Inconnu


Vous avez besoin d’une prestation en recherche clinique? contactez PHARMASPECIFIC en vous rendant sur notre site en cliquant ici : https://pharmaspecific.com/devis

Si tu as des questions sur le métier d’attaché de recherche clinique ou sur une carrière dans la recherche clinique, tu peux la mettre dans les commentaires ci-dessous. Nous te répondrons dans les plus brefs délais.

Si tu veux être coaché, si tu veux une réponse personnalisée à tes questions ou être en contact avec d’autres professionnels de la recherche clinique, tu peux te rendre sur https://pharmaspecific-training.com/

{:}{:en}Clinical Data Manager

By Fateh Cheklat, ARC/TEC/Data Manager chez Pharmaspecific

Dear CRAs, for this article I want to talk about a profession, little known in the field of Clinical Research, and yet, working closely with you throughout a clinical trial. The profession I exercise for 4 years now « Clinical Data Manager » or « Data Manager ». The CRAs do not always know what constitutes the profession of Data Manager, except via the queries left on the electronic CRF … so I would like to explain in this article what this profession is.

To become a Data Manager, you must have a level of study Baccalaureate +3 to +5, scientific or computer, in order to integrate training of one year at a private school or university: 6 months of theoretical courses are taught followed by 4 to 6 months of practical training. A traineeship report is required to validate the diploma (RNCP I).

The objectives of the Data Manager (DM) are to structure clinical data of patients enrolled in a clinical trial in a database, to verify the consistency of these data and their reliability, and clean up the database before it is sent to the statistician for statistical analysis. (1)

In clinical research, data management step is crucial for statistical validation. The more the database is clean, consistent, complete, and of high-quality, the more interpretation and analysis of data will be accurate and the decision will be better. The opposite will necessarily give a poor and incomplete analysis, and therefore, the decision will be bad: For this and like any player in clinical research, the DM must comply with Good Clinical Practices (http://www.arcat-sante.org/a/testing/schedules/bonne.html). Moreover, he must respect the personal CNIL directives (Law No. 78-17 of 6 January 1978 and amended on 6 August 2004: https://www.cnil.fr/fr/loi-78-17-du- 6-January-1978-modifiee) (see figure 1).

Figure 1

  1. The tasks of the Data Manager: (See Figure 2 and 3)

From the clinical trial protocol, the Data Manager identifies data to be collected at each visit and throughout the patient’s participation period (before ‘screening’, during and after treatment as part of patient monitoring). He will meet with the Head of the study project to validate the list of data to be collected, as well as the ergonomics of the case report form (CRF).

Once the list of data validated, the DM designs at first, according to the Good Practice of Data Management (http://libraries.ucsd.edu/services/data-curation/data-management/best-practices.html). Yes, the creation of a CRF still requires a paper copy, even in case of an electronic CRF.

Once the CRF paper is designed, the DM annotates it by presenting data in tables: demographic (DM), vital signs (VS), medical history (MH), concomitant therapies (CM), adverse events (AE), etc. Then he gives a name and a format or code for each data. For this, either the DM follows the CDISC standards or he agrees with…

The CDISC standards are standards that have been developed to harmonize practices of Data Managers.
Example: the annotation for the date of birth: belongs to the table « Demography » (DM). The corresponding name is « BRTHDT » (for « Birthday date). On the CRF, the DM notes next to the birth date « DM. BRTHDT « and its format is » DDMMMYYYY « (for Day-Month-Year).

The DM designs a database using software dedicated to the clinical data management (such as Oracle Clinical, Inform, Clintrial, CLINSIGHT, etc…) identical to the paper version of CRF.
These software include several modules for
Under « draft » mode and from annotated CRF, the DM built the database that is a set of entry screens (equal to the number of pages of the CRF paper) and he programs coherence and presence tests. This mode allows us to make changes if necessary, unlike the « production » mode.

The DM conducts tests on the basis using fictitious patients, to control its reliability and the one of the programmed tests by trying all possible cases.

If the test is good, the CRF will be compiled in the « production » used for real patients.

The final CRF can be either in paper form or electronic form:

1- If the project needs a paper version for data collection, the CRF will be printed in multiple copies according to the number of patients to be included (a CRF for each patient) and sent to the participating centers to fill.

In this case, data entry clerks will report patient data in the database designed by the DM, hence the usefulness of a base identical to CRF to facilitate the task of data entry clerks.

Les personnes qui ont lu cet article ont lu aussi  {:fr}Formation En ARC, Budget XXL : Est-ce Vraiment Rentable?{:}{:en}Do I pay so much for CRA training? {:}

The latter verifies and validates the entry using data management software.

Also using the mentioned software, he runs the presence and consistency tests. These tests allow to check if all required data have been completed and if these data are consistent. For example, if a required data is not provided, a query will appear as an error message asking the filling of this data. Similarly, for a data which is not consistent with one or more other data (the test is scheduled on the two or more variables), such as a date of birth entered in 1800, for example.

The DM then prints queries and sends them to the concerned centers for correcting or explanation.

On the return of these queries, if the answer is that is to say that the explanations or the answer provided is adequate, the DM corrects the data on the basis. Otherwise he reminds the center until a clear and convincing answer is provided.
2- If the project needs a CRF online, the DM puts CRF pages in HTML format and puts everything into the accessible internet website.

In this case, there will be no need for data entry clerk, or to compare and validate data entries, since the investigator himself fills (or his CRA/CSC) and validates online CRF pages of his patients.

Moreover, in case of existence of the calculated data, the DM sets up automatically calculable fields by combining formulas with this data, which avoids calculation errors and save time for the investigator.

Similarly, for queries. The queries will be sent directly to centers online. The investigator or the CSC will answer these queries, either correcting or confirming the data. If the answer is « convincing », the query will vanish from the circuit upon restart of tests; otherwise the query will be recreated by the system.

There are tests such as text fields, where the center registered the name of lesions to follow, for example… In this case, a list of data to verify visually will be generated, a computer cannot analyze the data. If inconsistencies or errors are found, manual query is generated via the eCRF, which will be sent to the concerned investigator. If the response is good, the DM corrects and closes the query; otherwise he reminds the investigator.

Once the study is completed at the centers, the queries resolved, and the base clean and of good quality, the DM « freezes in locking it to prevent any changes of CRF while the data has already been validated. Data is accessible only in read only. The DM makes data extraction and transfer it to the statistician for analysis before the final stage, « the publication. » (See Figure 2 and 3)

Figure 2 Figure 3

  1. What do GCPs say:

Research management, data processing and archiving […] If the data in biomedical research are being processed or managed by computerized systems, the promoter

  • Ensures and documents the fact that computerized systems used in research meet the requirements laid down by him for integrity, accuracy, data reliability and compliance with expected performance (that is to say validation);
  • Implements and monitors standard operating procedures for the use of these systems;
  • Ensures that the design of these systems allows changing of data so that the changes are documented and that no entered data is deleted (that is to say, keeps an audit trail of data and changes);
  • Implements and monitors a security system that prevents unauthorized access to data;
  • Maintains a list of persons authorized to modify the data;
  • Performs appropriate backup copies of data;
  • Preserve the unbeknownst, if any (e.g. during data entry and data processing);
  • Ensures that the personal data processing carried out in the framework of the research are made under the conditions defined by Law No. 78-17 of 6 January 1978 referred to above and regulations made thereunder and, where applicable, the decision of the national Commission for Data Protection and liberties of January 5, 2006 on approval of a personal data processing methodology undertaken in the course of biomedical research.

If data are transformed during processing, it should always be possible to compare data and original observations and data after transformation. « (2)

I hope this article will help you to see more clearly in the profession of Data Manager. If you are Data Manager, share your experience in the comments. Yes if you’re CRA and you have questions, do not hesitate to let us know!

References:
Figure 1: http://www.acadm.fr/pages/metier-formation/qui-est-le-data-manager.html

Figure 2: http://www.recherchecliniquepariscentre.fr/wp-content/uploads/2012/12/gestion-bdd_cours_20121111_FGN.pdf

Figure 3: unknown

{:}

Si tu as aimé cet article, je te remercie de « liker » ou de partager avec tes collègues et amis Attaché de Recherche Clinique :)

9 Comments

  • Vanessa Montanari dit :

    Bonjour, Est ce que tu as essayé d’investiguer pour savoir pourquoi tu n’as pas encore de poste de stage ou d’emploi pour le moment (les raisons de fond : CV, Lettre de motivation, profil, recherche, motivation ?). Il me semble prématuré après 4 mois de tout laisser tomber pour faire une formation de data manager. Si tu n’as pas encore trouvé tes freins, il est possible que cela se reproduise après la formation de data manager.
    Je ne suis pas spécialiste du data management, il difficile pour moi de te diriger.

    A bientôt,

    Vanessa

  • Sylvie dit :

    Bonjour,
    Je travaille actuellement en tant que data manager mais je n’ai pas de formation spécifique, simplement une formation pour un logiciel et je souhaiterais acquérir des connaissances, notamment pour me permettre d’être plus mobile. Etant en poste, j’ai essayé de trouver une formation à distance mais sans succès. Auriez-vous des idées ?
    Par ailleurs, j’ai trouvé les références d’un livre qui me parait très complet sur le Data management dans les études cliniques. Le titre est : « Practical Guide to Clinical Data Management, Third Edition » de Susanne Prokscha. Le connaissez-vous ?
    Merci d’avance pour vos réponses.
    Bien à vous,

    Sylvie

  • Anissa dit :

    Bonjour,

    Je suis actuellement à la recherche d’une formation de Data Manager. J’en ai trouvé deux pour l’instant : Absilon et Formatis.
    Je souhaiterai savoir si quelqu’un a suivi cette formation dans l’un de ses établissements.
    Pour la lettre de demande de financement que je dois adressé à Pôle Emploi, il me faudrait des témoignages qui appuient le fait qu’il y a des postes à la sortie de la formation comme l’atteste ces établissements.
    Merci d’avance,

    Anissa

  • M ALLAPITCHAI dit :

    Bonjour Vanessa,

    En effet j,ai déjà travaillé en Clinical Data Management en INDE , mais je voudrais aussi très intéresser de travailler dans le même métier ici en France, Actuellement je travaille dans une laboratoire d’environnement du coup pour avoir le travail, est-ce que il faut obliger faire une formation de équivalence ou je peux postuler directement pour le poste de CDM?

    • Vanessa Montanari dit :

      Bonjour,

      Je ne suis pas experte de ce métier, vous pouvez tenté en postulant directement au CRO, si cela ne fonctionne pas, alors vous pouvez faire une équivalence.

      Merci

      Vanessa

  • Martin dit :

    bnj merci pour ce post, j ai une question , quelles sont les languages de programmation que je dois metriser pour ce job?

    • Vanessa Montanari dit :

      Bonjour,

      Aucun en particulier, il me semble, le data manager n’est pas un informaticien…contactez une école pour en avoir le cœur net.

      Bon courage,

      Vanessa

  • Reyhan dit :

    Bonjour Vanessa,
    Merci pour ce blog.

    Je possede le niveau PhD dans le domaine de biologie moléculaire et je veux m’orienter vers la Recherche Clinique.

    Est-ce que en faisant la formation de « clinical data manager » je peux trouver un poste ou il faut que je commence par la formation ARC et après avoir experience je peux m’orienter ver s le data management?

    Je vous remercie de votre retour.

    Cordialement.

Laisser un commentaire