Data Scientist EU4HEALTH

Référence du poste : DATA-CDD-2025-06

Publié le 12 novembre 2025
Cette offre vous intéresse ?

Nous rejoindre

Vous avez envie de faire carrière au sein d'un organisme public qui a pour mission de  protéger efficacement la santé des populations ? Rejoignez-nous.

Présentation de l'agenceAfficherMasquer

Santé publique France est l’agence nationale de santé publique française. Etablissement public de l’Etat sous tutelle du ministre chargé de la santé créé par l’ordonnance 2016-246 du 15 avril 2016, elle intervient au service de la santé des populations. Agence scientifique et d’expertise du champ sanitaire, elle a pour missions :

  1. L'observation épidémiologique et la surveillance de l'état de santé des populations ;
  2. La veille sur les risques sanitaires menaçant les populations ;
  3. La promotion de la santé et la réduction des risques pour la santé ;
  4. Le développement de la prévention et de l'éducation pour la santé ;
  5. La préparation et la réponse aux menaces, alertes et crises sanitaires ;
  6. Le lancement de l'alerte sanitaire.

L’agence est organisée autour de directions scientifiques et transversales et de directions assurant le support et le soutien à l’activité.
Son programme de travail, arrêté par son Conseil d’administration, s’articule autour de cinq axes prioritaires : les déterminants de santé, les populations, les pathologies, les interventions et les territoires, et les infrastructures.

AffectationAfficherMasquer

Direction Appui, Traitements et Analyses des données

Description du posteAfficherMasquer

Missions

La personne recrutée est rattachée à la Direction de la DATA et exerce ses activités de manière transversale en lien avec les autres directions de l’agence (DMI, DMNTT, DAF, DSI) et les partenaires du consortium du projet (CHU, Bordeaux Population Health Research Center, Health Data Hub, EHESP).

La personne recrutée participera activement à l’évolution et au suivi de la centralisation des indicateurs du projet Orchidée, notamment à travers la conception, le développement et l’amélioration continue d’un Dashboard dédié. Elle assurera la collecte, la consolidation et l’analyse des données en étroite collaboration avec les data scientists de la DATA et la DSI, tout en garantissant la qualité et la cohérence des informations. En lien direct avec les partenaires du projet — les CHU associés, le Health Data Hub et le Bordeaux Population Health Research Center — elle contribuera à l’identification et à la mise en oeuvre des évolutions du système, qu’elles soient fonctionnelles, techniques ou méthodologiques. Ses responsabilités incluront l’animation des échanges avec les parties prenantes, la rédaction de spécifications et de documentations, ainsi que la proposition d’améliorations pour optimiser l’outil et son utilisation.

Activités

Sous l’autorité du directeur de la DATA, la personne recrutée sera en charge des activités suivantes :

  • Construire et maintenir une base de données structurée, consolidant les indicateurs issus des CHU partenaires.
  • Automatiser les processus de mise à jour du jeu de données centralisé pour garantir la fraîcheur et la disponibilité des données.
  • Garantir la qualité, la cohérence et la traçabilité des données via des processus de nettoyage et de validation.
  • Réaliser des analyses centralisées des indicateurs clés du projet Orchidée.
  • Concevoir, déployer et maintenir des outils de reporting automatisés (rapports, dashboards) pour restituer les résultats et leur mise à disposition en open data.
  • Participer activement aux réunions de travail et aux ateliers techniques avec les parties prenantes (CHU, Health Data Hub, Bordeaux Population Health Research Center) pour identifier les besoins, recueillir les retours et prioriser les évolutions du système.
  • Rédiger des notes méthodologiques détaillant les traitements réalisés, les choix techniques et les bonnes pratiques pour assurer la reproductibilité, la transparence et la continuité de l’activité.
  • Participer à la valorisation scientifique des travaux du projet (rédaction d’articles, communications, participation à des conférences) et contribuer à la diffusion des résultats auprès de la communauté scientifique.

Ces activités s’intègrent dans un environnement technique dynamique et collaboratif, mobilisant des outils de développement modernes, des langages adaptés à la science des données, et des infrastructures de calcul performantes. Le data scientist évoluera au sein d’une équipe pluridisciplinaire, en interaction étroite avec des épidémiologistes, data scientists, statisticiens, ingénieurs et membres de la DSI ainsi que le RSSI.

Les principaux outils et technologies mobilisés incluent :

  • Langages : R, Python ;
  • Visualisation : Framework Shiny (R et Python), Superset ;
  • Environnement collaboratif : GitLab (versionning, intégration continue, gestion des issues) ;
  • Automatisation et orchestration : Apache Airflow (déploiement, supervision des workflows) ;
  • Environnements de développement : VS Code, RStudio, IA Mistral.