Chargé(e) d’analyse et d’expertise / Data Engineer / Data Scientist (2 postes)

Référence du poste : DATA-CDD-2021-02

Publié le 05 octobre 2021
Cette offre vous intéresse ?

Nous rejoindre

Vous avez envie de faire carrière au sein d'un organisme public qui a pour mission de  protéger efficacement la santé des populations ? Rejoignez-nous.

Présentation de l'agenceAfficherMasquer

Santé publique France est l’agence nationale de santé publique française. Etablissement public de l’Etat sous tutelle du ministre chargé de la santé créé par l’ordonnance 2016-246 du 15 avril 2016, elle intervient au service de la santé des populations. Agence scientifique et d’expertise du champ sanitaire, elle a pour missions :

  1. L'observation épidémiologique et la surveillance de l'état de santé des populations ;
  2. La veille sur les risques sanitaires menaçant les populations ;
  3. La promotion de la santé et la réduction des risques pour la santé ;
  4. Le développement de la prévention et de l'éducation pour la santé ;
  5. La préparation et la réponse aux menaces, alertes et crises sanitaires ;
  6. Le lancement de l'alerte sanitaire.

L’agence est organisée autour de directions scientifiques et transversales et de directions assurant le support et le soutien à l’activité.
Son programme de travail, arrêté par son Conseil d’administration, s’articule autour de cinq axes prioritaires : les déterminants de santé, les populations, les pathologies, les interventions et les territoires, et les infrastructures.

AffectationAfficherMasquer

Direction Appui, Traitements et Analyses des données (DATA)
Unité Applications, big data et surveillance syndromique (ABISS)

Description du posteAfficherMasquer

Missions

Missions de l'unité

Les missions de l’unité « ABISS » s’organisent autour de plusieurs pôles d’activités :

  • le soutien aux directions métiers pour l’accès, l’exploitation et l’analyse des bases de données transverses issues de systèmes de surveillance spécifiques (pour des maladies à notification obligatoire ou non), de la surveillance syndromique, de bases médico-administratives, de référentiels, etc. ;
  • le soutien aux directions métiers pour le développement métier d’applications informatiques : outils de recueil, d’analyse et/ou de restitution de données ;
  • le pilotage du programme de surveillance syndromique (système de surveillance SurSaUD®) ;
  • la mise à disposition des données de l’agence.

L’unité assure une veille méthodologique et technique permettant un soutien de qualité à l’agence ainsi que des permanences hebdomadaires pour assurer la continuité d’activité.

Missions COVID

La pandémie de COVID-19 et l’émergence de variants ont souligné la nécessité de renforcer les activités de surveillance moléculaire, entre autres par séquençage, en soutien des activités de surveillance épidémiologique et virologique des infections à SARS-CoV-2.

En France, cette surveillance moléculaire relève des missions du Centre National de Référence (CNR) Virus des infections respiratoires, et est conduite en lien avec Santé publique France, avec les laboratoires du réseau du CNR et le réseau Sentinelles pour la médecine de ville. Cette surveillance a pour objectif un suivi de l'évolution génétique des virus pour identifier l'émergence et la distribution spatio-temporelle de virus présentant des mutations susceptibles d'avoir des conséquences fonctionnelles, comme par exemple l’infectiosité, la contagiosité, la virulence ou l’échappement immunitaire.

Dans ce cadre, le consortium EMERGEN a notamment pour objectif de déployer sur le territoire national un système de surveillance moléculaire des infections à SARS-CoV-2, et ultérieurement d’autres pathogènes infectieux émergents, pour venir en appui transversal des activités de surveillance microbiologique conduites sous l’égide des CNR et de Santé publique France, et des activités de recherche conduites sous l’égide de l’ANRS Maladies Infectieuses Emergentes. Les objectifs principaux sont de décrire et suivre la circulation des variants déjà connus jusqu’à la maille territoriale la plus fine possible, mais aussi de détecter, identifier et ensuite suivre dans les meilleurs délais la circulation de nouveaux variants d’intérêt (c’est-à-dire ceux ayant des conséquences fonctionnelles, en termes de transmissibilité ou de pathogénicité par exemple).

La personne recrutée aura pour missions principales de traiter les données issues de cette surveillance génomique, à son optimisation, à la construction et à la restitution d’indicateurs épidémiologiques. En parallèle, la personne recrutée pourra être amenée à intervenir en soutien à l’exploitation d’autres bases de données gérées par la DATA.

Activités

Sous l’autorité du responsable d’unité et en lien étroit avec les équipes de la Direction des Maladies Infectieuses, des partenaires du consortium EMERGEN (notamment les plateformes de séquençage et l’Institut Français de Bioinformatique), de la DATA, de la Direction des Systèmes d’Information, les activités du chargé d’analyse et d’expertise seront notamment :

  • Assurer la gestion, le traitement et la restitution des données de la base nationale EMERGEN :
    • Accompagner le système de gestion des données et des pipelines
    • Organiser et préparer les données
    • Identifier les possibilités d'acquisition et d’intégration de nouvelles données
    • Construire les indicateurs de surveillance (définition, implémentation, interprétation) en R, Python, Jupyter Notebook
    • Réaliser des analyses statistiques
    • Développer des restitutions automatisées pour des bilans ou points épidémiologiques (RMarkdown)
    • Développer des outils pour la restitution des indicateurs : mise à disposition internes et externes (exports, API), outils de visualisation (applications R-Shiny – Dash - Bokeh) et de reporting
    • Rédiger des notes méthodologiques pour décrire les traitements réalisés
  • Intervenir en soutien sur la gestion, le traitement, l’analyse et la restitution d’autres bases de données gérées par la DATA, pour la surveillance de l’épidémie de COVID-19 :
    • Appariement avec la base SI-DEP (base des tests biologiques) pour étudier les réinfections confirmées
    • Appariement avec la base Vaccin-Covid (base des vaccinations) pour étudier les échecs vaccinaux confirmés, explorer les mutations associées à ces échecs vaccinaux, en complément des études réalisées par l’ANRS et l’ANSM
  • Contribuer à la détection spatio-temporelle de clusters
  • Contribuer à la réflexion sur la modernisation des outils de data science pour la préparation, l’exploration, le stockage et la restitution des données
  • Contribuer à la valorisation des résultats en lien avec les épidémiologistes et les statisticiens :
    • Communiquer des résultats
    • Rédiger des bulletins, rapports d’études et d’articles scientifiques

La personne recrutée participera à la continuité d’activité au travers des permanences hebdomadaires et des astreintes de week-end sur le périmètre de ses activités dans le cadre de l’épidémie de COVID-19.