Développement et application de méthodes de traitement automatique des langues sur les causes médicales de décès pour la santé publique

Publié le 12 novembre 2019
Mis à jour le 26 février 2024

Introduction - Les causes médicales sont renseignées par les médecins sur les certificats de décès en texte libre avec une grande variété d'expressions. Les méthodes de traitement automatique des langues (TAL) permettent d'envisager leur exploitation dans des délais courts. Cet article décrit la démarche retenue pour développer ces méthodes et illustre leur utilisation pour l'alerte sanitaire. Méthodes - L'identification des méthodes performantes s'inscrit dans le cadre d'un challenge international. Celui-ci consiste à transmettre aux équipes participantes un corpus de données, comprenant le texte libre et les codes CIM-10 considérés comme le gold standard, pour développer leur outil de prédiction des codes CIM-10, et à évaluer indépendamment les performances des outils sur un jeu de test. Certaines méthodes ont été utilisées pour la classification des causes en texte libre dans des regroupements pertinents pour la surveillance réactive de la mortalité. Résultats - Les meilleurs résultats ont été obtenus à l'aide de réseaux de neurones sur le corpus américain et avec des méthodes à base de règles sur le corpus français. Une méthode mixte, incluant des règles et de la classification par support vector machine (SVM), a produit des résultats meilleurs ou proches sur les deux corpus. L'analyse de l'évolution temporelle de quatre regroupements de causes pour la surveillance réactive de la mortalité a mis en évidence des événements attendus (épidémies) et inhabituels. Discussion - L'expérience du challenge et l'application pour la surveillance à visée d'alerte montrent l'apport et la performance des méthodes de TAL pour appuyer l'exploitation réactive des données de mortalité pour la santé publique.

Auteur : Robert Aude, Baghdadi Yasmine, Zweigenbaum Pierre, Morgand Claire, Grouin Cyril, Lavergne Thomas, Névéol Aurélie, Fouillet Anne, Rey Grégoire
Bulletin épidémiologique hebdomadaire, 2019, n°. 29-30, p. 603-609