Offre de stage M2 à BIOEPAR

Offre de stage M2 à BIOEPAR

Approches statistiques et apprentissage automatique pour le phénotypage des boiteries bovines : application à la seime longitudinale interne.

Offre de stage M2 – début 2026

INTITULE DU STAGE  

Approches statistiques et apprentissage automatique pour le phénotypage des boiteries bovines : application à la seime longitudinale interne

 

Contexte et problématique :

Les boiteries sont devenues une problématique majeure en élevage bovin laitier, avec près d’une vache sur quatre atteinte, ce qui réduit leur longévité et affecte leur santé, leur bien-être, ainsi que l’économie et la qualité de vie des éleveurs. Près de 90% des cas de boiteries sont dus à des lésions en région digitale. Parmi elles, la seime longitudinale interne (SLI), caractérisée par une fissuration de la corne de la muraille axiale, est particulièrement douloureuse et difficile à traiter.
Les pédicures bovins de l’Est de la France, notamment dans les zones à forte proportion de vaches Montbéliardes, rapportent une augmentation de la fréquence des SLI ces dernières années. Une étude exploratoire menée récemment dans cette région a montré que près de 90 % des troupeaux et 9 % des vaches parés présentaient chaque année une SLI de niveaux 2 ou 3, c’est-à-dire de sévérité suffisante pour provoquer une boiterie. Ces niveaux d’incidence étaient comparables, voire supérieurs, à ceux des lésions classiquement reconnues comme majeures (ulcères de la sole, dermatite digitale, ouverture de la ligne blanche).
De plus, une forte variabilité intra-troupeau (jusqu’à 27% des animaux affectés), avec des fluctuations saisonnières d’incidence, suggère que certains facteurs liés aux animaux (génétiques, morphologiques) ou aux pratiques d’élevage (alimentation, logement, gestion du parage, etc.), voire aux conditions climatiques, influencent l’apparition de cette lésion. Pourtant, les études spécifiques sur la SLI sont rares, et il n’existe pas aujourd’hui de recommandations permettant d’orienter les pratiques ou la sélection génétique pour mieux la prévenir.
Dans ce projet, la SLI sera considérée comme un phénotype de santé animale à part entière, dont l’expression résulte de l’interaction entre les caractéristiques individuelles (génétiques, morphologiques) et les conditions de conduite d’élevage (alimentation, environnement, gestion). L’approche proposée permettra ainsi un phénotypage intégré, associant la mesure fine des lésions aux facteurs qui en conditionnent l’apparition, afin de mieux comprendre et prévenir cette affection dans les élevages de demain.

Objectifs généraux du stage / Résultats attendus :

Ce stage visera à contribuer à un meilleur phénotypage de la sensibilité à la seime longitudinale interne (SLI), en combinant analyses épidémiologiques et approches statistiques avancées.
Les objectifs principaux sont :
1. Estimer finement l’incidence de la SLI dans des départements de l’Est de la France et sa distribution spatio-temporelle
2. Identifier et hiérarchiser les facteurs de risque associés à la SLI aux différents niveaux (animal, troupeau, voire zone géographique), à partir de données de terrain, d’une analyse bibliographique et d’avis d’experts
3. Comparer plusieurs méthodes statistiques et d’apprentissage automatique pour l’identification des facteurs de risque afin d’évaluer la robustesse des résultats et la pertinence des outils de phénotypage mobilisables en épidémiologie animale.
Les résultats attendus sont donc une description précise de la dynamique des SLI, une identification robuste des facteurs de risque au niveau individuel et troupeau, ainsi qu’une évaluation comparative des différentes méthodes d’analyse testées. Ces résultats contribueront à un meilleur phénotypage de la sensibilité à cette lésion, en vue de son intégration future dans des stratégies de prévention ou de sélection en élevage.

Données disponibles :

Pour répondre à ces objectifs, un fichier de données regroupant les informations de parage collectées entre le 1er janvier 2021 et le 31 décembre 2024 dans 6 départements (Ain, Doubs, Jura, Haute-Marne, Haute-Saône et Territoire de Belfort) a déjà été constitué. Il rassemble les données de 309 élevages et plus de 20 000 animaux. À ce premier fichier ont été intégrées des informations issues du contrôle laitier individuel et troupeau, fournissant des données sur différents facteurs de risque à l’échelle de l’animal et du troupeau (race, index génétique de synthèse de santé podale, index élémentaires de résistance aux lésions podales, parité, date de naissance, date de vêlage, taille de troupeau, etc.). Une première étude menée l’an passé a permis la constitution de cette base (sélection des individus et nettoyage des données) et la réalisation de premiers résultats descriptifs sur l’incidence au cours du temps.

ACTIVITES DOMINANTES CONFIEES AU STAGIAIRE :

- Réalisation d’une revue bibliographique ciblée sur les boiteries bovines et la seime longitudinale interne, incluant l’identification des facteurs de risque déjà décrits et des approches de modélisation utilisées en épidémiologie animale
- Prise en main, gestion et structuration des bases de données existantes (nettoyage, codage des variables, gestion des valeurs manquantes, préparation pour analyses statistiques)
- Analyse descriptive des données (incidence, distribution selon le temps, les départements/régions)
- Identification et hiérarchisation des facteurs de risque (appui bibliographique, avis d’experts, élaboration éventuelle d’un graphe orienté acyclique – DAG)
- Mise en oeuvre et comparaison de plusieurs méthodes d’analyse : modèles statistiques classiques (régressions logistiques mixtes), modèles bayésiens, méthodes d’apprentissage automatique (ex. XGBoost ou équivalent). Le choix des méthodes et de la démarche à utiliser pourra être modifié/complété par l’étudiant.e
- Validation et comparaison des approches (validation croisée, analyses de sensibilité, comparaison des résultats entre méthodes)
- Valorisation des résultats : rédaction d’un rapport de stage, présentation orale dans les équipes (PEP’S et GEN’IATest), contribution à une éventuelle communication scientifique (publication scientifique, poster ou communication orale en congrès)
Une période d’1 à 2 semaines avec des pédicures bovins de l’Est sera proposée pour que l’étudiant.e se familiarise avec les lésions podales et les méthodes de récolte des données.

PROFIL REQUIS 

- Connaissances : connaissances solides en épidémiologie et biostatistiques, intérêt pour la santé et le bien-être animal, en particulier en élevage bovin
- Compétences opérationnelles : gestion de données et programmation en R, capacités rédactionnelles, esprit critique, rigueur, autonomie. Une première expérience en analyse bayésienne et en méthodes de machine learning serait un plus mais n’est pas indispensable.
- Langues : français/anglais
- Permis de conduire (le cas échéant) : non nécessaire

AVANTAGES PROPOSES (le cas échéant) 

- logement : pris en charge lors de déplacements
- restauration : pris en charge lors de déplacements
- transport : frais de déplacements pris en charge selon les grilles INRAE
- indemnisation de stage : entre 500€ et 600€ environ (en fonction du nombre de jours travaillés par mois)

CO-ENCADREMENT SCIENTIFIQUE ET TECHNIQUE

Partenaire 1 : Anne LEHEBEL – ingénieur de recherche en analyse de données INRAE – UMR BIOEPAR
Partenaire 2 : Anne RELUN – Enseignante-Chercheuse en médecine bovine à Oniris – UMR BIOEPAR
Partenaire 3 : Anaël CASSARD – Responsable du service pédicure de GEN’IATest

CONTACT DU RESPONSABLE SCIENTIFIQUE

Nom et fonction du responsable scientifique à contacter : Anne LEHEBEL – Ingénieure de recherche en analyses de données
Adresse : Oniris site de la Chantrerie, CS40706, 44307 Nantes
Tél. : 02 40 68 78 06
Site web (équipe et/ou projet) : https://bioepar.angers-nantes.hub.inrae.fr/equipes/peps-sante-des-troupeaux-sante-publique2
Email : anne.lehebel@inrae.fr

DATES DU STAGE : 01/2026 à 06/2026 (les dates sont légèrement modulables au besoin)

LIEU DU STAGE : UMR BIOEPAR – Oniris/INRAE Site de la Chantrerie, CS40706, 44307 Nantes