Offre de stage de Master 2

Offre de stage de Master 2

Deep learning pour l’analyse d’images 4D (espace + temps) de microscopie confocale de la déconstruction de biomasses végétales

Contexte

La production de biomolécules de 2e génération (issues de la biomasse lignocellulosique, BL) est un domaine avec un fort potentiel à travers l’avènement d’une bioéconomie soutenable. Divers procédés biotechnologiques sont utilisés pour la conversion de la lignocellulose. L’approche standard implique un prétraitement initial de la BL, suivi d'une hydrolyse enzymatique, appelée saccharification. L'un des principaux défis pour améliorer la libération des sucres fermentescibles est de comprendre et surmonter la résistance de la BL à la déconstruction, connue sous le nom de récalcitrance, qui contribue de manière significative aux coûts élevés des produits dérivés de la BL.

Alors que de nombreux efforts de recherche ont permis d’identifier divers marqueurs de récalcitrance à l'échelle nanométrique, la pertinence et l'importance de l'étude quantitative de l'hydrolyse enzymatique à des échelles plus grandes, cellulaires et tissulaires, n’ont été démontrées que récemment. En particulier, le laboratoire FARE a développé un pipeline d'imagerie 4D (espace+temps) incluant la microscopie confocale de fluorescence et des outils innovants de traitement d'images pour suivre et quantifier la déconstruction de la paroi cellulaire à ces échelles. Un des principaux défis de l’analyse quantitative de la déconstruction de la BL, à partir d’images de microscopie 4D, est la segmentation précise et le suivi des cellules individuelles, notamment à cause de la perte de l’intégrité des parois cellulaires au cours de ce procédé. Ces dernières années, le Deep Learning (DL) a surpassé les techniques conventionnelles de traitement d'images dans des tâches telles que la segmentation et le suivi d'objets. Cela est en particulier dû au fait que les approches traditionnelles de segmentation d'images nécessitent un réglage des paramètres spécifiques à l'expérience, tandis que les modèles de DL sont adaptatifs et entraînables.

Forts de ce constat, nous proposons d’utiliser des modèles de DL à l’aide de Réseaux de Neurones Convolutifs (CNN), pour les étapes de segmentation et de suivi des cellules.

Mission du stagiaire

L’objectif est de capitaliser les séquences obtenues à partir des images 3D acquises à différents temps de l’hydrolyse enzymatique, pour chacun des échantillons de BL analysés. Nous avons déjà développé un pipeline de segmentation des cellules de BL basé sur le modèle PyTorch 3D U-Net de (Wolny 2020) et vérifié son efficacité sur les images pré-hydrolyse de biomasses de peuplier. Cependant, l’utilisation de modèles basés sur le DL pour l’analyse de l’hydrolyse enzymatique fait face à la même difficulté que les algorithmes classiques : les cellules ne peuvent pas être clairement séparées à cause de la déconstruction des tissus végétaux de la BL. La mission de la personne recrutée consiste à implémenter un pipeline basé sur le DL, pour la segmentation d’images 4D, qui conserve sa pertinence au cours de l’hydrolyse enzymatique.

Dans ce cadre, le premier objectif consiste à propager la segmentation pré-hydrolyse enzymatique (DL) au cours du temps en utilisant les transformations (non DL) qui permettent de passer de l’image initiale aux images correspondantes aux temps suivants, voir (Refahi 2024). Le second objectif consiste à utiliser des modèles de DL à la fois pour segmenter les images et pour propager la segmentation d’un temps donné au temps suivant. Le suivi des cellules à l’aide du DL est alors obtenu en entraînant des modèles basés sur des CNN, avec pour entrée la segmentation au temps courant et pour sortie la segmentation au temps suivant (Zargari 2023).

Il est à noter que ce stage participera à une meilleure exploitation des séquences 4D de l’hydrolyse enzymatique sur différentes typologies de biomasses et différents prétraitements des biomasses en lien avec le projet FillingGaps. A terme, ces caractérisations structurales pourront être combinées et liées aux caractérisations chimiques, dans une approche innovante, permettant d’étudier l’efficacité de saccharification de BL contrastées.

Références :

Refahi Y, Zoghlami A, Viné T, Terryn C, Paës G, 2024. Plant cell wall enzymatic deconstruction: bridging the gap between micro and nano scales. Bioresour Technol 414, 131551

Wolny A, Cerrone L, Vijayan A, Tofanelli R, Barro AV, et al, 2020. Accurate and versatile 3D segmentation of plant tissues at cellular resolution. eLife 9, e57613

Zargari A, Lodewijk GA, Mashhadi N, Cook N, Neudorf CW, et al, 2023. DeepSea is an efficient deep-learning model for single-cell segmentation and tracking in time-lapse microscopy. Cell Reports Methods 3(6), 100500

Mots clés

Lignocellulose, caractérisation, lignine, microscopie, fluorescence, traitement d’images, deep learning

Formation et compétences requises

Étudiant en dernière année d’école d’ingénieur ou en Master 2, spécialisé en IA, deep learning ou mathématiques appliquées. Maîtrise des langages de programmation Python, expérience avec des frameworks de deep learning (PyTorch, TensorFlow), connaissances sur le traitement d’images 3D.

Rigueur et organisation, écoute, capacité à travailler en équipe, en interactions avec plusieurs personnes et à s’intégrer rapidement dans un collectif de recherche, rendre compte des résultats et les communiquer sont des compétences nécessaires pour réaliser la mission dans les meilleures conditions.

Adresse du laboratoires d’accueil

UMR FARE, 2 esplanade Roland Garros, 51100 Reims, https://fare.nancy.hub.inrae.fr/

Durée du contrat

6 mois, embauche dès que possible (à partir du 1er février 2026), poste basé à Reims.

Gratification

Environ 630 € net/mois

Responsables et contacts

Dr Ali Faraj, ali.faraj@inrae.fr

Dr Yassin Refahi, antoine.refahi@inrae.fr

Pour candidater

Envoyer votre CV et lettre de motivation aux responsables ci-dessus.

Date limite de candidature : 21/11/2025