Thèse Année : 2025

Rewinding the Clock of Evolution : Confronting the Limits of Modeling to Reconstruct Diversification Histories from Phylogenies and Fossils

Remonter l’horloge de l’évolution : surmonter les limites de la modélisation pour reconstruire des histoires de diversification à partir de phylogénies et de fossiles

Résumé

Understanding the diversification of life requires robust models that integrate both phylogenetic and fossil data. However, current models face several limitations, including non-identifiability, biases in fossil sampling, and computational constraints. This thesis aims to examine these limitations in detail and propose new methodological tools that can more reliably explore the processes shaping the history of life on Earth. One important problem in diversification studies is non-identifiability, when multiple evolutionary histories produce identical likelihoods given a phylogeny of extant species. To address this, a new method is introduced that flexibly explores the set of congruent diversification histories and selects the most parsimonious ones. This approach further validates that Bayesian inference with regularizing priors offers a robust framework for inferring rate variation. The second part of this thesis introduces the Occurrence Birth-Death Diffusion (OBDD) model, which integrates fossil occurrences beyond those placed in phylogenies while estimating lineage-specific speciation and extinction rates. Efficient inference is achieved by leveraging Bayesian data augmentation techniques. Applying the OBDD model to cetaceans, a group with a rich fossil record and substantial rate heterogeneity, shows that excluding fossils leads to an underestimation of past diversity and diversification rates. The findings demonstrate the importance of fossils, including fossil occurrences, in reconstructing clade richness trajectories and extinction dynamics. The third part applies these methods to planktonic foraminifera, a group of marine mocroorganisms with an extensive fossil record and rich genetic data. This analysis first quantifies the geographical, ecological, and geological drivers of heterogeneity in fossil sampling before applying the newly developed tools to study diversification patterns in this group. The final discussion brings together these findings to propose a framework for diversification studies that balances model flexibility, computational efficiency, and uncertainty quantification. While these advances improve our ability to reconstruct evolutionary histories, the thesis also highlights persistent modeling difficulties, particularly the trade-offs with model complexity, the limitations of fossil data integration, and the computational demands of Bayesian approaches. These methodological considerations and the contributions of this thesis extend beyond evolutionary biology, with potential applications in epidemiological phylodynamics.

Comprendre la diversification du vivant nécessite des modèles robustes intégrant à la fois les données phylogénétiques et fossiles. Cependant, les modèles actuels présentent plusieurs limites notables, notamment des problèmes d'identifiabilité, des biais dans l'échantillonnage des fossiles et des contraintes computationnelles. Cette thèse vise à examiner ces limitations en détail et à proposer de nouveaux outils méthodologiques permettant d'explorer de manière plus fiable les processus ayant façonné l'histoire de la vie sur Terre. Un problème clé dans les analyses de diversification est l'absence d'identifiabilité, lorsque plusieurs histoires évolutives distinctes produisent des vraisemblances identiques à partir d'une phylogénie d'espèces actuelles. Pour y remédier, une nouvelle méthode est introduite, permettant d'explorer de manière flexible l'ensemble des histoires de diversification congruentes et de sélectionner les plus parcimonieuses. Cette approche valide également que l'inférence bayésienne avec des priors régularisants constitue un cadre robuste pour estimer la variation des taux de diversification. La deuxième partie de cette thèse introduit le modèle Occurrence Birth-Death Diffusion (OBDD), qui intègre les occurrences fossiles ne pouvant être placées dans les phylogénies, tout en estimant des taux de spéciation et d'extinction variant le long des lignées. Une inférence efficace est obtenue grâce à l'utilisation de techniques d'augmentation de données Bayésienne. L'application du modèle OBDD aux cétacés, un groupe présentant un riche registre fossile et une forte hétérogénéité des taux d'évolution, montre que l'exclusion des fossiles conduit à une sous-estimation de la diversité passée et des taux de diversification. Ces résultats soulignent l'importance des fossiles, y compris des occurrences fossiles, dans la reconstruction des trajectoires de richesse et des dynamiques d'extinction des clades étudiés. La troisième partie applique ces méthodes aux foraminifères planctoniques, un groupe de microorganismes marins possédant un registre fossile exceptionnellement complet ainsi que de riches données génétiques. Cette analyse commence par quantifier les facteurs géographiques, écologiques et géologiques influençant l'hétérogénéité de l'échantillonnage fossile, avant d'appliquer les outils développés dans cette thèse pour étudier les modèles de diversification de ce groupe. La discussion finale synthétise ces résultats et propose un cadre méthodologique pour l'étude de la diversification, conciliant flexibilité des modèles, efficacité computationnelle et quantification des incertitudes. Bien que ces avancées améliorent notre capacité à reconstruire les histoires évolutives, cette thèse souligne également les difficultés méthodologiques persistantes, notamment les compromis liés à la complexité des modèles, les limites de l'intégration des données fossiles et les exigences computationnelles des approches Bayésiennes. Ces considérations méthodologiques et les contributions de cette thèse dépassent le domaine de la biologie évolutive et présentent des applications potentielles en phylodynamique épidémiologique.

Fichier principal
Vignette du fichier
156156_ANDREOLETTI_2025_archivage.pdf (57.48 Mo) Télécharger le fichier
Origine Version validée par le jury (STAR)

Dates et versions

tel-05330493 , version 1 (24-10-2025)

Identifiants

  • HAL Id : tel-05330493 , version 1

Citer

Jérémy Andréoletti. Rewinding the Clock of Evolution : Confronting the Limits of Modeling to Reconstruct Diversification Histories from Phylogenies and Fossils. Populations and Evolution [q-bio.PE]. Sorbonne Université, 2025. English. ⟨NNT : 2025SORUS237⟩. ⟨tel-05330493⟩
0 Consultations
0 Téléchargements

Partager

  • More