Un cadre d’apprentissage machine peut distinguer les molécules produites par des processus biologiques de celles formées par des processus non biologiques et pourrait être utilisé pour analyser les échantillons rapportés par les missions planétaires actuelles et futures. José C. Aponte,
Amirali Aghazadeh et leurs collègues ont analysé huit météorites carbonées et dix échantillons géologiques terrestres en utilisant la chromatographie en phase gazeuse bidimensionnelle couplée à la spectrométrie de masse à temps de vol haute résolution. En utilisant ces données, les auteurs ont développé LifeTracer, un cadre computationnel qui traite les données de spectrométrie de masse et applique l’apprentissage machine pour identifier les modèles distinguant les origines abiotiques des origines biotiques.
Un modèle de régression logistique entraîné sur des caractéristiques au niveau des composés a atteint une précision de plus de 87 % dans la classification des échantillons comme météoritiques ou terrestres. L’analyse a identifié 9 475 pics dans les échantillons de météorites et 9 070 dans les échantillons terrestres, avec des différences statistiquement significatives entre les deux types d’échantillons dans les distributions de poids moléculaire et les temps de rétention, qui décrivent le temps que prend le composé pour traverser les deux colonnes du chromatographe. Les composés organiques dans les échantillons de météorites ont montré des temps de rétention significativement plus bas, cohérents avec une volatilité plus élevée dans les matériaux formés de manière abiotique.
Le cadre a identifié les hydrocarbures aromatiques polycycliques et leurs variantes alkylées comme des caractéristiques prédictives clés, avec le naphtalène émergeant comme le composé le plus prédictif pour les échantillons abiotiques. Selon les auteurs, l’approche permet une détection de biosignatures évolutive et non biaisée et pourrait être un outil puissant pour interpréter les mélanges organiques complexes qui seront rapportés par les missions actuelles et futures de retour d’échantillons planétaires.
Article : Discriminating abiotic and biotic organics in meteorite and terrestrial samples using machine learning on mass spectrometry data – Journal : PNAS Nexus – DOI : 10.1093/pnasnexus/pgaf334












