Neue Publikation zum Thema Machine Learning

08.06.2020

Anwendungen des Machine Learnings für Massenspektrometrie-basierte Metabolomik

Autoren: Ulf W. Liebal, An N. T. Phan, M alvika Sudhakar, Karthik Raman and Lars M. Blank 

Das Metabolom eines Organismus hängt von Umweltfaktoren und intrazellulärer Regulation ab und liefert Informationen über physiologischen Bedingungen. Die Metabolomik hilft Krankheitsverläufe im klinischen Umfeld zu verstehen oder die Überproduktion von Metaboliten für das Metabolic Engineering einzuschätzen. Die beliebteste analytische Metabolomik-Plattform ist die Massenspektrometrie (MS). Die Analyse von MS-Metabolomdaten ist jedoch kompliziert, da die Metaboliten nichtlinear interagieren und die Datenstrukturen selbst komplex sind. Methoden des maschinellen Lernens sind für die statistische Analyse aufgrund der inhärenten nichtlinearen Datendarstellung und der Fähigkeit, große und heterogene Daten schnell zu verarbeiten, immens populär geworden. In diesem Review wurde sich mit den jüngsten Entwicklungen bei der Verwendung des maschinellen Lernens zur Verarbeitung von MS-Spektren befasst und gezeigt, wie maschinelles Lernen neue biologische Erkenntnisse generiert. Insbesondere das Überwachte maschinelle Lernen hat in der Metabolomik-Forschung ein großes Potenzial, da es quantitative Vorhersagen liefern kann. Hier werden hier häufig verwendete Werkzeuge wie Random Forest, Support-Vector-Machines, künstliche neuronale Netze und genetische Algorithmen besprochen. Während der Verarbeitungsschritte helfen die überwachten Methoden des maschinellen Lernens bei der Spitzenauslese, der Normalisierung und der Imputation fehlender Daten. Für die wissensbasierte Analyse trägt das maschinelle Lernen zur Erkennung, Klassifizierung und Regression von Biomarkern, zur Identifizierung biochemischer Pfade und zur Bestimmung des Kohlenstoffflusses bei. Von wichtiger Bedeutung ist die Kombination verschiedener Omics-Daten, um die Beiträge der verschiedenen regulatorischen Ebenen zu identifizieren. Der Überblick über die jüngsten Veröffentlichungen macht auch deutlich, dass die Datenqualität die Qualität der Analyse bestimmt, aber auch die Herausforderung, das richtige Modell für die Daten zu wählen, erhöht. Maschinelle Lernmethoden, die bei der MS-basierten Metabolomik angewandt werden, erleichtern die Datenanalyse und können klinische Entscheidungen unterstützen, Metabolic Engineering anleiten und grundlegende biologische Entdeckungen stimulieren.

 

https://doi.org/10.3390/metabo10060243