Nature: Neue Studie nutzt künstliche Intelligenz, um den Code der Genregulation zu knacken

Dec 29, 2023

Eine Nachricht hinterlassen

Organismen bestehen aus Tausenden verschiedener Proteine, von denen jedes von einem bestimmten Gen kodiert wird. Damit ein Zelltyp seine einzigartige Identität, Form und Funktion erhält, müssen Gene durch „Enhancer“ aktiviert werden. Wissenschaftler versuchen schon lange, den Code zu knacken, der die Funktionsweise von Enhancern erklärt. In einer neuen Studie haben das Labor von Alexander Stark am Institut für Molekulare Pathologie des Vienna Biocenter in Österreich und das Labor von Eileen Furlong am Europäischen Labor für Molekularbiologie nun Genomik und künstliche Intelligenz eingesetzt, um einen zweiten genetischen Code zu knacken, nämlich den, der der Genregulation zugrunde liegt. Das Papier mit dem Titel „Gezieltes Design synthetischer Enhancer für ausgewählte Gewebe im Drosophila-Embryo“ wurde am 12. Dezember 2023 online in Nature veröffentlicht.
Jede gesunde Zelle eines komplexen Organismus enthält genau dieselbe Kopie des Genoms, das Tausende von Genen enthält, die Baupläne für den Aufbau von Proteinen. Um unterschiedliche Zelltypen, Gewebe und Organe zu bilden, sind zusätzliche Mechanismen erforderlich, um die Expression bestimmter Gene mit hoher Präzision ein- und auszuschalten.
Als DNA-Abschnitte im Genom sind Enhancer ein Schlüsselelement bei der Aktivierung von Genen. Das Stark-Labor hat es sich zur Aufgabe gemacht, den Code zu knacken, der die DNA-Sequenz eines Enhancers mit seiner genregulatorischen Funktion verbindet. Obwohl die ersten Enhancer bereits in den frühen 1980er Jahren entdeckt wurden, haben Wissenschaftler erst im letzten Jahrzehnt Methoden entwickelt, um Enhancer experimentell zu identifizieren.
Auf dieser Grundlage arbeiten das Stark-Labor und seine Mitarbeiter nun an drei Aufgaben, die zusammen ein scheinbar unmögliches langfristiges Ziel darstellen: Vorhersage der Aktivität von Enhancern auf der Grundlage ihrer DNA-Sequenzen; Vorhersage der Folgen von Enhancer-Mutationen; und Entwicklung von Enhancern von Grund auf für bestimmte Gewebe. Mit anderen Worten: Lesen, Verstehen und Schreiben eines zweiten genetischen Codes.
Mit den jüngsten Fortschritten in der Genomik und künstlichen Intelligenz bietet sich die Möglichkeit, diesen Code zu knacken. Diese Autoren haben ein leistungsstarkes Deep-Learning- und Transfer-Learning-Modell entwickelt und es mit einer großen Menge an Daten trainiert, die aus früheren Studien an Drosophila melanogaster gewonnen wurden, einem weit verbreiteten Modellorganismus in der Entwicklungsbiologie.
Vom Labor zur KI und wieder zurück
Zunächst wurden solche Modelle mit genomweiten DNA-Sequenzen und entsprechenden DNA-Zugänglichkeitsdaten trainiert. Anschließend wurde das Deep-Learning-Modell verwendet, um die Feinabstimmung des Migrationslernmodells zu initialisieren, bei der das Migrationslernmodell lernt, DNA-Sequenzen direkt mit spezifischer Enhancer-Aktivität zu verknüpfen.
Stark sagt: „Migrationslernen kann man so erklären: Stellen Sie sich vor, Sie möchten ein Modell trainieren, um Katzen auf Bildern zu erkennen, aber Ihnen stehen nur sehr wenige Katzenbilder zur Verfügung. Dafür haben Sie viele Hundebilder. Sie trainieren also zunächst ein KI-Modell anhand der Hundebilder, optimieren es dann im zweiten Schritt und schon können Sie Katzen erkennen.“

news-836-394

Bild aus Nature, 2023, doi:10.1038/s41586-023-06905-9.
Durch Transferlernen konnte das Modell die Enhancer-Aktivität in fünf Gewebetypen in Drosophila-Embryonen vorhersagen – dem zentralen Nervensystem, Gehirnunterteilen, Epidermis, Darm und Muskel.
Aufbauend auf dieser Vorhersage verlegten die Autoren ihre Forschungsanstrengungen aus der abstrakten Welt der Big Data und der künstlichen Intelligenz zurück auf den Labortisch. Mithilfe hochentwickelter molekularbiologischer Werkzeuge testeten sie 40 computergestützt entwickelte synthetische Enhancer an lebenden Drosophila-Embryonen. Tatsächlich sind diese Enhancer aktiv und steuern die Genexpression im Zielgewebe.
„Die Fähigkeit, synthetische Enhancer mit spezifischen Eigenschaften zu konstruieren, bietet beispiellose Möglichkeiten, die gezielte Expression von Genen zu kontrollieren“, sagt Bernardo de Almeida vom Vienna Biocenter, Erstautor der Studie. „Zukünftige Anwendungen könnten in der synthetischen Biologie oder Gentherapie liegen, wo präzises Design und Manipulation von Genexpressionsmustern eine Grundvoraussetzung ist.“
Für Stark ist es jedoch das Wichtigste an dieser Forschung, neue Einblicke in ein Phänomen zu liefern, das für das Leben von grundlegender Bedeutung ist: „Vor etwa 60 Jahren haben Wissenschaftler herausgefunden, wie der erste genetische Code funktioniert, wie der molekulare Bauplan der DNA in Proteine ​​übersetzt wird. Mit der Kraft der Genomik und künstlicher Intelligenz ist es uns nun gelungen, den zweiten genetischen Code des Lebens zu knacken, nämlich wie die Genaktivität gesteuert wird.“
Anfrage senden