Die Gruppe von Caixia Gao am Institut für Genetik und Entwicklungsbiologie der Chinesischen Akademie der Wissenschaften hat den Einsatz von KI-gestützter Strukturvorhersage vorangetrieben, eine tertiärstrukturbasierte Proteinclustermethode entwickelt und diese auf ein neues Deaminase-Mining-System erweitert sowie eine Reihe neuartiger Basenbearbeitungstools mit unabhängigen chinesischen geistigen Eigentumsrechten entwickelt. Diese Arbeit bietet eine neuartige Strategie für die Proteinfunktionsanalyse und das Mining neuer funktioneller Elemente. Das neu entwickelte Basenbearbeitungssystem verfügt über unabhängige chinesische geistige Eigentumsrechte für die Präzisionsgenbearbeitungstechnologie (PCT-Erfindungspatent angemeldet). Die entsprechenden Forschungsergebnisse wurden in Cell veröffentlicht.
Proteine sind die Hauptträger aller Lebensvorgänge. Die funktionale Gruppierung von Proteinen ist ein wichtiges Mittel zur Erforschung der physiologischen Prozesse, an denen sie beteiligt sind, und zur Entwicklung neuer Proteine usw. Bestehende Methoden gruppieren Proteine hauptsächlich auf Grundlage der Ähnlichkeit der primären Aminosäuresequenzen und verwenden diese, um auf ihre Funktionen und evolutionären Beziehungen zu schließen. Die Funktion eines Proteins wird jedoch durch seine dreidimensionale räumliche Struktur bestimmt, und die Entwicklung von Hochdurchsatzmethoden zur Proteingruppierung auf Grundlage dreidimensionaler Strukturen wird ein direkteres und zuverlässigeres Mittel zur Erforschung der Proteinfunktion bieten und die funktionale Erforschung unbekannter Proteine fördern.
Baseneditierungssysteme können DNA oder RNA mit Einzelnukleotidpräzision präzise editieren, was eine bahnbrechende Technologie für die Genfunktionsforschung, Krankheitsbehandlung und biologische Züchtung darstellt. Die Kernkomponenten bestehender Baseneditierungssysteme, die Deaminasen, stammen jedoch aus einer einzigen Familie, was zu vielen Einschränkungen der Baseneditierung führt und die Bearbeitung den Anforderungen vielfältiger Anwendungen immer noch schwer gerecht wird. Daher ist es besonders wichtig, neuartige Deaminasen innovativ zu erforschen und neue Baseneditierungstools für verschiedene Anwendungsszenarien zu entwickeln.
Zur Lösung der oben genannten Probleme verwendete die Forschungsgruppe von Caixia Gao auf innovative Weise KI-gestützte Proteinstrukturvorhersagen im großen Maßstab, um eine neue Hochdurchsatzmethode für die Proteinclusterung auf Basis der Tertiärstruktur zu entwickeln, eine gründliche Analyse der Funktionsstruktur von Desaminasen durchzuführen, völlig neue Chassis-Elemente zu identifizieren, die sich von den bekannten Desaminase-Werkzeugenzymen unterscheiden, und eine Reihe neuartiger Werkzeuge zur Basenbearbeitung mit eigenen geistigen Eigentumsrechten zu entwickeln.
Die Forscher führten eine umfangreiche 3D-Strukturvorhersage von repräsentativen funktionellen Sequenzen von Deaminasen mit dem Proteinstrukturvorhersagemodell AlphaFold2 durch und führten darüber hinaus einen innovativen, auf 3D-Strukturen basierenden Mehrfachvergleich und Clustering von Proteinen durch, um die potenziellen Deaminasen in 20 verschiedene Zweige zu klassifizieren. Zusätzlich zu der gemeldeten APOBEC/AID-Cytosin-Deaminase wurden fünf strukturell und sequenziell neuartige aktive Cytosin-Deaminase-Zweige entdeckt. Unter diesen Zweigen ergab eine weitere strukturelle Clusterung und funktionelle Validierung von Proteinen mit einer DddA-ähnlichen (doppelsträngige DNA-Deaminase-Toxin A-ähnlichen) Desaminierungsdomäne, dass dieser Zweig eine große Zahl von Proteinen mit ausschließlich einzelsträngiger DNA-Deaminierungsaktivität enthält, zusätzlich zu den zuvor hypothetisierten Proteinen mit doppelsträngiger DNA-Deaminierungsaktivität, was das bisherige Wissen über die Funktion dieser Proteinklasse auf den Kopf stellte. Die obige Studie zeigt, dass KI-gestütztes Proteinstruktur-Clustering genauere Ergebnisse liefern kann als die traditionelle Clustering-Methode auf Basis von Aminosäureprimärsequenzen, wenn die Sequenzhomologie der Proteinsammlung gering und die Funktionen unterschiedlich sind. Somit bietet diese Methode eine effiziente und zuverlässige neue Strategie für die Analyse und Gewinnung von Proteinfunktionen.
Basierend auf den Ergebnissen der oben erwähnten weiteren Clusterung identifizierten die Forscher 45 neue Einzelketten-Cytosin-Deaminasen (Sdd) und 13 Doppelketten-Cytosin-Deaminasen (Ddd). Diese Deaminasen sind gegenwärtig die einzigen Deaminasen, die alle prokaryotischen (bakteriellen) Ursprungs sind, während die vorhandenen Mitglieder der APOBEC/AID-Deaminase-Familie alle eukaryotischen Ursprungs sind (hauptsächlich Mensch, Säugetier oder Fisch). Die Forscher entwickelten eine Reihe neuartiger Baseneditorsysteme auf Basis dieser Deaminasen und testeten sie in tierischen und pflanzlichen Zellen. Die Ergebnisse zeigten, dass die neu entwickelten doppelsträngigen Baseneditorsysteme auf Basis der Deaminasen Ddd1 und Ddd9 die Nachteile konventioneller Editoren überwanden, mit signifikant geringerer Editiereffizienz für GC-Sequenzen; die einzelsträngigen Baseneditorsysteme auf Basis von Sdd7 und Sdd3 zeigten eine sehr hohe Editieraktivität und besaßen auch eine beträchtliche Baseneditorfähigkeit in GC-Sequenzen; das auf Sdd6 basierende einzelsträngige Baseneditorsystem zeigte eine extrem hohe Spezifität und nahezu nicht nachweisbare Off-Target-Ereignisse. Die Studie entwickelte darüber hinaus einen neuartigen Sdd6-CBE-Baseneditor, der durch rationales Design und funktionelle Validierung des Proteins von einem einzelnen Adeno-assoziierten Virus (AAV) eingekapselt werden kann, und erreichte eine Editiereffizienz von bis zu 43,1 % in einer Mauszelllinie, wodurch das Problem gelöst wurde, dass herkömmliche Baseneditoren zu groß sind, um von Adenoviruspartikeln übertragen zu werden. Um das seit langem bestehende Problem der geringen Baseneditoreffizienz bei Sojabohnen zu lösen, entwickelte das Team außerdem das Sdd7-CBE-System neu und erhielt 34 stabil editierte Pflanzen mit einer Editiereffizienz von bis zu 22,1 % in 154 Sojabohnen-positiven Setzlingen. Diese Forschung durchbricht den Engpass bei der Anwendung bestehender Desaminasen und zeigt die vielversprechende Anwendung des neuartigen Baseneditorsystems in Medizin und Landwirtschaft.
Die Forschungsarbeit wurde von der National Natural Science Foundation of China, dem National Key Research and Development Program und dem Strategic Pioneer Science and Technology Special Project der Chinesischen Akademie der Wissenschaften unterstützt.