Gesundheit Allgemein

AI-Proteinvorhersagetool AlphaFold3 jetzt als Open Source verfügbar

AlphaFold3 ist endlich verfügbar. Sechs Monate nachdem Google DeepMind kontrovers den Code eines Papers über das Proteinstrukturvorhersagemodell zurückgehalten hat, können Wissenschaftler nun den Software-Code herunterladen und das künstliche Intelligenz-Tool für nicht-kommerzielle Anwendungen nutzen, wie das in London ansässige Unternehmen am 11. November mitteilte.

„Wir sind sehr gespannt, was die Menschen damit machen“, sagt John Jumper, der das AlphaFold-Team bei DeepMind leitet und letzten Monat zusammen mit CEO Demis Hassabis einen Teil des Chemie-Nobelpreises 2024 gewann für ihre Arbeit an dem KI-Tool.

Im Gegensatz zu seinen Vorgängern ist AlphaFold3 in der Lage, Proteine in Kombination mit anderen Molekülen zu modellieren. Anstatt den zugrunde liegenden Code freizugeben – wie es bei AlphaFold2 der Fall war – stellte DeepMind den Zugang über einen Webserver bereit, der die Anzahl und Art der Vorhersagen, die Wissenschaftler treffen konnten, einschränkte.

Kritisch ist, dass der AlphaFold3-Server es Wissenschaftlern nicht erlaubte, vorherzusagen, wie Proteine in Gegenwart potenzieller Medikamente reagieren. Doch nun bedeutet DeepMinds Entscheidung, den Code freizugeben, dass akademische Wissenschaftler solche Interaktionen vorhersagen können, indem sie das Modell selbst betreiben.

Das Unternehmen gab zunächst an, dass die Bereitstellung von AlphaFold3 nur über einen Webserver den richtigen Ausgleich zwischen dem Zugang für Forschung und dem Schutz kommerzieller Ambitionen darstelle. Isomorphic Labs, ein Spin-off von DeepMind in London, wendet AlphaFold3 in der Arzneimittelforschung an.

Allerdings zog die Veröffentlichung von AlphaFold3 ohne seinen Code oder Modellgewichte – Parameter, die durch die Schulung der Software auf Proteinstrukturen und anderen Daten gewonnen wurden – Kritik von Wissenschaftlern auf sich, die sagten, dieser Schritt untergrabe die Reproduzierbarkeit. DeepMind zog schnell die Konsequenzen und sagte, dass innerhalb eines halben Jahres eine Open-Source-Version des Tools verfügbar gemacht wird.

Jeder kann nun den AlphaFold3-Software-Code herunterladen und ihn nicht kommerziell nutzen. Derzeit haben jedoch nur Wissenschaftler mit akademischer Zugehörigkeit auf Antrag Zugang zu den Trainingsgewichten.

Zugängliche Versionen

DeepMind hat Konkurrenz: In den letzten Monaten haben mehrere Unternehmen Open-Source-Tools zur Vorhersage von Proteinstrukturen auf Basis von AlphaFold3 vorgestellt, die sich auf in dem ursprünglichen Paper beschriebenen Spezifikationen, bekannt als Pseudocode, stützen.

Zwei chinesische Unternehmen – der Technologieriese Baidu und der TikTok-Entwickler ByteDance – haben ihre eigenen von AlphaFold3 inspirierten Modelle herausgebracht, ebenso wie ein Start-up in San Francisco, Kalifornien, namens Chai Discovery.

Ein wesentlicher Nachteil dieser Modelle ist, dass keines von ihnen, wie AlphaFold3, für kommerzielle Anwendungen wie die Arzneimittelforschung lizenziert ist, sagt Mohammed AlQuraishi, ein Computerbiologe an der Columbia University in New York City. Das Modell von Chai Discovery, Chai-1, kann jedoch über einen Webserver für solche Arbeiten verwendet werden, erklärt Jack Dent, Mitgründer des Unternehmens.

Eine weitere Firma, Ligo Biosciences aus San Francisco, hat eine beschränkungsfreie Version von AlphaFold3 veröffentlicht. Diese verfügt jedoch noch nicht über das volle Spektrum an Funktionen, einschließlich der Fähigkeit, Medikamente und Moleküle anderer Art als Proteine zu modellieren.

Andere Teams arbeiten an Versionen von AlphaFold3, die ohne solche Einschränkungen verfügbar sind: AlQuraishi hofft, noch in diesem Jahr ein vollständig Open-Source-Modell namens OpenFold3 anbieten zu können. Dies würde es Pharmaunternehmen ermöglichen, ihre eigenen Versionen des Modells mithilfe proprietärer Daten, wie zum Beispiel den Strukturen von Proteinen, die an verschiedene Medikamente gebunden sind, neu zu trainieren, was potenziell die Leistung steigern könnte.

Offenheit zählt

Im vergangenen Jahr gab es einen Ansturm neuer biologischer KI-Modelle von Unternehmen mit unterschiedlichen Ansätzen zur Offenheit. Anthony Gitter, ein Computerbiologe an der University of Wisconsin-Madison, hat kein Problem damit, dass kommerzielle Unternehmen in sein Feld eintreten – solange sie beim Teilen ihrer Arbeiten in Fachzeitschriften und Preprint-Servern die gleichen Regeln befolgen wie andere Wissenschaftler.

Wenn DeepMind in einer wissenschaftlichen Veröffentlichung Ansprüche über AlphaFold3 erhebt, „erwarte ich, dass sie auch Informationen darüber teilen, wie die Vorhersagen gemacht wurden, und die KI-Modelle sowie den Code so bereitstellen, dass wir sie prüfen können“, fügt Gitter hinzu. „Meine Gruppe wird keine Werkzeuge nutzen, die wir nicht überprüfen können.“

Die Tatsache, dass bereits mehrere Replikationen von AlphaFold3 entstanden sind, zeigt, dass das Modell reproduzierbar war, auch ohne Open-Source-Code, sagt Pushmeet Kohli, der Leiter von AI for Science bei DeepMind. Er fügt hinzu, dass er sich in Zukunft mehr Diskussionen über die Publikationsnormen in einem Bereich wünscht, der zunehmend von akademischen und unternehmerischen Forschern bevölkert wird.

Die Open-Source-Natur von AlphaFold2 führte zu einem Innovationsschub von anderen Wissenschaftlern. Zum Beispiel verwendeten die Gewinner eines jüngsten Wettbewerbs zur Proteinmodellierung das KI-Tool, um neue Proteine zu entwerfen, die an ein Krebsziel binden können. Jumper’s Lieblings-Hack von AlphaFold2 stammt von einem Team, das das Tool nutzte, um ein wichtiges Protein zu identifizieren, das Spermien hilft, sich an Eizellen zu heften.

Jumper kann es kaum erwarten, welche Überraschungen nach der Veröffentlichung von AlphaFold3 auftauchen – selbst wenn sie nicht immer erfolgreich sind. „Die Leute werden es auf seltsame Weise nutzen“, sagt er voraus. „Manchmal wird es scheitern und manchmal wird es erfolgreich sein.“

Daniel Wom

Daniel Wom ist ein renommierter Webentwickler und SEO-Experte, der in der digitalen Welt eine beeindruckende Karriere aufgebaut hat. Als Betreiber mehrerer Blogs und Online-Magazine erreicht er jeden Monat mehr als 1 Million begeisterte Leser. Sein unermüdlicher Einsatz für Qualität im Web und seine Fähigkeit, die neuesten Trends und Entwicklungen im Webdesign und in der digitalen Kommunikation vorherzusehen und sich daran anzupassen, haben ihn zu einer angesehenen Persönlichkeit in der Branche gemacht.

Ähnliche Artikel