Technologie

Das Shortstop des Salk Institute revolutioniert die genetische Suche

Proteine halten das Leben so, wie wir es kennen, und dienen vielen wichtigen strukturellen und funktionellen Rollen im gesamten Körper. Diese großen Moleküle haben jedoch einen langen Schatten über eine kleinere Unterklasse von Proteinen bezeichnet, die als Mikroproteine bezeichnet werden.

Mikroproteine sind in den 99% der DNA verloren gegangen, die als „nicht kodierend“ in riesigen, dunklen Strecken unerforschter genetischer Code ignoriert wurden. Aber obwohl sie klein und schwer fassbar sind, sind ihre Auswirkungen möglicherweise genauso groß wie größere Proteine.

Das Salk Institute -Wissenschaftler erforschen nun die mysteriöse dunkle Seite des Genoms auf der Suche nach Mikroproteinen. Mit ihrem neuen Tool -Shortstop können Forscher genetische Datenbanken untersuchen und DNA -Strecken im Genom identifizieren, das wahrscheinlich für Mikroproteine kodiert.

Wichtig ist, dass Shortstop auch voraussagt, welche Mikroproteine am wahrscheinlichsten biologisch relevant sind und Zeit und Geld auf der Suche nach Mikroproteinen sparen, die an Gesundheit und Krankheit beteiligt sind.

Shortstop beleuchtet vorhandene Datensätze ein neues Licht und zeigt Mikroproteine, die früher unmöglich zu finden waren. Tatsächlich hat das Salk-Team das Tool bereits verwendet, um einen Lungenkrebs-Datensatz zu analysieren, um 210 völlig neue Mikroprotein-Kandidaten zu finden-mit einem herausragenden validierten Mikroprotein-das kann in Zukunft gute therapeutische Ziele erreichen.

Die Ergebnisse wurden in veröffentlicht in BMC -Methoden Am 31. Juli 2025.

Die meisten Proteine in unserem Körper sind bekannt, aber jüngste Entdeckungen deuten darauf hin, dass wir Tausende kleiner, versteckter, von Proteine miteinander verbundener Mikroproteine, die von übersehenen Regionen unseres Genoms kodiert wurden. Wissenschaftler untersuchten lange Zeit die Regionen der DNA, die für große Proteine kodiert und den Rest als „Junk -DNA“ abgetan haben, aber wir erfahren nun, dass diese anderen Regionen tatsächlich sehr wichtig sind und die von ihnen produzierten Mikroproteine kritische Rolle bei der Regulierung von Gesundheit und Krankheiten spielen könnten. „

Alan Saghatelian, Senior Autor und Professor des Studie, Salk Institute

Mehr über Mikroproteine

Es ist schwierig, Mikroproteine zu erkennen und zu katalogisieren, was hauptsächlich auf ihre Größe ist. Im Vergleich zu Standardproteinen, die von Hunderten bis Tausenden von Aminosäuren langen können, enthalten Mikroproteine typischerweise weniger als 150 Aminosäuren, was es schwieriger macht, mit Standard -Protein -Analysemethoden nachzuweisen. Anstatt nach den Mikroproteinen selbst zu suchen, suchen Wissenschaftler große, öffentlich verfügbare Datensätze nach DNA -Sequenzen, die sie herstellen.

Wissenschaftler haben jetzt erfahren, dass bestimmte DNA -Strecken als kleine offene Leserahmen bezeichnet werden (SMORFS) kann die Anweisungen zur Herstellung von Mikroproteinen enthalten. Aktuelle experimentelle Methoden haben bereits Tausende von Smorfs katalogisiert, aber diese Tools bleiben zeitaufwändig und teuer. Darüber hinaus hat ihre Unfähigkeit, potenziell funktionelle Mikroproteine von nicht funktionsfähigen Mikroproteinen zu trennen, ihre Entdeckung und Charakterisierung gestaltet.

Wie Shortstop funktioniert

Nicht alle Smorfs führen zu biologisch bedeutsamen Mikroproteinen. Bestehende Methoden können nicht zwischen funktionellen und nicht funktionsfähigen Mikroprotein-erzeugenden SMORFs unterscheiden. Dies bedeutet, dass Wissenschaftler jedes Mikroprotein unabhängig testen müssen, um festzustellen, ob es funktionsfähig ist oder nicht.

Shortstop verändert diesen Workflow radikal und optimiert die SMORF -Entdeckung, indem Mikroproteine in funktionelle und nicht funktionierende Kategorien sortiert werden. Der Schlüssel zur zweiklasse-Sortierung von Shortstop ist, wie es als maschinelles Lernsystem trainiert wird. Das Training basiert auf einem negativen Steuerungsdatensatz von computergenerierten zufälligen SMORFs. Shortstop vergleicht gefundene SMORFs mit diesen Lockvögeln, um schnell zu entscheiden, ob ein neuer SMORF wahrscheinlich funktionell oder nicht funktionsfähig ist.

ShortStop kann nicht definitiv sagen, ob ein SMORF ein biologisch relevantes Mikroprotein codiert, aber dieses Zwei-Klassen-System verengt den experimentellen Pool immens. Jetzt können Forscher weniger Zeit damit verbringen, Datensätze manuell zu sortieren und an der Bank zu versagen.

Als die Forscher Shortstop auf einen zuvor veröffentlichten SMORF-Datensatz anwendeten, identifizierten sie 8% als wahrscheinliche funktionelle Mikroproteine und priorisierten sie für gezielte Follow-up. Dies beschleunigt die Mikroproteincharakterisierung, indem sie Sequenzen herausfiltern, die unwahrscheinlich biologische Relevanz haben. ShortStop konnte auch Mikroproteine identifizieren, die mit anderen Methoden übersehen wurden, einschließlich eines, die durch nachgewiesene menschliche Zellen und Gewebe bestätigt wurden.

„Shortstop ist besonders leistungsfähig, dass es mit gängigen Datentypen wie RNA -Sequenzierungsdatensätzen funktioniert, die viele Labors bereits verwenden“, sagt der erste Autor Brendan Miller, ein Postdoktorandenforscher in Saghatelian’s Lab. „Dies bedeutet, dass wir nun im Maßstab nach Mikroproteinen in gesunden und erkrankten Geweben suchen können, was neue Einblicke in die menschliche Biologie aufzeigt und neue Wege zur Diagnose und Behandlung von Krankheiten wie Krebs und Alzheimer -Krankheit freischaltet.“

Shortstop -Spots -Mikroprotein, die mit Lungenkrebs assoziiert sind

Die Forscher haben bereits Shortstop verwendet, um ein Mikroprotein zu identifizieren, das bei Lungenkrebstumoren hochreguliert war. Sie analysierten genetische Daten aus menschlichen Lungentumoren und angrenzendem normalem Gewebe, um eine Liste potenzieller funktioneller Smorfs zu erstellen. Unter den gefundenen SMORFS-Shortstop wurde ein Out-it im Tumorgewebe als in normalem Gewebe exprimiert, was darauf hindeutet

Die Identifizierung dieses lungenkrebsbedingten Mikroproteins zeigt den Wert von Shortstop und maschinellem Lernen, um Kandidaten für zukünftige Forschung und therapeutische Entwicklung zu priorisieren.

„Es gibt so viele Daten, die bereits vorhanden sind, dass wir jetzt mit Shortstop verarbeiten können, um neue Mikroproteine zu finden, die mit Gesundheit und Krankheit verbunden sind und sich von Alzheimer bis Fettleibigkeit und darüber hinaus erstrecken“, sagt Saghatelian. „Mein Team ist wirklich gut darin, Methoden herzustellen, und mit Daten von anderen Salk -Fakultäten können wir diese Methoden integrieren und die Wissenschaft beschleunigen.“


Quellen:

Journal references:

Miller, B., et al. (2025). ShortStop: a machine learning framework for microprotein discovery. BMC Methods. doi.org/10.1186/s44330-025-00037-4

 

Daniel Wom

Daniel Wom ist ein renommierter Webentwickler und SEO-Experte, der in der digitalen Welt eine beeindruckende Karriere aufgebaut hat. Als Betreiber mehrerer Blogs und Online-Magazine erreicht er jeden Monat mehr als 1 Million begeisterte Leser. Sein unermüdlicher Einsatz für Qualität im Web und seine Fähigkeit, die neuesten Trends und Entwicklungen im Webdesign und in der digitalen Kommunikation vorherzusehen und sich daran anzupassen, haben ihn zu einer angesehenen Persönlichkeit in der Branche gemacht. In unserem Portal ist er der führende Kopf hinter dem Import und der Analyse der neuesten Studien.

Ähnliche Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert