Výskumníci UVA Health vyvíjajú nový nástroj na pokrok v oblasti genomiky a výskumu chorôb
Výskumníci UVA Health vyvinuli dôležitý nový nástroj, ktorý pomáha vedcom rozlíšiť signály od hluku pri štúdiu genetických príčin rakoviny a iných chorôb. Okrem pokroku vo výskume a potenciálneho urýchlenia nových liečebných postupov by nový nástroj mohol pomôcť zlepšiť diagnostiku rakoviny tým, že lekárom uľahčí detekciu rakovinových buniek. Nový nástroj, ktorý vyvinul Chongzhi Zang, PhD, UVA a jeho tím a spolupracovníci, je matematickým modelom, ktorý pomôže zabezpečiť integritu „veľkých údajov“ o stavebných kameňoch našich chromozómov, genetickom materiáli nazývanom chromatín. Chromatín –…

Výskumníci UVA Health vyvíjajú nový nástroj na pokrok v oblasti genomiky a výskumu chorôb
Výskumníci UVA Health vyvinuli dôležitý nový nástroj, ktorý pomáha vedcom rozlíšiť signály od hluku pri štúdiu genetických príčin rakoviny a iných chorôb. Okrem pokroku vo výskume a potenciálneho urýchlenia nových liečebných postupov by nový nástroj mohol pomôcť zlepšiť diagnostiku rakoviny tým, že lekárom uľahčí detekciu rakovinových buniek.
Nový nástroj, ktorý vyvinul Chongzhi Zang, PhD, UVA a jeho tím a spolupracovníci, je matematickým modelom, ktorý pomôže zabezpečiť integritu „veľkých údajov“ o stavebných kameňoch našich chromozómov, genetickom materiáli nazývanom chromatín. Chromatín – kombinácia DNA a proteínu – hrá dôležitú úlohu pri riadení aktivity našich génov. Keď sa chromatín pokazí, môže zmeniť zdravú bunku na rakovinu alebo prispieť k iným ochoreniam.
Elektronická kniha Genetika a genomika
Kompilácia top rozhovorov, článkov a noviniek za posledný rok. Stiahnite si bezplatnú kópiu
Vedci teraz môžu študovať chromatín v jednotlivých bunkách pomocou špičkovej technológie nazývanej jednobunkové ATAC-seq, čo však produkuje obrovské množstvo údajov vrátane množstva šumu a skreslenia. Zangov nový nástroj to prekoná a ušetrí vedcov pred falošnými stopami a zbytočným úsilím.
V najlepších časoch je rozsiahly genomický výskum jednotlivých buniek ako „hľadanie ihly v kope sena,“ hovorí Zang. Ale jeho nový nástroj to značne uľahčí tým, že odpratá veľa zlého sena.
Pri tradičnom spôsobe analýzy údajov môžete vidieť niektoré vzory, ktoré vyzerajú ako skutočné signály určitého chromatínového stavu, ale sú nepravdivé kvôli zaujatosti samotnej experimentálnej technológie. Takéto falošné signály môžu vedcov zmiasť. Vyvinuli sme model na lepšie zachytenie a odfiltrovanie takýchto falošných signálov, aby sa skutočná ihla, ktorú hľadáme, ľahšie odlíšila od sena.“
Chongzhi Zang, PhD, počítačový biológ v UVA Centre pre genomiku verejného zdravia a UVA Health Cancer Center
O nástroji genomiky
Nový nástroj Zang adaptuje model z teórie čísel a kryptológie nazývaný „simplexné kódovanie“. On a jeho kolegovia to použili na kódovanie sekvencií DNA do matematických foriem a nakoniec previedli komplexnú sekvenciu genómu do oveľa jednoduchšej matematickej formy. Potom môžete porovnať rôzne tvary, aby ste zistili skreslenie a šum v sekvenčných údajoch, ktoré nie je ľahké nájsť pomocou tradičných prístupov.
"Zložitosť sekvencií DNA rastie exponenciálne, keď sa predlžujú. Je ťažké ich modelovať, pretože typický súbor údajov obsahuje milióny sekvencií z tisícok buniek," povedal Shengen Shawn Hu, PhD, výskumník v Zangovom laboratóriu a hlavný autor tejto práce. "Jednoduchý model kódovania však môže poskytnúť presný odhad sekvenčných skreslení vďaka svojej krásnej matematickej vlastnosti."
Testy nástroja ukázali, že bol výrazne lepší pri analýze komplexných jednobunkových údajov na charakterizáciu rôznych typov buniek. To je dôležité tak pre základný biologický výskum, ako aj pre diagnostiku chorôb, kde lekári potrebujú odhaliť malé množstvo chorobných buniek v oveľa väčších vzorkách, od desiatok tisíc až po milióny buniek.
"Nebolo ľahké nájsť deformácie, pretože boli pretkané skutočnými signálmi a skryté vo veľkom množstve údajov. Možno by to nebol veľký problém, keby ľudia vybrali len najsilnejšie signály z veľkého počtu buniek," povedal Zang. ktorý nedávno spoluviedol niekoľko ďalších jednobunkových genomických výskumov študujúcich ochorenie koronárnych artérií a vývoj čriev. "Keď sa však pozriete na údaje o jednej bunke, už tam nie je žiadne ovocie, ktoré by viselo na nízkej úrovni. Signály sú na úrovni jednotlivých buniek vždy slabé a účinky šumu a skreslenia môžu byť katastrofálne. Korekcia odchýlky sa často ignoruje, ale pri analýze údajov s jednou bunkou môže byť rozhodujúca."
Aby bol ich nový nástroj široko dostupný, vedci vyvinuli bezplatný softvér s otvoreným zdrojovým kódom a umiestnili ho online. Softvér nájdete na https://github.com/zang-lab/SELMA a pri https://doi.org/10.5281/zenodo.7048767.
"Dúfame, že tento nástroj môže byť prínosom pre biomedicínsku výskumnú komunitu pri štúdiu biológie a genomiky chromatínu a v konečnom dôsledku podporí výskum chorôb," povedal Zang. "Vždy je vzrušujúce vidieť, ako naši kolegovia používajú nástroje, ktoré vyvíjame, aby dosiahli dôležité vedecké objavy vo svojom vlastnom výskume."
Výsledky zverejnené
Svoje výsledky vedci zverejnili v časopise Nature Communications. (Článok má otvorený prístup, čo znamená, že si ho môžete prečítať zadarmo.) Tím tvorili Shengen Shawn Hu, Lin Liu, Qi Li, Wenjing Ma, Michael J. Guertin, Clifford A. Meyer, Ke Deng, Tingting Zhang a Chongzhi Zang.
Zang je súčasťou oddelení UVA vied o verejnom zdraví, biochémie a molekulárnej genetiky a biomedicínskeho inžinierstva. Katedra biomedicínskeho inžinierstva je spoluprácou UVA School of Medicine a School of Engineering.
Práca bola podporená grantmi Národného inštitútu zdravia R35GM133712, K22CA204439 a R35GM128635; Národná vedecká nadácia, grant NSF-796 2048991; University of Pittsburgh Center for Research Computing; Centrum pre rakovinu UVA; a National Cancer Institute of NIH, Cancer Center Support Grant P30 CA44579.
Zdroj:
Zdravotnícky systém University of Virginia
Referencia:
Hu, SS, a kol. (2022) Vnútorný odhad skreslenia pre vylepšenú analýzu profilov dostupnosti objemového a jednobunkového chromatínu pomocou SELMA. Komunikácia prírody. doi.org/10.1038/s41467-022-33194-z.
.