Výzkumníci UVA Health vyvíjejí nový nástroj pro pokrok v genomice a výzkumu nemocí
Výzkumníci UVA Health vyvinuli důležitý nový nástroj, který pomáhá vědcům rozlišovat signály od hluku při studiu genetických příčin rakoviny a dalších nemocí. Kromě pokroku ve výzkumu a potenciálního urychlení nových léčebných postupů by nový nástroj mohl pomoci zlepšit diagnostiku rakoviny tím, že lékařům usnadní detekci rakovinných buněk. Nový nástroj, který vyvinul Chongzhi Zang, PhD, UVA a jeho tým a spolupracovníci, je matematickým modelem, který pomůže zajistit integritu „velkých dat“ o stavebních kamenech našich chromozomů, genetickém materiálu zvaném chromatin. Chromatin –…

Výzkumníci UVA Health vyvíjejí nový nástroj pro pokrok v genomice a výzkumu nemocí
Výzkumníci UVA Health vyvinuli důležitý nový nástroj, který pomáhá vědcům rozlišovat signály od hluku při studiu genetických příčin rakoviny a dalších nemocí. Kromě pokroku ve výzkumu a potenciálního urychlení nových léčebných postupů by nový nástroj mohl pomoci zlepšit diagnostiku rakoviny tím, že lékařům usnadní detekci rakovinných buněk.
Nový nástroj, který vyvinul Chongzhi Zang, PhD, UVA a jeho tým a spolupracovníci, je matematickým modelem, který pomůže zajistit integritu „velkých dat“ o stavebních kamenech našich chromozomů, genetickém materiálu zvaném chromatin. Chromatin – kombinace DNA a proteinu – hraje důležitou roli při řízení aktivity našich genů. Když se chromatin pokazí, může proměnit zdravou buňku v rakovinu nebo přispět k dalším onemocněním.
Elektronická kniha Genetika a genomika
Kompilace top rozhovorů, článků a novinek za poslední rok. Stáhněte si bezplatnou kopii
Vědci nyní mohou studovat chromatin v jednotlivých buňkách pomocí špičkové technologie zvané jednobuněčné ATAC-seq, ale to produkuje obrovské množství dat, včetně velkého šumu a zkreslení. Zangův nový nástroj to překoná a ušetří vědce od falešných vodítek a zbytečného úsilí.
V nejlepších dobách je rozsáhlý genomický výzkum jednotlivých buněk jako „hon za jehlou v kupce sena,“ říká Zang. Ale jeho nový nástroj to hodně usnadní tím, že odklidí spoustu špatného sena.
Při tradičním způsobu analýzy dat můžete vidět některé vzory, které vypadají jako skutečné signály určitého stavu chromatinu, ale jsou nepravdivé kvůli zaujatosti samotné experimentální technologie. Takové falešné signály mohou vědce zmást. Vyvinuli jsme model pro lepší zachycení a odfiltrování takových falešných signálů, aby skutečná jehla, kterou hledáme, mohla snadněji vyčnívat ze sena.“
Chongzhi Zang, PhD, počítačový biolog v UVA centru pro genomiku veřejného zdraví a UVA zdravotním centru pro rakovinu
O nástroji genomiky
Zangův nový nástroj adaptuje model z teorie čísel a kryptologie nazvaný „simplexní kódování“. On a jeho kolegové toho využili ke kódování sekvencí DNA do matematických forem a nakonec převedli složitou sekvenci genomu do mnohem jednodušší matematické formy. Poté můžete porovnávat různé tvary a detekovat zkreslení a šum v sekvenčních datech, které nelze snadno nalézt pomocí tradičních přístupů.
"Složitost sekvencí DNA se exponenciálně zvyšuje, jak se prodlužují. Je obtížné je modelovat, protože typický soubor dat obsahuje miliony sekvencí z tisíců buněk," řekl Shengen Shawn Hu, PhD, výzkumník v Zangově laboratoři a hlavní autor této práce. "Jednoduchý model kódování však může poskytnout přesný odhad zkreslení sekvence díky své krásné matematické vlastnosti."
Testy tohoto nástroje ukázaly, že je výrazně lepší při analýze komplexních jednobuněčných dat k charakterizaci různých typů buněk. To je důležité jak pro základní biologický výzkum, tak pro diagnostiku onemocnění, kde lékaři potřebují detekovat nepatrná množství chorobných buněk v mnohem větších vzorcích, od desítek tisíc až po miliony buněk.
"Zkreslení nebylo snadné najít, protože byly protkány skutečnými signály a skryty ve velkém množství dat. Možná by to nebyl velký problém, kdyby lidé vybrali ty nejsilnější signály z velkého počtu buněk," řekl Zang. který nedávno spoluvedl několik dalších jednobuněčných genomických výzkumů studujících onemocnění koronárních tepen a vývoj střev. "Ale když se podíváte na data z jedné buňky, už tam není žádné ovoce s nízkou úrovní. Signály jsou na úrovni jednotlivých buněk vždy slabé a účinky šumu a zkreslení mohou být katastrofální. Korekce zkreslení je často ignorována, ale může být klíčová při analýze dat z jedné buňky."
Aby byl jejich nový nástroj široce dostupný, výzkumníci vyvinuli bezplatný software s otevřeným zdrojovým kódem a umístili jej online. Software lze nalézt na https://github.com/zang-lab/SELMA a při https://doi.org/10.5281/zenodo.7048767.
"Doufáme, že tento nástroj může být přínosem pro biomedicínskou výzkumnou komunitu při studiu biologie a genomiky chromatinu a nakonec podpoří výzkum nemocí," řekl Zang. "Vždy je vzrušující vidět, jak naši kolegové používají nástroje, které vyvíjíme, k důležitým vědeckým objevům ve svém vlastním výzkumu."
Výsledky zveřejněny
Své výsledky vědci zveřejnili v časopise Nature Communications. (Článek je otevřený přístup, což znamená zdarma ke čtení.) Tým se skládal z Shengen Shawn Hu, Lin Liu, Qi Li, Wenjing Ma, Michael J. Guertin, Clifford A. Meyer, Ke Deng, Tingting Zhang a Chongzhi Zang.
Zang je součástí UVA oddělení věd o veřejném zdraví, biochemie a molekulární genetiky a biomedicínského inženýrství. Ústav biomedicínského inženýrství je spoluprací UVA School of Medicine a School of Engineering.
Práce byla podpořena granty National Institutes of Health R35GM133712, K22CA204439 a R35GM128635; Národní vědecká nadace, grant NSF-796 2048991; University of Pittsburgh Center for Research Computing; Centrum pro rakovinu UVA; a National Cancer Institute of NIH, Cancer Center Support Grant P30 CA44579.
Zdroj:
Zdravotnický systém University of Virginia
Odkaz:
Hu, SS, a kol. (2022) Vnitřní odhad zkreslení pro vylepšenou analýzu profilů dostupnosti hromadného a jednobuněčného chromatinu pomocí SELMA. Komunikace přírody. doi.org/10.1038/s41467-022-33194-z.
.