UVA Health-forskere utvikler et nytt verktøy for å fremme genomikk og sykdomsforskning
UVA Health-forskere har utviklet et viktig nytt verktøy for å hjelpe forskere med å skille signaler fra støy når de studerer de genetiske årsakene til kreft og andre sykdommer. I tillegg til å fremme forskning og potensielt fremskynde nye behandlinger, kan det nye verktøyet bidra til å forbedre kreftdiagnosen ved å gjøre det lettere for leger å oppdage kreftceller. Det nye verktøyet, utviklet av Chongzhi Zang, PhD, UVA, og hans team og samarbeidspartnere, er en matematisk modell som vil bidra til å sikre integriteten til "store data" om byggesteinene til kromosomene våre, genetisk materiale kalt kromatin. Kromatin – et…

UVA Health-forskere utvikler et nytt verktøy for å fremme genomikk og sykdomsforskning
UVA Health-forskere har utviklet et viktig nytt verktøy for å hjelpe forskere med å skille signaler fra støy når de studerer de genetiske årsakene til kreft og andre sykdommer. I tillegg til å fremme forskning og potensielt fremskynde nye behandlinger, kan det nye verktøyet bidra til å forbedre kreftdiagnosen ved å gjøre det lettere for leger å oppdage kreftceller.
Det nye verktøyet, utviklet av Chongzhi Zang, PhD, UVA, og hans team og samarbeidspartnere, er en matematisk modell som vil bidra til å sikre integriteten til "store data" om byggesteinene til kromosomene våre, genetisk materiale kalt kromatin. Kromatin – en kombinasjon av DNA og protein – spiller en viktig rolle i å kontrollere aktiviteten til genene våre. Når kromatin går galt, kan det gjøre en frisk celle til kreft eller bidra til andre sykdommer.
Genetikk og genomikk e-bok
Sammenstilling av de beste intervjuene, artikler og nyheter fra det siste året. Last ned en gratis kopi
Forskere kan nå studere kromatin i individuelle celler ved hjelp av en banebrytende teknologi kalt single-cell ATAC-seq, men dette produserer en enorm mengde data, inkludert mye støy og forvrengning. Zangs nye verktøy skjærer gjennom det, og redder forskere fra falske spor og bortkastet innsats.
I de beste tider er storstilt genomisk forskning på enkeltceller som å "jake etter en nål i en høystakk," sier Zang. Men det nye verktøyet hans vil gjøre det mye enklere ved å rydde vekk mye dårlig høy.
På den tradisjonelle måten for dataanalyse kan du se noen mønstre som ser ut som virkelige signaler for en bestemt kromatintilstand, men som er falske på grunn av skjevheten til selve den eksperimentelle teknologien. Slike falske signaler kan forvirre forskere. Vi har utviklet en modell for bedre å fange opp og filtrere bort slike falske signaler slik at den virkelige nålen vi leter etter lettere kan skille seg ut fra høyet.»
Chongzhi Zang, PhD, beregningsbiolog ved UVA Center for Public Health Genomics og UVA Health Cancer Center
Om genomikkverktøyet
Zangs nye verktøy tilpasser en modell fra tallteori og kryptologi kalt «simplex coding». Han og kollegene hans brukte dette til å kode DNA-sekvenser til matematiske former og til slutt konvertere den komplekse genomsekvensen til en mye enklere matematisk form. Du kan deretter sammenligne forskjellige former for å oppdage forvrengninger og støy i sekvensdataene som ikke er lett å finne med tradisjonelle tilnærminger.
"Kompleksiteten til DNA-sekvenser øker eksponentielt etter hvert som de blir lengre. De er vanskelige å modellere fordi et typisk datasett inneholder millioner av sekvenser fra tusenvis av celler," sa Shengen Shawn Hu, PhD, en forsker i Zangs laboratorium og hovedforfatter av dette arbeidet. "Men simplex-kodingsmodellen kan gi et nøyaktig estimat av sekvensforvrengninger på grunn av dens vakre matematiske egenskap."
Tester av verktøyet viste at det var betydelig bedre til å analysere komplekse enkeltcelledata for å karakterisere ulike celletyper. Dette er viktig både for grunnleggende biologisk forskning og sykdomsdiagnostikk, der leger må oppdage bittesmå antall sykdomsceller i mye større prøver, alt fra titusenvis til millioner av celler.
"Forvrengningene var ikke enkle å finne fordi de var sammenvevd med ekte signaler og skjult i de store datamengdene. Det ville kanskje ikke være en stor sak hvis folk bare plukket de sterkeste signalene fra et stort antall celler," sa Zang. som nylig ledet flere andre encellede genomiske undersøkelser som studerer koronararteriesykdom og tarmutvikling. "Men når du ser på enkeltcelledata, er det ikke lenger noen lavthengende frukt. Signalene er alltid svake på individcellenivå, og effektene av støy og forvrengning kan være katastrofale. Bias-korreksjon blir ofte ignorert, men kan være avgjørende i enkeltcelledataanalyse."
For å gjøre det nye verktøyet deres allment tilgjengelig utviklet forskerne gratis åpen kildekode-programvare og la den ut på nettet. Programvaren finner du på https://github.com/zang-lab/SELMA og kl https://doi.org/10.5281/zenodo.7048767.
"Vi håper dette verktøyet kan være til nytte for det biomedisinske forskningsmiljøet i å studere kromatinbiologi og genomikk og til slutt støtte sykdomsforskning," sa Zang. "Det er alltid spennende å se hvordan våre kolleger bruker verktøyene vi utvikler for å gjøre viktige vitenskapelige oppdagelser i sin egen forskning."
Resultater publisert
Forskerne publiserte resultatene sine i tidsskriftet Nature Communications. (Artikkelen er åpen, noe som betyr gratis å lese.) Teamet besto av Shengen Shawn Hu, Lin Liu, Qi Li, Wenjing Ma, Michael J. Guertin, Clifford A. Meyer, Ke Deng, Tingting Zhang og Chongzhi Zang.
Zang er en del av UVAs avdelinger for folkehelsevitenskap, biokjemi og molekylær genetikk, og biomedisinsk ingeniørvitenskap. Institutt for biomedisinsk ingeniørfag er et samarbeid mellom UVA School of Medicine og School of Engineering.
Arbeidet ble støttet av National Institutes of Health bevilgninger R35GM133712, K22CA204439 og R35GM128635; National Science Foundation, Grant NSF-796 2048991; University of Pittsburgh Center for Research Computing; UVA Kreftsenter; og National Cancer Institute of the NIH, Cancer Center Support Grant P30 CA44579.
Kilde:
University of Virginia helsesystem
Referanse:
Hu, SS, et al. (2022) Intrinsic bias estimering for forbedret analyse av bulk- og enkeltcelle kromatintilgjengelighetsprofiler ved bruk av SELMA. Naturkommunikasjon. doi.org/10.1038/s41467-022-33194-z.
.