UVA Health-forskere er ved at udvikle et nyt værktøj til at fremme genomforskning og sygdomsforskning
UVA Health-forskere har udviklet et vigtigt nyt værktøj til at hjælpe forskere med at skelne signaler fra støj, når de studerer de genetiske årsager til kræft og andre sygdomme. Ud over at fremme forskning og potentielt fremskynde nye behandlinger, kan det nye værktøj hjælpe med at forbedre kræftdiagnosen ved at gøre det lettere for læger at opdage kræftceller. Det nye værktøj, udviklet af Chongzhi Zang, PhD, UVA, og hans team og samarbejdspartnere, er en matematisk model, der vil hjælpe med at sikre integriteten af "big data" om byggestenene i vores kromosomer, genetisk materiale kaldet kromatin. Chromatin – en…

UVA Health-forskere er ved at udvikle et nyt værktøj til at fremme genomforskning og sygdomsforskning
UVA Health-forskere har udviklet et vigtigt nyt værktøj til at hjælpe forskere med at skelne signaler fra støj, når de studerer de genetiske årsager til kræft og andre sygdomme. Ud over at fremme forskning og potentielt fremskynde nye behandlinger, kan det nye værktøj hjælpe med at forbedre kræftdiagnosen ved at gøre det lettere for læger at opdage kræftceller.
Det nye værktøj, udviklet af Chongzhi Zang, PhD, UVA, og hans team og samarbejdspartnere, er en matematisk model, der vil hjælpe med at sikre integriteten af "big data" om byggestenene i vores kromosomer, genetisk materiale kaldet kromatin. Kromatin – en kombination af DNA og protein – spiller en vigtig rolle i at kontrollere vores geners aktivitet. Når kromatin går galt, kan det gøre en sund celle til kræft eller bidrage til andre sygdomme.
Genetik og genomik e-bog
Samling af de bedste interviews, artikler og nyheder fra det sidste år. Download en gratis kopi
Forskere kan nu studere kromatin i individuelle celler ved hjælp af en banebrydende teknologi kaldet single-cell ATAC-seq, men dette producerer en enorm mængde data, inklusive en masse støj og forvrængning. Zangs nye værktøj skærer igennem det og redder videnskabsmænd fra falske spor og spildte kræfter.
I de bedste tider er storstilet genomisk forskning på enkeltceller som at "jagt efter en nål i en høstak," siger Zang. Men hans nye værktøj vil gøre det meget nemmere ved at rydde en masse dårligt hø væk.
På den traditionelle måde for dataanalyse kan du se nogle mønstre, der ligner rigtige signaler for en bestemt kromatintilstand, men som er falske på grund af den eksperimentelle teknologis skævhed. Sådanne falske signaler kan forvirre videnskabsmænd. Vi har udviklet en model til bedre at fange og filtrere sådanne falske signaler fra, så den rigtige nål, vi leder efter, lettere kan skille sig ud fra høet.”
Chongzhi Zang, PhD, beregningsbiolog ved UVA Center for Public Health Genomics og UVA Health Cancer Center
Om genomics-værktøjet
Zangs nye værktøj tilpasser en model fra talteori og kryptologi kaldet "simplex coding". Han og hans kolleger brugte dette til at kode DNA-sekvenser til matematiske former og i sidste ende konvertere den komplekse genomsekvens til en meget enklere matematisk form. Du kan derefter sammenligne forskellige former for at detektere forvrængninger og støj i sekvensdataene, som ikke er let at finde ved hjælp af traditionelle metoder.
"Kompleksiteten af DNA-sekvenser stiger eksponentielt, efterhånden som de bliver længere. De er svære at modellere, fordi et typisk datasæt indeholder millioner af sekvenser fra tusindvis af celler," siger Shengen Shawn Hu, PhD, en forsker i Zangs laboratorium og hovedforfatter af dette arbejde. "Men simplex-kodningsmodellen kan give et nøjagtigt estimat af sekvensforvrængninger på grund af dens smukke matematiske egenskab."
Test af værktøjet viste, at det var væsentligt bedre til at analysere komplekse enkeltcelledata for at karakterisere forskellige celletyper. Dette er vigtigt for både grundlæggende biologisk forskning og sygdomsdiagnostik, hvor læger skal opdage bittesmå antal sygdomsceller i meget større prøver, der spænder fra titusinder til millioner af celler.
"Forvrængningerne var ikke lette at finde, fordi de var sammenvævet med rigtige signaler og gemt i de store mængder data. Det ville måske ikke være en big deal, hvis folk bare valgte de stærkeste signaler fra et stort antal celler," sagde Zang. som for nylig var med til at lede adskillige andre enkeltcellede genomiske undersøgelser, der studerer koronararteriesygdom og tarmudvikling. "Men når man ser på enkeltcelledata, er der ikke længere nogen lavthængende frugter. Signalerne er altid svage på det enkelte celleniveau, og effekterne af støj og forvrængning kan være katastrofale. Bias-korrektion ignoreres ofte, men kan være afgørende i enkeltcelledataanalyse."
For at gøre deres nye værktøj bredt tilgængeligt udviklede forskerne gratis open source-software og satte det online. Softwaren kan findes på https://github.com/zang-lab/SELMA og kl https://doi.org/10.5281/zenodo.7048767.
"Vi håber, at dette værktøj kan gavne det biomedicinske forskningssamfund i at studere kromatinbiologi og genomik og i sidste ende støtte sygdomsforskning," sagde Zang. "Det er altid spændende at se, hvordan vores kolleger bruger de værktøjer, vi udvikler, til at gøre vigtige videnskabelige opdagelser i deres egen forskning."
Resultater offentliggjort
Forskerne offentliggjorde deres resultater i tidsskriftet Nature Communications. (Artiklen er åben, hvilket betyder gratis at læse.) Holdet bestod af Shengen Shawn Hu, Lin Liu, Qi Li, Wenjing Ma, Michael J. Guertin, Clifford A. Meyer, Ke Deng, Tingting Zhang og Chongzhi Zang.
Zang er en del af UVAs afdelinger for folkesundhedsvidenskab, biokemi og molekylær genetik og biomedicinsk teknik. Institut for Biomedicinsk Teknik er et samarbejde mellem UVA School of Medicine og School of Engineering.
Arbejdet blev støttet af National Institutes of Health tilskud R35GM133712, K22CA204439 og R35GM128635; National Science Foundation, Grant NSF-796 2048991; University of Pittsburgh Center for Research Computing; UVA Cancer Center; og National Cancer Institute of the NIH, Cancer Center Support Grant P30 CA44579.
Kilde:
University of Virginia Health System
Reference:
Hu, SS, et al. (2022) Intrinsic bias estimering for forbedret analyse af bulk- og enkeltcellede kromatintilgængelighedsprofiler ved hjælp af SELMA. Naturkommunikation. doi.org/10.1038/s41467-022-33194-z.
.