基因組數據的「軟體瑞士軍刀」可快速了解細胞的行為

要想知道一個細胞正在像癌症那樣失控地生長,還是在入侵病毒的控制下生長,或者僅僅是在做一個健康細胞的常規工作,最好的方法就是看它的基因表達。雖然生物體內絕大多數細胞都含有相同的基因,但這些基因如何表達才是產生不同細胞類型的原因,例如,肌肉細胞和神經元之間的區別。

基因組數據的「軟體瑞士軍刀」可快速了解細胞的行為

在過去的十年里,測量單個細胞中基因表達的技術已經徹底改變了生物學。生物學家不再需要對組織內的許多細胞進行基因表達的平均,現在他們可以隨時檢測每個細胞中哪些基因是活躍的。

然而,計算能力卻難以跟上這種數據爆炸的速度。例如,一次實驗可以觀察10萬個細胞,並測量數十萬個轉錄本(基因活躍時產生的RNA片段)的信息,從而產生數百億個測序片段。單細胞測序的基因組數據可能會占用數TB的空間,並且在大型計算伺服器上處理需要幾個小時或幾天的時間。

現在,一種新的軟體工具可以利用普通筆記本電腦的計算能力,在30分鍾左右的時間內處理大型基因組數據集。就像一把瑞士軍刀,該工具可用於無數種不同的生物需求,並將有助於確保科學研究的可重復性。

該工具可以讓任何人在線使用,現在另一個研究小組正在對該工具進行改編,以研究從篩查試驗中收集的樣本中的SARS-CoV-2病毒。

了解更多:

https://www.nature.com/articles/s41587-021-00870-2

這項研究是作為計算生物學和計算與數學科學Bren教授Lior Pachter(BS ’94)和冰島大學計算機科學教授Páll Melsted實驗室之間的合作進行的。Melsted與研究生Sina Booeshaghi(2019年碩士)是共同第一作者。描述該研究的論文於2021年4月1日出現在《自然生物技術》雜誌上。

“有很多例子表明,不同的小組使用不同的技術來研究相同的組織,例如,大腦,”Booeshaghi說。”用同一個引擎,也就是我們的技術來處理所有這些數據,有利於整合數據。速度快、效率高,而且可以輕松進行再處理,這對科學的一致性和可重復性非常重要。”

這些工具的易用性、低成本和模塊化,將使人類細胞圖譜和腦計劃細胞普查網絡等大型聯合體的基因組數據預處理具有一致性和可重復性。

來源:cnBeta