Science發(fā)布基因組測(cè)序重大突破
日期:2016-04-05 09:06:29
基于更長(zhǎng)序列讀取的一項(xiàng)測(cè)序新技術(shù),使得研究人員第一次發(fā)現(xiàn)了錯(cuò)過(guò)的一些基因和遺傳變異形式。現(xiàn)在他們以接近小鼠和人類基因組的高質(zhì)量,完成了對(duì)西部低地大猩猩(Western lowland gorilla)的基因組測(cè)序和組裝。提供了在與人類的進(jìn)化親緣關(guān)系上僅次于黑猩猩的這一生物物種的一些生物學(xué)新見(jiàn)解。
在發(fā)表于4月1日《科學(xué)》(Science)雜志上的研究論文中,華盛頓大學(xué)基因組科學(xué)教授Evan Eichler領(lǐng)導(dǎo)的研究人員解釋了,為什么以往大猩猩和其他哺乳動(dòng)物基因組組裝一直支離破碎、不完整、并且有可能具有誤導(dǎo)性的原因:
大規(guī)模平行測(cè)序技術(shù),在提高速度,改善精度和降低基因組測(cè)序成本的同時(shí),通常只生成短序列片段(read),在測(cè)序后采用基因組組裝軟件將這些reads拼合到一起。
這一程序試圖利用序列reads之間的重疊來(lái)重建原基因組。不幸地是,在人類和其他靈長(zhǎng)類動(dòng)物基因組中常見(jiàn)的長(zhǎng)重復(fù)DNA,會(huì)使組裝軟件發(fā)生混亂,將基因組打碎成非常小的片段。
Eichler說(shuō):“這樣的組裝就像瑞士奶酪。在缺口(gap)中有許多錯(cuò)失的生物學(xué)信息。”采用短read技術(shù)構(gòu)建的原西部低地大猩猩基因組被打碎成40多萬(wàn)個(gè)片段。
“這些缺口并非隨機(jī),而是集中在重復(fù)序列位點(diǎn)。如果遺傳學(xué)家不能捕獲這些重復(fù)序列,確定基因組中的一些結(jié)構(gòu)差異,他們會(huì)難以了解基因的組織及比較物種內(nèi)及跨物種的遺傳變異。”
Eichler研究小組分析了來(lái)自芝加哥Lincoln動(dòng)物園的一只雌性西部低地大猩猩的血液樣本。
研究人員利用單分子實(shí)時(shí)(SMRT)測(cè)序技術(shù)、組裝工具Falcon和QUIVER,以及其他的技術(shù)生成了長(zhǎng)序列reads。比最流行的測(cè)序技術(shù)長(zhǎng)度多100多倍。這些長(zhǎng)reads使得他們能夠在組裝時(shí)仔細(xì)研究大猩猩基因組的大多數(shù)重復(fù)序列區(qū)域。
結(jié)果組裝出了更大、片段數(shù)少得多的新大猩猩基因組。相比以往的40萬(wàn)個(gè)片段,現(xiàn)在只有1800個(gè)片段。基因組片段的平均大小增大了800倍,填補(bǔ)了原組裝中約90%的缺口。
研究人員觀察發(fā)現(xiàn),這些附加的序列信息大大提高了對(duì)這一大猩猩物種的基因注釋。它也促成發(fā)現(xiàn)了在首次基因組組裝錯(cuò)過(guò)的、成千上萬(wàn)的蛋白質(zhì)和肽編碼片段以及新調(diào)控元件。
基因組控制機(jī)制上的差異,或某些基因調(diào)控元件的喪失或破壞,或許可以解釋人類祖先進(jìn)化成與類人猿近親如此不同的原因。
科學(xué)家們還發(fā)現(xiàn)了數(shù)以萬(wàn)計(jì)的新結(jié)構(gòu)變異,諸如DNA缺失與插入,這有可能比以往編錄的較小的單堿基對(duì)差異要重要得多。
Eichler說(shuō):“我研究人類和類人猿基因組的動(dòng)機(jī)就是,了解是什么給我們打上了作為一個(gè)物種的記號(hào)。我想看到重新測(cè)序包括黑猩猩和紅毛猩猩在內(nèi)的所有大猩猩基因組,獲得區(qū)別人類和類人猿的遺傳變異的全面視圖。我相信存在比我們以往認(rèn)為要多得多的遺傳變異。第一步就是找到它。”
在這些區(qū)域研究人員看到了人類和大猩猩之間一些有趣的差異,存在于與感官知覺(jué)、角蛋白生成、胰島素調(diào)控、免疫、生殖和細(xì)胞信號(hào)傳導(dǎo)相關(guān)的基因中。
新基因組組裝還提供了有關(guān)低地大猩猩進(jìn)化史的一些新線索。以往的研究證實(shí),大猩猩種群在不太遙遠(yuǎn)的過(guò)去遭遇了瓶頸,但對(duì)新基因組進(jìn)行分析的結(jié)果顯示這一瓶頸比以往認(rèn)為的要更嚴(yán)重。
大猩猩基因組內(nèi)的遺傳變異模式可以提供一些疾病、氣候改變、人類活動(dòng)如何影響低地大猩猩種群的證據(jù)。
Eichler和他的研究小組在論文中寫(xiě)道:“測(cè)序技術(shù)和計(jì)算生物學(xué)現(xiàn)在已進(jìn)展至個(gè)體實(shí)驗(yàn)室可以生成高質(zhì)量哺乳動(dòng)物基因組的階段。這種能力有望徹底改變我們對(duì)基因組進(jìn)化和物種生物學(xué)的認(rèn)識(shí)。”
Eichler補(bǔ)充說(shuō),這些進(jìn)展還有可能大大推動(dòng)對(duì)人類疾病遺傳基礎(chǔ)的研究,尤其是如果以這種方式測(cè)序更多的人類基因組。
“作為醫(yī)學(xué)研究者,如果我們只依賴短read序列,就如同我們的盔甲有裂隙。對(duì)大猩猩和其他人類基因組的研究工作清楚地證實(shí)了,采用短序列read方法無(wú)法理解大量的遺傳變異。長(zhǎng)read測(cè)序使得我們能夠訪問(wèn)以前看不到的遺傳變異新層面。”
 
 





 
         
           
  
          
