• <li id="ooooo"><tt id="ooooo"></tt></li>
  • <table id="ooooo"><blockquote id="ooooo"></blockquote></table>

    基因大數據如何走向臨床應用?需克服哪些問(wèn)題?

    [2015/12/17]

      為了推動(dòng)基因組研究在臨床中的應用,多個(gè)國家層面的大規模研究項目已經(jīng)開(kāi)啟。2014年英國發(fā)起了10萬(wàn)人基因組計劃,美國和中國也宣布了百萬(wàn)人基因組數據相關(guān)計劃。許多區域性的大數據計劃也在進(jìn)行中。例如,賓夕法尼亞州的蓋辛格健康系統(GeisingerHealth System)和紐約的再生元制藥公司合作,計劃獲取25萬(wàn)人的基因組測序數據。與此同時(shí),世界各地越來(lái)越多的醫院和服務(wù)供應商也開(kāi)始對那些癌癥或罕見(jiàn)遺傳病患者進(jìn)行基因組測序。

      海量的數據會(huì )給計算分析和存儲帶來(lái)前所未有的壓力,有分析估計,基因組學(xué)很快就能超過(guò)YouTube的數據量。但許多研究者認為,如今的大數據還不夠豐富,不具有臨床價(jià)值。蓋辛格基因組醫學(xué)研究院院長(cháng)MarcWilliams說(shuō),“我不知道100萬(wàn)是否足夠,但顯然我們需要更多!

      變異數據應用到臨床的挑戰與實(shí)踐

      單核苷酸層面的突變

      目前,許多研究機構主要采用外顯子組測序,其相對于全基因組而言,可以減少近100倍的數據分析工作量。然而,仍有超過(guò)約1.3萬(wàn)個(gè)單核苷酸突變被鑒定。這其中大約有2%影響蛋白質(zhì)的翻譯,尋找其中的致病突變是一個(gè)艱巨的挑戰。

      幾十年來(lái),研究人員陸續將他們發(fā)現的單核苷酸突變信息放入公共資源數據庫中,如dbSNP數據庫。然而,這些突變信息往往來(lái)源于細胞層面、動(dòng)物模型甚至是理論預測,還不足以用于臨床診斷。在許多情況下,這些突變與疾病相關(guān)性的證據等級很低。

      結構變異

      基因組序列的重復或缺失,這類(lèi)結構變異使臨床應用情況更為復雜,F有的測序技術(shù)很難檢測到結構變異。在全基因組范圍內,個(gè)體之間存在數百萬(wàn)個(gè)變異。其中許多變異位于非編碼區,這一區域不編碼蛋白但有調節基因活性的作用,仍然是可以致病的。由于非編碼區的范圍和功能難以界定,即使能夠獲得其中的變異信息,短期內也無(wú)法進(jìn)行臨床解讀。

      針對這些問(wèn)題,人們正在努力地去解決。例如,美國國家人類(lèi)基因組研究所建立了臨床基因組資源庫,這是一個(gè)與疾病相關(guān)的突變數據庫,里面有可以指導醫療的突變信息和支持證據。GenomicsEngland公司通過(guò)建立“臨床解讀的合作伙伴關(guān)系”來(lái)推動(dòng)這方面的進(jìn)展,即:醫生和研究人員合作,建立強大的疾病-基因型關(guān)聯(lián)模型。

      大隊列的需求明顯

      一些“惡性”突變通常在進(jìn)化過(guò)程中被淘汰,往往十分罕見(jiàn),需要大樣本量來(lái)進(jìn)行檢測。因此,建立有統計學(xué)意義的突變與疾病弱相關(guān)性模型也需要大量的患者。

      冰島的deCODE Genetics公司將15萬(wàn)人的基因組數據(包括1.5萬(wàn)全基因組序列),與家譜和病史相結合,推斷已知的遺傳危險因素在全民中的分布情況,包括與乳腺癌、糖尿病和阿爾茨海默病相關(guān)的基因突變。正如該公司的首席執行官KáriStefánsson所說(shuō),“我們建立了1萬(wàn)個(gè)有功能缺失突變的冰島人數據庫。我們正投入巨大的精力來(lái)弄清楚這些基因缺失對個(gè)體有什么影響!

      對于deCODE Genetics公司開(kāi)展這項工作的成功得益于冰島人口的基因型同質(zhì)性,然而,對于其他項目需要更廣泛的基因譜。例如,國際千人基因組計劃已經(jīng)編目了一些遺傳多樣性數據,但大多數數據嚴重偏向高加索人,使這些數據對臨床研究用處減弱。

      此外,部分問(wèn)題也源于參考基因組。第一個(gè)參考基因組版本是由幾個(gè)不同種族的隨機捐贈者基因拼湊而成的,但最新的版本GRCh38,整合了更多人類(lèi)基因組多樣性的信息。

      基因大數據的人才和計算能力

      對大規模人群進(jìn)行基因組或外顯子組測序每年產(chǎn)生高達40PB(4千萬(wàn)GB)的數據。相比之下,原始數據存儲并不是首要的問(wèn)題,更大的問(wèn)題是巨量突變數據的分析。賓夕法尼亞州立大學(xué)基因組學(xué)研究員Marylyn Ritchie 說(shuō),“計算量與人的數量呈線(xiàn)性關(guān)系,當變量和組合增多時(shí),計算量就呈指數倍地增加!比绻黾拥臄祿c臨床癥狀或基因表達相關(guān),那么分析會(huì )變得更加棘手。來(lái)自數千人的巨量數據的處理可能會(huì )使目前很多統計分析的工具癱瘓。Ritchie說(shuō),“像氣象、金融和天文學(xué)領(lǐng)域,都在整合不同類(lèi)型的數據上摸索了很長(cháng)一段時(shí)間,我和谷歌及Facebook的人都交流過(guò),盡管我們的大數據和他們的不同,但我們應該多交流,將他們的經(jīng)驗用于我們的領(lǐng)域中!

      然而,遺憾的是很多有大數據挖掘經(jīng)驗的優(yōu)秀程序員都被硅谷吸引走了。美國國家衛生研究院的數據科學(xué)副主任Philip Bourne認為,科學(xué)界的論文評價(jià)體系不適合于這些人才。盡管這其中一些人真心想成為基因大數據領(lǐng)域的學(xué)者,但卻得不到學(xué)者的職位。

      除了人才,數據處理能力是另一個(gè)限制因素;虼髷祿ǔP枰褂贸砂偕锨(gè)大內存的CPU進(jìn)行大規模并行計算。為此,許多團隊都開(kāi)始轉向“云端”來(lái)存放和分析大量數據。Genomics England公司生物信息學(xué)主管TimHubbard說(shuō),“人們逐漸有了這種想法:將算法應用到數據中去! GenomicsEngland的云計算依靠政府的設施,其外部訪(fǎng)問(wèn)被嚴格控制。對于其他研究機構而言,基因大數據的分析漸漸轉向了商業(yè)云系統,例如Amazon、Google以及阿里的云服務(wù)。

      如何實(shí)現數據的共享與協(xié)作

      原則上,基于云計算的托管鼓勵數據庫間的共享和協(xié)作。但高度敏感的臨床信息及患者同意權和隱私權牽扯到棘手的倫理和法律問(wèn)題。

      在歐盟,會(huì )員國間不同的數據處理規則阻礙了合作。與非歐盟國家共享數據需依賴(lài)繁瑣的機制建立數據保護,與私人組織共享數據需簽定限制性的雙邊協(xié)議。為了幫助解決這個(gè)問(wèn)題,全球基因組學(xué)與健康聯(lián)盟(GlobalAlliance for Genomics and Health)制定了《基因組學(xué)與健康相關(guān)數據責任共享框架》(《Frameworkfor Responsible Sharing of Genomic and Health-Related Data》)。該框架包括隱私和知情同意指南,以及違反規則的組織應該承擔的責任和法律后果。

      加拿大麥吉爾大學(xué)生物倫理學(xué)家、該聯(lián)盟的監管和倫理工作組主席Bartha Knoppers說(shuō),“在簽署數據傳輸協(xié)議時(shí),如果簽署方都同意遵守該框架,他們就省了很多工作!痹摽蚣茉试S研究組織在保護隱私的情況下分析共享的基因組數據。Knoppers解釋?zhuān)拔覀兿M谘谏w患者身份的情況下,能將這些數據與臨床數據和醫療檔案聯(lián)系起來(lái),否則我們無(wú)法實(shí)現精準醫療!

      此外,在許多歐洲國家,將基因組學(xué)信息納入電子醫療檔案已經(jīng)變得越來(lái)越重要。Hubbard說(shuō),“我們的目標是將其整合到標準的全民醫保制度中!庇摹10萬(wàn)人基因組計劃”在這方面走在最前端,但其他國家也緊隨其后。例如,比利時(shí)最近宣布了一項探索醫學(xué)基因組學(xué)的計劃。

      所有這些國家都受益于這種政府主導的公共醫保制度。在美國,情況較為復雜,除了公共醫保制度老年和殘障健康保險(Medicare)和醫療援助(Medicaid)等外,美國的私人醫保制度非常發(fā)達,不同的醫保公司使用不同的醫療檔案系統,這使基因組數據的整合變得困難。2007年,美國國立衛生研究院資助建立了電子化病歷與基因組學(xué)網(wǎng)絡(luò )系統(eMERGE),以進(jìn)行大數據整合與系統管理分析。

      臨床藥物基因組學(xué):從數據到診治

      在醫療檔案中整合基因組數據主要是為醫生對疾病的診治提供參考,其中一個(gè)應用是藥物基因組學(xué)。臨床藥物基因組學(xué)實(shí)施聯(lián)盟(CPIC)分析了藥物和基因的關(guān)系,將相關(guān)信息存儲在 PharmGKB數據庫中,并可供臨床使用。例如,帶有某些突變的人對某種抗凝藥響應很差,導致心臟發(fā)作風(fēng)險增加。

      如何將基因研究成果用于臨床是個(gè)耗時(shí)耗力的工作。然而, 把基因型和表型信息結合起來(lái)可以產(chǎn)生較大的價(jià)值。大多數臨床相關(guān)的基因突變都是通過(guò)全基因組關(guān)聯(lián)研究(GWAS)鑒定出來(lái)的。研究人員現在可以從醫療檔案反向尋找,以確定什么樣的臨床表現與某種基因突變密切相關(guān)。

      當然,基因組只是其中的一部分,其他組學(xué)也可能成為反映健康狀況的晴雨表。

      最終,需要患者的參與

      在研究人員努力整合數據的同時(shí),患者所發(fā)揮的作用也開(kāi)始顯現。例如,我們在進(jìn)行行為、營(yíng)養、運動(dòng)、吸煙和飲酒相關(guān)的研究時(shí),需要依賴(lài)于患者報告的數據。一些可穿戴設備,例如智能手機和FitBits,正在收集運動(dòng)和心率數據。因為它的收集很容易,這種數據量在不斷攀升。

      因此,每個(gè)人都是大數據的生產(chǎn)者。普通人產(chǎn)生的數據將遠遠地超過(guò)臨床中積累的數據。我們需要將這些不同來(lái)源的數據整合在一起,用于患者的管理。隨著(zhù)人們對大數據挖掘利用的能力越來(lái)越強大,患者會(huì )成為最終的贏(yíng)家!


    国产91无套剧情在线播放_亚洲v日韩v欧美v综合_亚洲欧美高清在线一区二区三区_激情福利视频网址_午夜熟妇一区二区_亚洲最大的熟女水蜜桃av_免费大片AV手机看片不卡_精品阿V999视频在线观看_国产白丝视频无遮挡_日韩亚洲国产av黄片