利用來自在線家譜網站的數據,一個著名的"基因黑客"創(chuàng)建了可能是迄今為止最大的家譜.這一團隊如今計劃利用這些數據--包括一個能夠回溯到15世紀的由1300萬名個體構成的超級譜系--分析復雜基因特質的遺傳,例如壽命和面部特征.
除了為全世界最大的家庭團聚提供邀請名單之外,由計算生物學家Yaniv Erlich在于波士頓召開的美國人類遺傳學會年會上公布的這一研究成果,還能夠為了解基因對于某種特質的貢獻到達了何種程度提供一件新工具.其他研究人員將能夠使用這一譜系,但Erlich及其馬薩諸塞州劍橋市白頭研究所的團隊為了保護隱私,已將這些數據的"名字"抹去.
并未參與該項研究的芝加哥大學人類遺傳學家Nancy Cox指出,家譜本身的結構能夠提供關于人口統(tǒng)計學和人口擴張的有趣信息.但她認為,更有趣的可能性是,隨著更多的人擁有了自己的基因組序列并將這些信息存放于公共數據庫,這樣的數具有朝一日能夠與醫(yī)療信息或DNA序列數據聯(lián)系起來.
"對于這些譜系能夠告訴我們什么,科學家事實上剛剛知道些皮毛."Cox說.
家譜能夠提供有關基因遺傳的線索.例如,通過將個體與家譜中的遠親進行比較,一個給定特質(例如生育能力)的頻率變化便可以顯示出這一特質在多大程度上起源于遺傳學.它還能夠提供其他一些線索,例如一些特質是由具有較大影響的較少基因控制,還是由具有較小影響的許多基因所掌握.
然而Erlich在此次會議上表示,僅僅是幾千人的家譜也需要數年的時間用于組裝譜系數據.在過去,研究人員精心從教堂記錄和個人志愿者那里收集這些數據.而Erlich及其研究團隊決定從家譜網站geni.com上超過4300萬個個人檔案中采集數據,從而使這一過程合理化.這些檔案通常包括生卒日期,以及居所,偶爾會有用戶上傳的照片.
該研究團隊將規(guī)模從幾千人到1300萬人的數據導入家譜.Erlich表示,之前可供遺傳研究使用的譜系最好的也就包含有幾十萬個家庭成員.
鹽湖城猶他大學的遺傳學家Lisa Cannon-Albright敦促要謹慎使用自我報告的譜系數據.她曾廣泛地參與一家關聯(lián)了一些醫(yī)療信息的大型猶他州譜系數據庫的工作."每個人都想將自己的家庭回溯至皇室."她說,"對于那些大型的譜系,我們只是不相信它們能夠超越某一個時間節(jié)點."Cannon-Albright說,她將自己的數據從1500年切斷.
Cannon-Albright強調,最終,一個譜系的價值在于你能夠利用到的信息.在本次會議上,Cannon-Albright提交的一份來自猶他數據庫的數據表明,只能由父親傳給兒子的Y染色體能夠攜帶前列腺癌的危險因素.她最近還發(fā)起了一個新的項目,將譜系數據與來自聯(lián)邦退伍軍人健康管理局的醫(yī)療記錄聯(lián)系起來.
迄今為止,尚不清楚由Erlich及其團隊建立的巨大家譜到底能產生多大的作用.一些科學家在此次會議上對該項目表示出極大的熱情,但苦于無法拿出一個使用這些數據的特定試驗.
但冰島雷克雅未克市遺傳學公司deCODE的創(chuàng)始人Kári Stefánsson卻堅信家譜分析在未來的遺傳學研究中將扮演一個重要的角色."人們將越來越愿意貢獻他們的數據和醫(yī)療記錄."他說,"這是一個令人興奮的可能性."