近日,華中農(nóng)業(yè)大學動物科技學院、動物醫(yī)學院周揚副教授的研究成果在Genome Research雜志作為封面文章發(fā)表。研究構(gòu)建了目前牛泛基因組和基因組結(jié)構(gòu)變異數(shù)據(jù)庫,并對牛的遺傳多樣性和選擇適應性提出新見解。
近日,華中農(nóng)業(yè)大學楊利國教授團隊的周揚副教授與美國農(nóng)業(yè)部George E. Liu團隊合作在Genome Research雜志發(fā)表題為“Assembly of a pangenome for global cattle reveals missing sequences and novel structural variations, providing new insights into their diversity and evolutionary history”的論文,并被選為雜志的封面文章。該文章鑒定出牛參考基因組之外的83Mb新序列,率先從群體水平構(gòu)建了牛泛基因組;同時開發(fā)基因組結(jié)構(gòu)變異(Structural Variation, SV)分析流程,首次從SV的角度解析了世界牛品種的血統(tǒng)關系,從適應性等多角度檢測了不同分類群體的受選擇位點和候選基因,補充了SV作為牛育種材料的不足,并解析SV潛在形成機理促進對牛基因組演化的深入理解。百邁客為該研究提供了二代測序服務。

圖1?Genome?Research雜志2022年8月份期刊封面
參考基因組序列是保障一切與基因相關研究順利實施的必要基礎。2003年長達13年之久的人類參考基因組計劃(85%完整度)為人類解析生命活動開啟了新篇章,被譽為與阿波羅登月計劃和曼哈頓計劃同等重要的大事件。牛參考基因組于2009年發(fā)布,在之后的13年內(nèi)不斷對其進行完善,并相繼公布了近10個牛品種的參考基因組。但每個參考基因組幾乎只包含單個個體基因組序列,忽略了個體之間序列的差異性,導致在科學研究過程中相當一部分基因組序列及其功能處于未知狀態(tài);同時已知基因組序列在不同個體之間存在SV,導致不同個體間基因組序列構(gòu)成非常復雜,精準檢測和分型一直是阻止其后續(xù)解析和應用的障礙。

圖2泛基因組新序列在已知參考基因組上的分布及影響
為解決以上問題,該文章通過開發(fā)新的基因組分析流程,對來自世界57個品種898頭牛的基因組序列進行組裝和SV檢測;發(fā)現(xiàn)了83Mb的?;蚪M未知序列,相當于目前參考基因組序列總長度的3.1%,并且從中鑒定出大量未知外顯子序列,最后綜合三種策略成功將1007條contig放置在現(xiàn)有參考基因組上,這些序列可能通過外顯子破壞、外顯子添加等方式影響了279個基因的序列結(jié)構(gòu)。

圖3利用SV(缺失型變異)對世界牛品種展開精準群體學分析
同時,利用多款SV檢測軟件重新開發(fā)新的分析流程,在準確檢測SV的基礎上實現(xiàn)了對缺失型變異的邊界精準鑒定和二倍體分型;利用此流程,共檢測到了330萬個缺失變異、12萬個倒置、18萬個重復區(qū)域,通過對檢測結(jié)果的模擬評估,證明本論文所檢測的SV在牛上已經(jīng)趨于飽和,具有很好的群體代表性。以此為基礎,完成了對SV對牛基因組27種不同基因組功能元件和QTL的影響研究,構(gòu)建了受SV影響的基因功能元件數(shù)據(jù)庫。進一步利用缺失型變異對世界牛品種的血統(tǒng)來源進行分析,實現(xiàn)基于SV水平的世界牛品種血統(tǒng)的精準鑒定,為解析世界牛品種血統(tǒng)組成提供了新方法,打破了長期使用SNP進行遺傳學分析的局限。
進一步利用比較基因組學等手段對牛的種屬差異、地域適應性、商業(yè)化用途等角度全面解析獲得大量與經(jīng)濟性狀相關的變異位點,并深入解析了位于APPL2第一外顯子區(qū)域缺失變異與不同地域牛選擇適應性之間的關系;發(fā)現(xiàn)該缺失變異是由Bov-tA1轉(zhuǎn)座子構(gòu)成,并形成了APPL2基因的啟動子和增強子部分,該序列攜帶了APPL2相關功能的轉(zhuǎn)錄因子結(jié)合位點,通過影響基因的表達,進而調(diào)控與免疫反應、味覺功能、細胞增殖、葡萄糖代謝相關的功能。
周揚副教授和其碩士研究生楊旅同學為該論文共同第一作者,George E. Liu、楊利國教授和周揚副教授為共同通訊作者。該研究受到國家自然科學基金、湖北省自然科學基金、美國AFRI和NIFA等項目的資助。
如果您對基因組項目有任何技術問題,歡迎點擊下方按鈕與我們聯(lián)系,我們將免費為您設計文章研究思路。
A cattle pangenome representation was created based on the genome sequences of 898 cattle representing 57 breeds. The?pangenome identified 83 Mb of sequence not found in the cattle reference genome, representing 3.1% novel sequence compared with the 2.71-Gb reference. A catalog of structural variants developed from this cattle population identified 3.3 million deletions, 0.12 million inversions, and 0.18 million duplications. Estimates of breed ancestry and hybridization between?cattle breeds using insertion/deletions as markers were similar to those produced by single nucleotide polymorphism–based analysis. Hundreds of deletions were observed to have stratification based on subspecies and breed. For example,?an insertion of a Bov-tA1 repeat element was identified in the first intron of the APPL2 gene and correlated with cattle breed?geographic distribution. This insertion falls within a segment overlapping predicted enhancer and promoter regions of the?gene, and could affect important traits such as immune response, olfactory functions, cell proliferation, and glucose metabolism in muscle. The results indicate that pangenomes are a valuable resource for studying diversity and evolutionary history, and help to delineate how domestication, trait-based breeding, and adaptive introgression have shaped the cattle?genome.