Whole-genome scan of population differentiation in Zel and Lori-Bakhtiari sheep breeds

Document Type : Research Paper

Authors

1 professor of Animal Science, Tehran University, Tehran, Iran

2 Senior scientists, Centre for Reproduction and Genomics, AgResearch, Invermay, New Zealand

3 Senior scientists, Centre for Reproduction and Genomics, AgResearch, Invermay, New Zealand.

Abstract

Selection for increasing of frequency in new mutations that are advantageous only in a subset of populations leaves some signatures in the genome. Detecting these genomic regions is one of the most important areas of research in animal genetics since locations of selection signatures are often correlated with QTLs affecting economically important traits. In this paper, a whole genome scan using ~54000 SNP markers was performed in two main Iranian sheep breeds, namely Zel and Lori-Baktiari, with the aim of identifying divergently selected regions of the genome. Study of population differentiation across the genome using Weir and Cockerham’s FST test revealed some regions showing evidence of selection. In this paper, five regions which were in the 99.99 percentile of the genome distribution of FST scores were selected for further analysis. These regions were located in chromosomes 2, 5, 7 (two areas) and X. To evaluate the selection sweep, due to linkage disequilibrium, associated with these signatures we employed the Extended Haplotype Homozygosity (EHH) test. The results of this test as well as a study of haplotype bifurcation diagrams in these breeds also confirmed large allele differentiation in these regions. Finally, study of reported QTL regions in the orthologous areas of the cattle genome showed that they overlapped with the reported cattle QTLs, representing economically important traits such as carcass yield and reproductive traits. In conclusion, the results from this study provide one of the first attempts to develop a genome-wide map of selection footprints in the sheep genome and may facilitate the identification of genes affecting traits which are divergent in these two Iranian sheep breeds

Keywords


کاوش ژنومیک تمایز جمعیتی در نژادهای زل و لری­بختیاری

 

محمد حسین مرادی*1، اردشیر نجاتی جوارمی2، محمد مرادی شهر­بابک3، کن دادز4، جان مک­ایوان4

 

1 دانشجوی دکتری، پردیس کشاورزی ومنابع طبیعی دانشگاه تهران، کرج، ایران

2 دانشیار ، پردیس کشاورزی ومنابع طبیعی دانشگاه تهران، کرج، ایران 

3 استاد پردیس کشاورزی و منابع طبیعی دانشگاه تهران، کرج، ایران  

4 محققین ارشد بخش ژنومیکس و تولید مثل مرکز AgResearch نیوزیلند

تاریخ دریافت: 05/09/1390، تاریخ پذیرش: 28/10/1390

 

 

چکیده

انتخاب برای افزایش فراوانی موتاسیون­های جدیدی که فقط در برخی از زیرجمعیت­ها سودمند هستند باعث باقی گذاشتن نشانه­هایی در سطح ژنوم می­شود. شناسایی این مناطق ژنومی یکی از مهمترین حوزه­های تحقیقاتی در ژنتیک حیوانی است، زیرا این مناطق اغلب با QTLهای مرتبط با صفات مهم اقتصادی در ارتباط هستند. در این تحقیق با هدف شناسایی مناطق ژنومی که در دو نژاد گوسفند ایرانی زل و لری-بختیاری هدف انتخاب­های مختلف قرار گرفته­اند، یک کاوش ژنومیک با حدود 000,54 مارکر SNP انجام شد. بررسی تمایز جمعیتی با استفاده از روش FST ویر و کوکهام نشان داد که چندین منطقه ژنومی دارای شواهدی از انتخاب در این دو نژاد هستند. در این مقاله 5 ناحیه ژنومی که در صدک 99/99 کل ارزش­های FST قرار گرفته بودند برای بررسی­های بیشتر انتخاب شدند. این مناطق بر روی کروموزومهای 2، 5، 7 (دو ناحیه) و X واقع شده­اند. برای ارزیابی نشانه­های انتخاب بر پایه روش­های عدم تعادل لینکاژی از آزمون هموزیگوسیتی هاپلوئیدی بسط­داده شده استفاده شد. نتایج این آزمون به همراه بررسی دیاگرام­های شاخه­بندی هاپلوتیپی در این دو نژاد وجود تفرق جمعیتی شدید در این مناطق ژنومی را تأیید کرد. در نهایت بررسی QTLهای گزارش شده در مناطق اورتولوگوس گاوی نشان داد که این مناطق با QTLهای صفات مهم اقتصادی از جمله صفات مرتبط با لاشه و تولید مثل همپوشانی دارند. این تحقیق که جزء اولین مراحل توسعه نقشه انتخاب در ژنوم گوسفند محسوب می شود می­تواند منبع اطلاعاتی ارزشمندی در راستای شناسایی ژن­های متمایز کننده این دو نژاد فراهم آورد. 

واژه های کلیدی: کاوش ژنومیک، تفرق جمعیتی، نشانه­های انتخاب.


مقدمه

بر اساس تئوری خنثی[1] (Kimura, 1983) اکثر موتاسیون­های ایجاد شده در سطح ژنوم از دیدگاه انتخابی خنثی بوده و تأثیری بر روی شایستگی ژنتیکی افراد ندارند. در این حالت واریانت­های جدید یا حذف می­شوند و یا به زمانی طولانی برای افزایش فراوانی در جمعیت نیاز دارند که در طی این زمان به دلیل وجود نوترکیبی، لینکاژ موجود در اطراف این واریانت­ها به صورت عمده فرسایش می یابد (Sabeti et al., 2002). حال، چنانچه یک موتاسیون جدید باعث افزایش شایستگی افراد حامل آن نسبت به سایر افراد جامعه گردد، انتخاب طبیعی (یا مصنوعی) باعث می­شوند افرادی که دارای شایستگی بیشتری هستند در تشکیل نسل بعد مشارکت بیشتری داشته باشند. به این ترتیب فراوانی واریانت جهش یافته[2] بسته به سهم آن در افزایش شایستگی به سرعت شروع به افزایش خواهد کرد (Sabeti et al., 2006; Akey, 2009). به دنبال افزایش فراوانی واریانت های سودمند، فراوانی آلل­های موجود در جایگاه­های خنثی یا نسبتاً خنثی، که با این واریانت لینک هستند نیز افزایش خواهد یافت. در نتیجه این پدیده، الگوی تنوع ژنتیکی و عدم تعادل لینکاژی[3] (LD) در جایگاه­های اطراف این موتانت انتخابی تغییر خواهد کرد. به طوری که، هر چه به این آلل جدید نزدیک می شویم میزان تنوع ژنتیکی کاهش و LD افزایش پیدا می کند. بنابراین، زمانی که یک آلل سودمند در طی زمان های مختلف، هدف انتخاب مثبت قرار می گیرد باعث ایجاد نشانه­هایی[4] در سطح ژنوم می­گردد که از طریق بررسی طیف فراوانی آللی و LD قابل شناسایی هستند (Sabeti et al., 2006). استفاده از این روش، که بهHitchhiking Approach  معروف است در طی چند سال اخیر به یکی از کارآمدترین تکنیک­ها در شناسایی مناطق ژنومی مؤثر بر صفات کمی در حوزه های مختلف ژنتیک تبدیل شده است. یکی از مزایای اصلی این روش امکان اجرای آن تنها با استفاده از اطلاعات مولکولی در غیاب رکوردهای فنوتیپی است (Akey, 2009) که این روش را در شناسایی جایگاه­های ژنومی کاندیدا برای بسیاری از صفات از طریق مقایسه نشانه های انتخاب در جمعیت هایی با صفات متمایز به خصوص تحت شرایط نداشتن شجره مناسب و رکوردهای دقیق برای سایر صفات، که هم اکنون برای اکثر نژادهای موجود در کشور صادق است، مناسب می سازد. شناسایی این مناطق ژنومی، با توجه به این که عمدتاً با ژن­های عمده اثر و صفات مهم اقتصادی همراه هستند دارای اهمیت زیادی می باشد و می توانند منابع اطلاعاتی مناسبی برای بهبود راندمان برنامه های انتخابی فراهم آورند (Hayes et al., 2008; MacEachern et al., 2009).

تاکنون تحقیقات موفقیت آمیز مختلفی در این زمینه در انسان و برخی از حیوانات اهلی گزارش شده است (Carlson et al., 2005; Gu et al., 2009; Stella et al., 2010). در گذشته مهمترین محدودیت در اجرای این تحقیقات در گوسفند فقدان ابزار مناسب جهت ارزیابی الگوی تنوع ژنتیکی و LD در تمام سطح ژنوم محسوب می شد. تا اینکه در سال 2009 طراحی اولین SNP Chip در گوسفند در قالب پروژه Sheep HapMap گزارش شد (Kijas et al., 2009). هدف از این تحقیق استفاده از آرایه­های طراحی شده جهت تعیین ژنوتیپ دو نژاد شاخص گوسفند کشور شامل زل و لری-بختیاری و شناسایی مناطقی از ژنوم بود که در این نژادها طی سالیان متمادی به صورت طبیعی یا مصنوعی هدف انتخاب­های مختلف قرار گرفته­اند و می­توانند جزء مناطق ژنومی کاندیدا برای صفات متمایز کننده این نژادها محسوب شوند. نتایج ارائه شده در این مقاله بخشی از نتایج بدست آمده از یک تحقیق گسترده با استفاده از نژادهای ایرانی و پروژه Sheep HapMap است که با همکاری ISGC[5] برای شناسایی جایگاههای ژنومی کاندیدای ذخیره چربی انجام شده است.

 

مواد و روش ها

 نمونه ها از گله­هایی که در طی سال های اخیر تحت سیستم ثبت شجره و رکوردگیری مرکز اصلاح نژاد کشور قرار گرفته­اند جمع­آوری شدند. در انتخاب حیوانات دو فاکتور مورد توجه قرار گرفت. اول انتخاب حیوانات غیرخویشاوند و دوم جمع آوری نمونه ها به طوری که تا حد ممکن تنوع موجود در نژاد را معرفی نمایند. به این منظور در گله های دارای شجره، حیواناتی که داری جد مشترک نبودند و در گله­های فاقد شجره از هر گله 5-4 حیوان از گروههای سنی مختلف انتخاب شدند. از طرفی سایر صفات فنوتیپی همچون شماره و موقعیت جغرافیایی گله، جنسیت، وضعیت شاخ، رنگ پوست و پشم، وزن، قد، سن تقریبی و ابعاد دنبه نیز رکورد برداری شدند تا تنوعی از صفات در نمونه­ها جمع آوری شود. نمونه­گیری در نژاد زل از گله های مختلف مردمی در استان مازندران و در نژاد لری-بختیاری به صورت عمده از ایستگاه شولی و دو گله مردمی انجام شد. در مجموع بیش از 100 نمونه خون از هر نژاد جمع آوری و در نهایت 47 نمونه در هر نژاد تعیین ژنوتیپ شدند.

استخراج DNA با استفاده از روش بهینه استخراج نمکی (Helms, 1990) از خون کامل انجام شد. پس از اطمینان از کمیت و کیفیت بالای نمونه ها، غلظت آنها تاng/μl 50 جهت تعیین ژنوتیپ رقیق شد. سپس مجموع 94 حیوان شامل 47 نمونه به ازای هر نژاد در مرکز ژنومیکس و تولیدمثل Invermay در کشور نیوزیلند با استفاده از آرایه­های Illumina OvineSNP50K Beadchip با به کارگیری پروتکل استاندارد شرکت ایلومینا (http://www.illumina.com) تعیین ژنوتیپ شدند. این آرایه­ها امکان تعیین ژنوتیپ همزمان حدود 54000 جایگاه مارکری را فراهم می­کنند. سپس برای اطمینان از کیفیت داده های حاصل از تعیین ژنوتیپ در آنالیزهای نهایی مراحل مختلف کنترل کیفیت بر روی داده های اولیه اعمال شد. ابتدا حیوانات با بیش از 5% ژنوتیپ از دست رفته (1 حیوان از هر نژاد) و سپس  نمونه­هایی که بر اساس آنالیز PCA[6] خارج از گروه نژادی خود قرار گرفته بودند (1 حیوان از هر نژاد) از آنالیز های بعدی کنار گذاشته شدند. آنالیز PCA در محیط R انجام شد. سپس SNPهایی که در مجموع حیوانات دارای حداقل فراوانی آللی (MAF[7]) و Call rate (درصدی از نمونه ها که برای آن مارکر تعیین ژنوتیپ شده اند) به ترتیب کمتر از 2% و 95% بودند (شامل به ترتیب 2399 و 3943 مارکرSNP) حذف شدند. در نهایت برای SNPهای باقیمانده آنهایی که در هر کدام از نژادهای مورد مطالعه دارای تعادل هاردی-واینبرگ نبودند (مجموع SNP44) به عنوان معیاری از خطای تعیین ژنوتیپ (Teo et al., 2007) کنار گذاشته شدند. به این منظور سطح احتمال 6-10 در نظر گرفته شد که با استفاده از تصحیح بنفرونی بدست آمد.

 جهت بررسی الگوی انتخاب مثبت در سطح ژنوم این دو نژاد، FST در هر جایگاه با استفاده از روش  نااریب تتا (Weir&Cockerham, 1984) در محیط R محاسبه گردید. FST یک روش ارزیابی تفرق جمعیتی بر پایه داده­های چندشکلی ژنتیکی می باشد. ارزش های حاصل می­توانند بین 0 (بدون تفاوت) تا 1 (تفاوت کامل، که هر جمعیت برای آلل متفاوتی فیکس شده اند) متغیر باشد. به هر حال با توجه به اینکه این روش یک برآوردگر نااریب است احتمال بدست آوردن ارزش های منفی نیز وجود دارد (Akey et al., 2002). در این تحقیق برای تعیین فازهای هاپلوتیپی در جایگاه­های ژنومی حامل سیگنال های انتخاب از برنامه PHASE v.2.1 (Stephens et al., 2001) استفاده شد، که بر پایه روش های آماری بیزین استوار است. سپس هاپلوتیپ­های حاصل به عنوان فایل ورودی در برنامه SWEEP v.1.1 (Sabeti et al., 2002) به کار برده شدند. از این برنامه جهت محاسبه EHH[8] و ترسیم گراف های شاخه­بندی[9] هاپلوتیپی استفاده شد.  

  جهت بررسی QTLهای احتمالی گزارش شده در گاو در مناطق ژنومی مورد نظر، ابتدا توالی ژنومی گوسفند در این ناحیه در فاصله­ای که SNPها در صدک 9/99 بالای ارزش تتا واقع شده­ بودند با استفاده از Sheep Gbrowser v.1.0 (Dalrymple et al., 2007) به دست آمد. برای تعیین موقعیت ژنومی SNPها در سطح ژنوم از OAR true chromosomes (ver.1.0, as at 5/2008) مرکز CSIRO استرالیا استفاده شد. سپس توالی های اورتولوگوس[10] بر روی ژنوم گاو با استفاده از جستجوی BLAT در UCSC Genome Browser (Baylor 4.0/bosTau4 Assembly, Oct. 2007) شناسایی شد. BLAT یک روش سریع برای یافتن توالی هایی با مشابهت 95% یا بیشتر در سطح ژنوم گونه های مختلف می باشد. در مرحله بعد برای بررسی این که آیا مناطق مورد نظر با QTLهای شناسایی شده در مناطق  اورتولوگوس گاوهای شیری و گوشتی همپوشانی دارد یا خیر، دو مرکز اطلاعاتی آنلاین QTL شامل http://genomes.sapac.edu.au/bovineqtl/index.html و http://www.animalgenome.org/QTLdb/cattle.html  مورد بررسی قرار گرفتند.

 

نتایج و بحث

پس از اجرای مراحل مختلف کنترل کیفیت داده­های اولیه مجموع 47166 مارکر SNP جهت اجرای آنالیزهای بعدی انتخاب شدند. توزیع SNPها روی کروموزوم­های مختلف متفاوت، ولی میانگین فاصله دو SNP مجاور نسبتاً یکسان و حدود kb 59 بود. در نهایت 45 حیوان از هر نژاد (شامل 36 حیوان ماده و 9 حیوان نر) توانستند مراحل مختلف کنترل کیفیت را بگذرانند و در آنالیزهای نهایی استفاده شوند.

نتایج تحقیقات گسترده بر روی گاو در طی چند سال اخیر نشان داده است که اهلی کردن و به دنبال آن شکل گیری نژادها و انتخاب طبیعی یا مصنوعی باعث ایجاد سیگنال­های انتخاب در مناطق مختلف ژنوم شده است (Barendse et al., 2009; MacEachern et al., 2009; Hayes et al., 2009; Stella et al., 2010; Qanbari et al., 2010) که می­توان این جایگاه­ها را از طریق مقایسه تمایز جمعیتی در نژادهای مختلف با استفاده از روش های آماری مناسب شناسایی کرد. در این تحقیق که جزء یکی از اولین مراحل توسعه نقشه انتخاب در سطح ژنوم گوسفند با استفاده از آرایه­های SNP می باشد، برای شناسایی مناطق ژنومی که در دو نژاد ایرانی زل و لری-بختیاری هدف انتخاب­های مختلف قرار گرفته­اند از آماره نااریب تتا (Weir&Cockerham, 1984) استفاده شد. این آماره پس از به کارگیری موفقیت­آمیز در ترسیم اولین نقشه انتخاب در انسان (Akey et al. 2002) به طور گسترده ای در تحقیقات مختلف جهت شناسایی جایگاه­های کاندیدای ژن­ها استفاده شده است. پس از محاسبه ضرایب تتا در هر جایگاه مارکری با توجه به این که انتخاب، علاوه بر موتاسیون سودمند مارکرهای مجاور آن را هم تحت تأثیر قرار می دهد و از طرف دیگر برای نمایش بهتر سیگنال های انتخاب در سطح ژنوم به جای در نظر گرفتن ارزش هر SNP میانگین ارزش تتا مربوط به پنج SNP مجاور محاسبه و تحت عنوان ارزش Win5 هر مارکر در نظر گرفته شد و توزیع آن در سطح ژنوم مورد بررسی قرار گرفت (شکل 1).


 

 

شکل 1- توزیع ارزش­های Win5 تتا در سطح ژنوم نژاد زل در مقایسه با نژاد لری-بختیاری: موقعیت ژنومی SNPها بر روی محور X و ارزش تتا آنها بر روی محور Y نمایش داده شده است. خط ترسیم شده نشان­دهنده 99/99 صدک کروموزوم­های اوتوزوم و X است.

Figure 1- Distribution of windowed theta values for Zel versus Lori-Bakhtiari breeds by chromosome: SNP position in the genome is shown on the X-axis, and win5 theta values are plotted on the Y-axis. The values above the line are in the 99.99 percentile of autosomal and chromosome X SNPs.

 

 

ارزش­های تتا در کروموزوم­های اوتوزوم و X به ترتیب با میانگین 034/0 و 047/0 به طور معنی داری با هم متفاوت بودند (8-10>P). این تفاوت به دلیل هموزیگوت بودن SNPهای حیوانات نر در این کروموزوم و در نتیجه کوچکتر بودن اندازه مؤثر جمعیت در آن است. به همین خاطر کروموزوم­های اوتوزوم و X به صورت جداگانه مورد بررسی قرار گرفتند. نتایج این تحقیق نشان داد در چندین منطقه ژنومی SNPهای مجاور دارای تفرق جمعیتی بالایی بودند به خصوص در 5 منطقه ژنومی شامل کروموزوم­های 2 (موقعیت 625,744,73 بازی)، 5 (موقعیت 230,263,47 بازی)، 7 (موقعیت 058,525,30 بازی)، 7 (موقعیت 598,818,46 -080,765,46 بازی) و X (موقعیت 364,571,59 بازی) ارزش های تتا در 99/99 صدک بالای کل جایگاه­های مورد مطالعه واقع شده و بسیار معنی دار بودند. ارزش 399/0 و 725/0 به ترتیب در کروموزوم­های اوتوزوم و X در صدک 99/99 قرار داشتند. هر چند سایر مناطق با سطح معنی­داری پایین­تر نیز می توانند به عنوان مناطق کاندیدای انتخاب مطرح شوند ولی در این مقاله این مناطق که بیشترین تمایز جمعیتی را در بین این دو نژاد نشان می دهند مورد بررسی بیشتر قرار گرفتند.

 بر اساس تئوری Hitchhiking، انتخاب در جهت افزایش فراوانی موتاسیون­های سودمند در نژاد­های مختلف باعث می شود در برخی از مناطق ژنوم یک آلل نه تنها دارای فراوانی بالا باشد بلکه دارای LD در یک دامنه طولانی هم باشد در حالی که، همان طور که قبلاً بیان شد بر اساس تئوری خنثی انتظار می رود که نوترکیبی در طی مدت افزایش فراوانی آلل جدید باعث شکستن LD در مناطق مجاور شود (Sabeti et al., 2006). تحقیقی در این زمینه در انسان بر روی ژن [11]LCT نشان داد که یک هاپلوتیپ به طول حدود Mb 1 در بیش از 77% جمعیت های اروپایی وجود دارد، در حالی که فراوانی این هاپلوتیپ در جمعیت های آسیایی 0% می باشد (Bersaglier et al., 2004). این ژن در هضم لاکتوز شیر نقش دارد که در بیشتر جمعیت های انسانی فعالیت آن فقط تا دوران بلوغ ادامه دارد ولی در جمعیت های اروپایی فعالیت آن پس از سن بلوغ هم ادامه می یابد. در این تحقیق جهت بررسی LD در مناطق ژنومی مورد نظر از آماره EHH استفاده شد (شکل 2). این آماره ابزار قدرتمندی است که فرسایش LD در اطراف منطقه ژنومی کاندیدای انتخاب را با ارزیابی خصوصیات هاپلوئیدی در داخل یک جمعیت مورد بررسی قرار می دهد (Sabeti et al., 2002). جایگاه­هایی که دارای فراوانی بالا و همچنین EHH بالایی در مجاور آلل انتخابی باشند هدف انتخاب­های مثبت بوده و به خصوص در دام­ها، که علاوه بر انتخاب طبیعی تحت انتخاب مصنوعی نیز قرار دارند می توانند جزء جایگاه­های کاندیدا برای ژن­های عمده­اثر باشند (Hayes et al., 2008).  نتایج نشان داد که در نژاد لری بختیاری در جایگاه­های ژنومی کروموزوم 2 و 5 آلل­های C نه تنها دارای فراوانی آللی بالایی (به ترتیب 78% و 93%) هستند، بلکه LD اطراف آنها نسبت به آلل­های متناظر خود که دارای فراوانی پایینی می باشند نیز بیشتر است که به نظر می رسد این مناطق ژنومی در این نژاد­ به شدت تحت تأثیر انتخاب مثبت بوده است. درحالی که، در جایگاه­های کروموزومی مورد نظر در کروموزوم 7 پدیده مشابهی در جهت افزایش فراوانی آلل مطلوب در نژاد زل اتفاق افتاده است.

 


 

 

شکل 2- فراوانی آللی SNP­های نشان دهنده سیگنال انتخاب و توزیع EHH در اطراف آلل­های انتخابی در نژاد های لری-بختیاری (چپ) و زل (راست). در شکل های بالا، نمودار آللی که فراوانی بیشتری دارد با رنگ تیره­تر نمایش داده شده است.

Figure 2: Allelic frequencies of SNPs showing signature of selection and the EHH at varying distances from the core selected alleles in Lori-Bakhtiari (Left) versus Zel (right). The curve of alleles with higher frequency has been showed in a darker color.

 

 

 

در کروموزوم X بررسی­ها نشان داد که آلل­های مجاور در یک فاصله طولانی در نژاد لری بختیاری فیکس شده بودند به همین خاطر آلل­هایی که در 9/99 صدک بالایی بودند به عنوان هسته مرکزی در آنالیز EHH در نظر گرفته شدند که نتایج نشان دادند که آلل CAAACC در این موقعیت ژنومی نه تنها دارای فراوانی 94% بوده بلکه LD آن با جایگاه­های اطراف نیز بالا می باشد در حالی که همین آلل در نژاد زل دارای فراوانی 15% و LD پایینی می باشد که بیانگر انتخاب در این موقعیت ژنومی در نژاد لری بختیاری می باشد. از طرفی در جایگاه­های موردنظر آلل­های متناظر آنچه بحث شد در نژاد دیگر دارای فراوانی بالا بوده و EHH نسبتاً مشابه آلل­های با فراوانی پایین دارند که این مشاهده نمایانگر تفرق ژنتیکی در این مناطق کروموزومی در این دو نژاد است. برای بررسی بیشتر این فرضیه گراف های شاخه­بندی هاپلوتیپی در این جایگاه­ها در دو نژاد ترسیم گردید. شکل 3 شکستن LD با افزایش فاصله از آلل­های انتخابی به عنوان هسته مرکزی را نشان می­دهد. قطر هر شاخه بیانگر تعداد نمونه­هایی است که دارای هاپلوتیپ­های مشابهی هستند. نتایج حاصل به خوبی تفرق جمعیتی در این مناطق ژنومی در نژادهای ایرانی را نشان می­دهد و بیانگر این است که انتخاب در این مناطق ژنومی منجر به تمایز این دو نژاد در صفات منحصر به فرد آنها شده است.

در این تحقیق یرای بررسی QTLهای احتمالی شناسایی شده در مناطق ژنومی مورد نظر در گوسفند، این مناطق با مناطق ژنومی متناظر خود در روی ژنوم گاو مقایسه شدند، زیرا تحقیقات انجام شده در گاو در طی سالیان اخیر بسیار جامع­تر از گوسفند بوده است. بررسی QTLهای گزارش شده در مناطق اورتولوگوس در گاوهای شیری و گوشتی نشان داد که تقریباً تمامی جایگاه­های مدنظر با QTL های گزارش شده برای صفات مهم اقتصادی از جمله صفات مرتبط با چربی و لاشه و صفات عملکردی همپوشانی دارند (جدول 1). عدم مشاهده QTL در جایگاه­ ژنومی کروموزوم X عمدتاً به این دلیل است که در مکان­یابی QTL در تحقیقات مختلف، کروموزوم­های جنسی کمتر مورد بررسی قرار گرفته شده­اند. با توجه به این که یکی از اصلی­ترین تفاوت­های این دو نژاد ذخیره چربی در دنبه است، انتظار می رود که تعدادی از سیگنال­­های مشاهده شده در این تحقیق مربوط به این صفت باشند. یک راه برای شناسایی این مناطق ژنومی طراحی آزمایشات مستقل با استفاده از تعداد زیادی نژاد دیگر است. گروه­بندی نژادهای خارجی به صورت دنبه­دار و بدون دنبه و بررسی سیگنال­های انتخاب مشترک که با استفاده از نژادهای موجود در پروژه Sheep HapMap امکانپذیر است، می تواند یک راه­حل امیدوار کننده برای شناسایی این ژن­ها فراهم کند. در نهایت این تحقیق، که جزء اولین کاوش­های ژنومیک در سطح ژنوم گوسفند محسوب می­شود می تواند منبع اطلاعاتی با ارزشی در جهت شناسایی مناطق ژنومی کاندیدا برای بسیاری از صفات مهم اقتصادی، از جمله ذخیره چربی در دنبه که یکی از مسائل چالش برانگیز در بسیاری از کشورهای پرورش دهنده این نژادها محسوب می شود فراهم آورد.

 

سپاسگذاری

نویسندگان مقاله از همکاری صمیمانه مرکز اصلاح نژاد کشور، به دلیل در اختیار گذاشتن حیوانات تحت پوشش و رکوردهای جمع­آوری شده و مرکز AgResearch نیوزلند، به خاطر کمک های ارزنده­شان جهت ژنوتایپ و آنالیز داده­ها کمال تشکر را دارند. این تحقیق با حما­یت های مالی مرکز اصلاح نژاد و مؤسسه تحقیقات علوم دامی کشور، قطب علمی بهبود لاشه دانشگاه تهران، موسسه مبارک اندیش و مرکز تحقیقاتی AgResearch نیوزلند انجام شد که بدینوسیله از این مراکز صمیمانه قدردانی می شود.


 

 

 

 

 

 

 

 شکل 3- فراوانی آللی SNP­های نشان دهنده سیگنال انتخاب و گراف­های شاخه­بندی هاپلوتیپی در اطراف آنها در نژاد های لری-بختیاری (چپ) و زل (راست).

Figure 3: Allelic frequencies of SNPs showing signature of selection and their haplotype bifurcation diagrams at varying distances from the core selected alleles in Lori-Bakhtiari (Left) versus Zel (right).

 

جدول 1- QTLهای گزارش شده در ناحیه اورتولوکوس گاوی در مناطق ژنومی نشان دهنده تفرق جمعیتی بین نژادهای زل و لری-بختیاری.

Table 1: Bovine published QTLs in regions showing evidence of selection in Zel vs Lori-Bakhtiari data set.

موقعیت ژنومی در گوسفند

Location on Ovine genome

موقعیت ژنومی در گاو

Location on Bovine genome

QTLهای شناسایی شده

Reported QTLs

OAR2:73,628,609-73,861,345

Chr8:45,226,663-45,415,081

طول بدن ( تولد)        Body length (birth)

 

 

وزن بدن ( تولد)      Body weight (birth)

 

 

وزن لاشه                      Carcass weight

 

 

ضخامت چربی                      Fat Depth

 

 

سرعت شیردهی               Milking speed

 

 

وزن بدن (بلوغ)   Body weight (mature)

 

 

عمق چربی                            Fat Depth

 

 

 

OAR5:47,146,900-47,332,222

Chr7:44,936,435-45,113,988

ضخامت چربی                 Fat thickness

 

 

نرخ تخمک اندازی          Ovulation Rate

 

 

 

OAR7:30,510,065-30,587,784

Chr10:29,363,930-29,441,529

وزن بدن ( تولد)    Body weight (birth)

 

 

آسان زایی (مادری)             Calving ease

 

 

وزن لاشه                     Carcass weight

 

 

چربی شیر                     Milk fat yield

 

 

وزن لاشه گرم       Hot Carcass Weight

 

 

 

OAR7:46,639,859-46,910,155

Chr10:45,312,778-45,581,699

عمق بدن                           Body depth

 

 

آسان زایی (مادری)             Calving ease

 

 

چربی شیر                      Milk fat yield

 

 

وزن لاشه گرم      Hot Carcass Weight

 

 

نرخ عدم بازگشت در 90 روزگی

Nonreturn rate of 90 d

 

 

 

OARX:59,192,476-60,151,772

ChrX:51,751,347-52,712,765

 

 

منابع

Akey JM, Zhang G, Zhang K, Jin L, Shriver MD (2002). Interrogating a high density SNP map for signatures of natural selection. Genome Research 12:1805-14.

Akey JM (2009). Constructing genomic maps of positive selection in humans: Where do we go from here. Genome Research 19:711-722.

Barendse W, Harrison BE, Bunch RJ, Thomas MB, Turner LB (2009). Genome wide signatures of positive selection: The comparison of independent samples and the identification of regions associated to traits. BMC Genomics 10:178.

Bersaglieri T, Sabeti PC, Patterson N, Vanderploeg T, Schaffner SF, Drake JA, Rhodes M, Reich DE, Hirschhorn JN (2004). Genetic signatures of strong recent positive selection at the Lactase gene. American Journal of Human Genetics 74:1111–1120.

Carlson CS, Thomas DJ, Eberle MA, Swanson JE, Livingston RJ, Rieder MJ Nickerson1 DA (2005). Genomic regions exhibiting positive selection identified from dense genotype data. Genome Research 15:1553–1565

Dalrymple BP, Kirkness EF, Nefedov M, McWilliam S, Ratnakumar A, Barris W, Zhao S, Shetty J, Maddox JF, O'Grady M, et al. (2007). Using comparative genomics to reorder the human genome sequence into a virtual sheep genome. Genome Biology 8:R152.

Gu J, Orr N, Park SD, Katz LM, Sulimova G, MacHugh DE,  Hill EW (2009). A genome scan for positive selection in thoroughbred horses. PLoS ONE 4:e5767.

Hayes BJChamberlain AJ, Maceachern S,  Savin K,  McPartlan  H, MacLeod  I, Sethuraman  L, Goddard ME (2009). A genome map of divergent artificial selection between Bos taurus dairy cattle and Bos taurus beef cattle. Animal Genetics 40:176-184. 

Hayes BJChamberlain AJ, Maceachern S,  Savin K,  McPartlan  H, MacLeod  I, Sethuraman  L, Goddard ME (2009). A genome map of divergent artificial selection between Bos taurus dairy cattle and Bos taurus beef cattle. Animal Genetics 40:176-184. 

Hayes BJ, Lien S, Nilsen H, Olsen HG, Berg P, MacEachern S, Potter S, Meuwissen THE (2008). The origin of selection signatures on bovine chromosome six. Animal Genetics 39:105-111.

Helms C (1990). Salting out Procedure for Human DNA extraction. Retrieved April 20, 2010, from http://humgen.wustl.edu/hdk_lab_manual/dna/dna2.html

Kijas JW, Townley D, Dalrymple BP, Heaton MP, Maddox JF, McGrath A, Wilson P, Ingersoll RG, McCulloch R, McWilliam S, Tang D, McEwan J, et al. (2009). A genome wide survey of SNP variation reveals the genetic structure of sheep breeds. PLoS ONE 4:e4668.

Kimura M (1983). The neutral theory of molecular evolution. Cambridge University Press, New York.

MacEachern S, Hayes B, McEwan J, Goddard M (2009). An examination of positive selection and changing effective population size in Angus and Holstein cattle populations (Bos taurus) using a high density SNP genotyping platform and the contribution of ancient polymorphism to genomic diversity in Domestic cattle. BMC Genomics 10:181.

Qanbari S, Gianola D, Hayes B, Schenkel F, Miller S, Moore S, Thaller G, Simianer H (2011). Application of site and haplotype-frequency based approaches for detecting selection signatures in cattle. BMC Genomics 12:318.

Sabeti PC, Schaffner SF, Fry B, Lohmueller J, Varilly P, Shamovsky O, Palma A, Mikkelsen TS, Altshuler D, Lande ES (2006). Positive natural selection in the human lineage. Science 3129:1614-1620.

Sabeti, PC, Reich DE, Higgins JM, Levine HZP, Richter DJ, Schaffner SF, Gabriel SB, Platko JV, Patterson NJ, McDonald GJ, et al. (2002). Detecting recent positive selection in the human genome from Haplotype structure. Nature 419:832-837.

Stella A, Ajmone-Marsan P, Lazzari B, Boettcher P (2010). Identification of selection signatures in cattle breeds selected for dairy production. Genetics 185:1451-1461.

Stephens JC, Reich DE, Goldstein DB, Shin HD, Smith MW, Carrington M, Winkler C, Huttley GA, Allikmets R, Schriml L, et al. (1998). Dating the origin of the CCR5-D32 AIDS-resistance allele by the coalescence of haplotypes. American Journal of Human Genetetics 62:1507-1515.

Teo YY, Fry AE, Clark TG, Tai ES, Seielstad M (2007). On the usage of HWE for identifying genotyping errors. Annals of Human Genetics 71:701-703.

Weir BS, Cockerham CC (1984). Estimating F-statistics for the analysis of population structure. Evolution 38:1358-1370.

 

Whole-genome scan of population differentiation in Zel and Lori-Bakhtiari sheep breeds

Moradi M.H.*1, Nejati-Javaremi A.2, Moradi-Shahrbabak M.3, Dodds K.G.4, McEwan J.C.4

1Ph.D. student, Department of Animal Science, University of Tehran, Karaj, Iran.

2Associate Professor, Department of Animal Science, University of Tehran, Karaj, Iran.

3Professor, Department of Animal Science, University of Tehran, Karaj, Iran.

4Senior scientists, Centre for Reproduction and Genomics, AgResearch, Invermay, New Zealand.

 

Abstract

Selection for increasing of frequency in new mutations that are advantageous only in a subset of populations leaves some signatures in the genome. Detecting these genomic regions is one of the most important areas of research in animal genetics since locations of selection signatures are often correlated with QTLs affecting economically important traits. In this paper, a whole genome scan using ~54000 SNP markers was performed in two main Iranian sheep breeds, namely Zel and Lori-Baktiari, with the aim of identifying divergently selected regions of the genome. Study of population differentiation across the genome using Weir and Cockerham’s FST test revealed some regions showing evidence of selection. In this paper, five regions which were in the 99.99 percentile of the genome distribution of FST scores were selected for further analysis. These regions were located in chromosomes 2, 5, 7 (two areas) and X. To evaluate the selection sweep, due to linkage disequilibrium, associated with these signatures we employed the Extended Haplotype Homozygosity (EHH) test. The results of this test as well as a study of haplotype bifurcation diagrams in these breeds also confirmed large allele differentiation in these regions. Finally, study of reported QTL regions in the orthologous areas of the cattle genome showed that they overlapped with the reported cattle QTLs, representing economically important traits such as carcass yield and reproductive traits. In conclusion, the results from this study provide one of the first attempts to develop a genome-wide map of selection footprints in the sheep genome and may facilitate the identification of genes affecting traits which are divergent in these two Iranian sheep breeds.

Key words: Whole-genome scan, Population differentiation, Signatures of selection.



*  نویسنده مسئول: محمدحسین مرادی                   تلفن: 09183659133                        E. Mail: Moradi.hosein@gmail.com   

[1]- Neutral theory

[2] - Derived Mutant

[3]- Linkage Disequilibrium

[4]- Signatures

[5]- International Sheep Genomics Consortium

[6]- Principal Component Analysis

[7]- Minor Allele Frequency

[8]- Extended Haplotype Homozygosity

[9]- Bifurcation diagram

[10]- Orthologous

[11]- Lactose gene

* Corresponding Author: Moradi M.H.           Tel: 09183659133                 Email: Moradi.hosein@gmail.com

Akey JM, Zhang G, Zhang K, Jin L, Shriver MD (2002). Interrogating a high density SNP map for signatures of natural selection. Genome Research 12:1805-14.
Akey JM (2009). Constructing genomic maps of positive selection in humans: Where do we go from here. Genome Research 19:711-722.
Barendse W, Harrison BE, Bunch RJ, Thomas MB, Turner LB (2009). Genome wide signatures of positive selection: The comparison of independent samples and the identification of regions associated to traits. BMC Genomics 10:178.
Bersaglieri T, Sabeti PC, Patterson N, Vanderploeg T, Schaffner SF, Drake JA, Rhodes M, Reich DE, Hirschhorn JN (2004). Genetic signatures of strong recent positive selection at the Lactase gene. American Journal of Human Genetics 74:1111–1120.
Carlson CS, Thomas DJ, Eberle MA, Swanson JE, Livingston RJ, Rieder MJ Nickerson1 DA (2005). Genomic regions exhibiting positive selection identified from dense genotype data. Genome Research 15:1553–1565
Dalrymple BP, Kirkness EF, Nefedov M, McWilliam S, Ratnakumar A, Barris W, Zhao S, Shetty J, Maddox JF, O'Grady M, et al. (2007). Using comparative genomics to reorder the human genome sequence into a virtual sheep genome. Genome Biology 8:R152.
Gu J, Orr N, Park SD, Katz LM, Sulimova G, MacHugh DE,  Hill EW (2009). A genome scan for positive selection in thoroughbred horses. PLoS ONE 4:e5767.
Hayes BJ, Lien S, Nilsen H, Olsen HG, Berg P, MacEachern S, Potter S, Meuwissen THE (2008). The origin of selection signatures on bovine chromosome six. Animal Genetics 39:105-111.
Helms C (1990). Salting out Procedure for Human DNA extraction. Retrieved April 20, 2010, from http://humgen.wustl.edu/hdk_lab_manual/dna/dna2.html
Kijas JW, Townley D, Dalrymple BP, Heaton MP, Maddox JF, McGrath A, Wilson P, Ingersoll RG, McCulloch R, McWilliam S, Tang D, McEwan J, et al. (2009). A genome wide survey of SNP variation reveals the genetic structure of sheep breeds. PLoS ONE 4:e4668.
Kimura M (1983). The neutral theory of molecular evolution. Cambridge University Press, New York.
MacEachern S, Hayes B, McEwan J, Goddard M (2009). An examination of positive selection and changing effective population size in Angus and Holstein cattle populations (Bos taurus) using a high density SNP genotyping platform and the contribution of ancient polymorphism to genomic diversity in Domestic cattle. BMC Genomics 10:181.
Qanbari S, Gianola D, Hayes B, Schenkel F, Miller S, Moore S, Thaller G, Simianer H (2011). Application of site and haplotype-frequency based approaches for detecting selection signatures in cattle. BMC Genomics 12:318.
Sabeti PC, Schaffner SF, Fry B, Lohmueller J, Varilly P, Shamovsky O, Palma A, Mikkelsen TS, Altshuler D, Lande ES (2006). Positive natural selection in the human lineage. Science 3129:1614-1620.
Sabeti, PC, Reich DE, Higgins JM, Levine HZP, Richter DJ, Schaffner SF, Gabriel SB, Platko JV, Patterson NJ, McDonald GJ, et al. (2002). Detecting recent positive selection in the human genome from Haplotype structure. Nature 419:832-837.
Stella A, Ajmone-Marsan P, Lazzari B, Boettcher P (2010). Identification of selection signatures in cattle breeds selected for dairy production. Genetics 185:1451-1461.
Stephens JC, Reich DE, Goldstein DB, Shin HD, Smith MW, Carrington M, Winkler C, Huttley GA, Allikmets R, Schriml L, et al. (1998). Dating the origin of the CCR5-D32 AIDS-resistance allele by the coalescence of haplotypes. American Journal of Human Genetetics 62:1507-1515.
Teo YY, Fry AE, Clark TG, Tai ES, Seielstad M (2007). On the usage of HWE for identifying genotyping errors. Annals of Human Genetics 71:701-703.
Weir BS, Cockerham CC (1984). Estimating F-statistics for the analysis of population structure. Evolution 38:1358-1370.