Identification of single nucleotide polymorphisms in Fars native chicken using whole genome sequencing data

Authors

1 MSc Student, Department of Animal Science, Shahid Bahonar University of Kerman, Kerman, Iran.

2 Professor, Department of Animal Science, Shahid Bahonar University of Kerman, Kerman, Iran.

3 PhD Student, Department of Animal Science, Shahid Bahonar University of Kerman, Kerman, Iran.

Abstract

One of the most important approaches in animal breeding is identification of structural variations responsible for economical important traits. Next generation sequencing technologies are provided accurate tools for this purpose. In the present study, Fars province native poultry genome was analyzed using genome sequencing approach. Paired-end sequencing of the whole genome was conducted by Illumina Company in China. Data quality was determined by FastQC software. Short reads of sequences were mapped with the reference genome with the BWA program. Single nucleotide polymorphisms and small deletions and insertions were identified with the GATK program. The short sequences were compared with the reference genome of over 99% and with the mean depth of the X8 coverage. In this study, 8858153 single nucleotide polymorphisms and 895378 small deletions and insertions were identified with the lowest counts in the exon region. Since the results of identifying the variants showed that the most frequent variant is related to single nucleotide polynomials، in this study, heterozygous loci were higher than homozygous loci indicating the high diversity of the population under study. Given the history of several thousand years of chicken domestication in Iran, one can expect that adaptation to the environment has occurred in the population studied. As a result of genomic changes in order to adapt to the environment, it has created a diversity in the population.

Keywords


شناسایی نشانگرهای تک نوکلئوتیدی در مرغ بومی فارس با استفاده از روش توالی یابی کل ژنوم

 

طاهره اسکندری1، علی اسمعیلی زاده کشکوئیه*2، محمدرضا محمدآبادی2، سعید سهرابی3

1 دانش‌آموخته کارشناسی ارشد اصلاح نژاد، بخش مهندسی علوم دامی، دانشکده کشاورزی، دانشگاه شهید باهنر کرمان، کرمان، ایران.

2 استاد بخش علوم دامی دانشگاه شهید باهنر کرمان، کرمان، ایران.

3 دانشجوی دکتری بخش علوم دامی، دانشکده کشاورزی و عضو انجمن پژوهشگران جوان، دانشگاه شهید باهنر کرمان، کرمان، ایران.

تاریخ دریافت: 26/01/1397، تاریخ پذیرش: 04/04/1397

چکیده

شناسایی تنوعات ساختاری مسئول تفاوتهای فنوتیپی در حیوانات اهلی از نظر اقتصادی اهمیت ویژه ای دارد. یکی از دقیق ترین و جدیدترین رویکردهای مورد استفاده در شناسایی این تنوعات، استفاده از تکنیک های توالی یابی نسل جدید است. در پژوهش حاضر، ژنوم مرغ بومی فارس به منظور شناسایی چندشکلی های تک نوکلئوتیدی و حذف و اضافه های کوتاه، با استفاده از داده های توالی­یابی کل ژنوم مورد بررسی قرار گرفت. نمونه های مورد بررسی توسط سیستم توالی یابی شرکت ایلومینا (Hiseq 2000) مورد تعیین توالی قرار گرفت. پس از بررسی کیفیت داده ها توسط نرم افزار FastQC، همردیفی توالی های کوتاه با ژنوم مرجع با برنامه BWA انجام و سپس چند ریختی­های تک نوکلئوتیدی و حذف و اضافه های کوچک به کمک برنامه GATK مشخص شدند. درصد همردیفی توالی­های کوتاه با ژنوم مرجع بالای 99 درصد بود. در این مطالعه 8858153 چند ریختی تک نوکلئوتیدی و 895378 حذف و اضافه کوچک بدست آمد که کمترین مقدار آن در ناحیه ­­اگزونی مشاهده شد. نتایج نشان داد چندریختی­های تک­نوکلئوتیدی هتروزیگوس فراوانی بیشتری نسبت به چند ریختی های هموزیگوس دارند که این نشان­دهنده تنوع زیاد جمعیت مورد بررسی است. همچنین باتوجه به پیشینه چند هزارساله اهلی شدن مرغ در ایران، می­توان انتظار داشت که تطابق پذیری با محیط در جمعیت مورد مطالعه اتفاق افتاده باشد و در نتیجه، تغییرات ژنومی در جهت سازگاری با محیط باعث ایجاد تنوع در جمعیت شده است.

واژه‌های کلیدی: توالی‌یابی ژنوم، چندریختی‌های تک نوکلئوتیدی، حذف و اضافه کوچک، تنوع جمعیت.

 

 


 

مقدمه

کشف و تعیین خصوصیات تنوعات بین و درون افراد می تواند منجر به شناسایی تفاوت های ژنتیکی عامل تنوع فنوتیپی شود. تا امروز روش ها و فناوری های مختلفی برای شناسایی این تنوعات ژنتیکی مورد استفاده قرار گرفته که روش های مبتنی بر فناوری های نسل جدید توالی یابی (NGS) به علت قدرت تفکیک و دقت بیشتری که نسبت به سایر روش ها در شناسایی تنوعات ژنتیکی دارند (Futschik and Schlötterer, 2010)، در چند سال گذشته به طور گسترده ای مورد استفاده قرار گرفته اند. تاکنون چندین نوع از تنوعات ژنتیکی در ژنوم موجودات مختلف شناسایی شده است که فراوانی دو گروه از این تنوعات یعنی چندشکلی های تک نوکلئوتیدی (SNP) و حذف و اضافه های کوچک (Indel) در ژنوم از بقیه بیشتر است (Mullaney et al., 2010). با توجه به توزیع گسترده چندشکلی های تک نوکلئوتیدی در سراسر ژنوم، این نوع از تنوعات ژنومی کاربرد بسیار زیادی در مطالعات مختلف ژنومی ازجمله پویش های ژنومی برای شناسایی جایگاه های موثر بر خصوصیات مختلف ژنتیکی دارند و پس از آن، حذف و اضافه های کوچک از نظر تراکم در ژنوم در مرتبه دوم قرار دارند (Mills et al., 2011). از آنجاکه حذف و اضافه های کوچک در مقایسه با چندشکلی های تک نوکلئوتیدی تعداد بیشتری از نوکلئوتیدهای ژنوم را در بر می گیرند، می توانند تاثیر بیشتری در عملکرد و بیان برخی ژن ها داشته باشند. بعنوان مثال، حذف و اضافه های موجود در ژن PMEL17 مرغ مسئول یکی از جهش های موثر در رنگ پرها (Kerje et al., 2004) و همچنین حذف و اضافه­های موجود در ژن گیرنده هورمون رشد مرغ مرتبط با کوتولگی هستند (Agarwal et al., 1994). مرغ اهلی در طی سال ها به دلیل ارزشی که در تولید غذای مورد نیاز انسان دارد، مورد اهمیت و توجه قرار گرفته است اما در طی دهه های اخیر از این پرنده سودمند به عنوان یک مدل بیولوژیک عالی نیز استفاده های زیادی شده است (Siegel et al., 2006). بیش از 8000 سال قبل، مرغ در جنوب شرقی آسیا اهلی شد (Kanginakudru et al., 2008) و امروزه بعنوان یکی از منابع مهم تامین پروتئین مصرفی انسان شناخته می شود. پرورش ماکیان در ایران و انتشار آن از  طریق این کشور تاریخچه­ای بسیار کهن دارد. ایران (پرشیا) یک امپراطوری بزرگ از قرن 5 قبل از میلاد تا  تقریبا قرن 7 میلادی بود و از هند (دهلی) تا دریاهای سیاه و مدیترانه گسترده بود. در آن زمان­ و بعد از آن، در قرون وسطی ایران در محل تقاطع راه­ها برای حمل و نقل محصولات، از قبیل ماکیان از شرق به غرب، هم از طریق خشکی و هم از طریق دریا قرار داشت. جنگ های زیادی در حوالی ایران و کشورهای همسایه در طی این دوره­ها نیز توسعه و گسترش جمعیت­های ماکیان را تسهیل کرد. حفاری­های باستان شناسی حضور ماکیان را در ایران در زمان­های باستان تأیید کرده است (Mohammadabadi et al., 2010). بر اساس تحقیقات  West and Zhouاستخوان­های یافت شده در ایران در سه منطقه وجود داشته­اند: دو کشف در تپه یحیی (Tepe Yahya) (جنوب شرقی ایران) به ترتیب متعلق به 3800 تا 3900 قبل از میلاد و 1000 قبل از میلاد و دیگری در تخت سلیمان (شمال غربی ایران) متعلق به 1000 قبل از میلاد (Mohammadabadi et al., 2010). شناسایی عوامل تعیین کننده ژنتیکی موثر در خصوصیات مهم اقتصادی یا بیماری ها یکی از نقاط توجه و تمرکز مطالعات ژنتیکی مرغ است که نیازمند داشتن اطلاعاتی از تنوعات موجود در توالی DNA و همچنین توسعه تعداد زیادی نشانگر ژنتیکی دارای اطلاعات مفید می باشد (Yan et al., 2014). مرغ قرمز جنگلی (نیای وحشی مرغ اهلی امروزی) اولین گونه از حیوانات اهلی بود که توالی یابی ژنوم آن کامل شد (Bai et al. 2012; Burt 2005; Hillier et al. 2004) و از آن زمان به بعد مطالعات زیادی برای شناسایی انواع تنوعات ساختاری ژنوم این پرنده انجام گرفت. در مطالعه ای که توسط Fan et al. (2013) انجام شد، بیش از 3/5 میلیون چندشکلی تک نوکلئوتیدی و 635000 حذف و اضافه کوچک در نژاد مرغ سیلکی (Silkie) و همچنین 1/5 میلیون چندشکلی تک نوکلئوتیدی و 633000 حذف و اضافه کوچک در یک نژاد مرغ بومی تایوان شناسایی شد. در مطالعه ای دیگر که توسط کنسرسیوم بین المللی نقشه یابی چندشکلی های ژنتیکی مرغ (International Chicken Polymorphism Map Consortium 2004) انجام گرفت، با مقایسه توالی ژنوم 3 مرغ اهلی (گوشتی، تخمگذار و سیلکی) با نیای وحشی (مرغ قرمز جنگلی)، در حدود 8/2 میلیون چندشکلی تک نوکلئوتیدی شناسایی و نقشه ای از تنوعات ژنتیکی مرغ تهیه شد. به منظور بررسی تنوعات ساختاری ژنوم مرغ، Yan et al. (2014) توالی ژنوم 12 نژاد مختلف مرغ را با عمق موثر 6/8 مورد مقایسه قرار دادند. در این مطالعه درحدود 7/1 میلیون حذف و اضافه کوچک و در حدود 16 میلیون چندشکلی تک نوکلئوتیدی شناسایی شد. در پژوهشی که روی 5 نژاد مرغ بومی کره ای انجام گرفت، Seo et al. (2015) در حدود 4 میلیون چند شکلی تک نوکلئوتیدی را شناسایی کردند. به دلیل اهمیتی که چندشکلی­های تک نوکلئوتیدی و حذف و اضافه های کوتاه در مطالعات ژنتیکی و شناسایی عوامل ژنتیکی موثر در خصوصیات مهم و اقتصادی دارند، و این که مطالعات انگشت شماری روی تنوع ژنتیکی مرغ بومی فارس انجام شده است (Mohammadifar et al., 2014; Mohammadifar and Mohammadabadi, 2017)، در پژوهش حاضر این تنوعات ساختاری در ژنوم مرغ بومی استان فارس و با استفاده از توالی کل ژنوم شناسایی و مورد بررسی قرار گرفت.

مواد و روش‌­ها

نمونه خون چهار قطعه مرغ بومی از مرکز اصلاح نژاد استان فارس گرفته شد. استخراج DNA از نمونه­های خون تهیه شده به روش استخراج نمکی انجام شد. جهت بررسی کیفیت DNA استخراج شده، از دو روش الکتروفورز با استفاده از ژل­ آگارز یک درصد به مدت نیم ساعت و همچنین دستگاه اسپکتروفتومتر استفاده شد. توالی یابی کل ژنوم به صورت Paired-End یا دو سویه توسط شرکت ایلومینا 2500 Hiseq در کشور چین انجام شد. در این روش، هر کدام از دو رشته رفت (Forward) و برگشت (Reverse) مربوط به هر قطعه توالی کوتاه توالی­یابی می شوند. در نخستین مرحله از آنالیز داده­ها، کیفیت داده­ها توسط برنامه FastQC بررسی شد. فایل داده­های توالی یابی کل ژنوم با پسوند .fastqc یا .fq می­باشد. برای هم­ردیفی توالی­های کوتاه با ژنوم مرجع، در ابتدا آخرین نسخه ژنوم مرجع مرغ (https://www.ensembl.org/Gallus-gallus/lnfo/Index) از سایت Ensembl دانلود شد. ژنوم مرجع حاوی 39 جفت کروموزوم است که 38 جفت آن اتوزوم و یک جفت آن کروموزوم جنسی است. در این تحقیق برای هم­ردیفی (Alignment) خروجی­های توالی یابی با ژنوم مرجع، از الگوریتم MEM در برنامه BWA استفاده شد. به دلیل اینکه داده­های توالی یابی شده به صورت دوسویه (Paired-end) هستند، در مرحله هم­ردیفی، فایل حاوی توالی­های رفت و برگشت به صورت همزمان در یک مرحله با ژنوم مرجع هم­ردیف شده و خروجی آن یک فایل با پسوند .sam است. به منظور کاهش حجم فایل خروجی، در مرحله بعد با استفاده از نرم افزار Samtools، کلیه فایل­های با پسوند sam. به فایل­های با پسوند .bam تبدیل شدند. جهت مرتب کردن توالی­های کوتاه موجود در هر کدام از فایل­های با پسوند bam. بر اساس موقعیت ژنومیک، از دستور Sort در برنامه Samtools استفاده شد. برای حذف توالی­های کوتاه تکراری (مضاعف شده) حاصل از واکنش زنجیره­ای پلیمراز در مرحله آماده سازی کتابخانه ژنومی قبل از توالی­یابی، از بسته MarkDuplicates در برنامه Picard استفاده شد. برای کاهش خطاهای حاصل از مرحله هم­ردیفی، یک مرحله هم­ردیفی مجدد (Realignment) با استفاده از برنامه GATK انجام شد به این ترتیب که از دو ابزار RealignerTargetCreator و IndelRealigner در برنامه GATK استفاده شد. به منظور تصحیح خطاهای توالی­یابی و دیگر خطاهای مربوط به آزمایش، با استفاده نرم­افزار GATK نمره کیفیت بازها مجدداً کالیبره شد. کیفیت نقشه­یابی با دو پارامتر درصد همردیفی توالی­های کوتاه با ژنوم مرجع و عمق پوشش بررسی شد. به منظور محاسبه درصد همردیفی با ژنوم و عمق پوشش، از دستورات flagtat  و depth در نرم افزار Samtools استفاد شد. چندریختی­های تک نوکلئوتیدی و حذف و اضافه­های کوچک با استفاده از ابزار SelectVariants در برنامه GATK  از هم جدا شدند. به منظور فیلتر کردن چندریختی­های تک نوکلئوتیدی و حذف و اضافه­های کوچک، از ابزار Variant Filtration در برنامه GATK استفاده شد. به منظور مستند­سازی یا انوتیشن، محاسبه شمار هموزیگوس­ها و هتروزیگوس­ها درچندریختی­های تک نوکلئوتیدی و حذف و اضافه­های کوچک، و همچنین شمار جهش­های جابه جایی و معکوس در چندریختی های تک نوکلئوتیدی، از برنامه SnpEff استفاده شد. به منظور بررسی ژن­های موجود در نواحی شناسایی شده و بررسی تاثیرات عملکردی آنها، آنالیز ژن آنتولوژی[1] انجام گرفت. برای این کار ابتدا مختصات[2] جایگاه­های مورد نظر شامل نام کروموزوم، نقطه شروع، نقطه پایان (برای چندریختی های تک نوکلئوتیدی، باید نقطه شروع و پایان یکسان باشد) با استفاده از ابزار VEP[3] در پایگاه Ensembl به آدرس

http://www.ensembl.org/info/docs/tools/vep/index.html جستجو شد تا شناسه[4] ژن­های دارای هم­پوشانی با این نواحی مشخص شود. این شناسه­ها در پایگاه DAVID[5] به آدرس https://david.ncifcrf.gov/ بارگذاری شدند تا اثرات عملکردی[6] آنها تعیین و آنالیز مسیرهای زیستی[7] مرتبط با آن انجام شود.

 

نتایج و بحث

در این تحقیق کل ژنوم چهار قطعه مرغ بومی فارس به منظور مطالعه و شناسایی چندریختی‌های تک نوکلوتیدی وحذف واضافه های کوچک توالی یابی گردید. نتایج کیفیت و کمیت DNA استخراجی برای هر چهارنوع مرغ بومی فارس نشان داد که DNA مورد نیاز برای توالی­یابی فاقد شکستگی و هرگونه مواد اضافی دیگر است (تصویر 1). از طرفی نتایج کنترل کیفیت داده­ها بوسیله نرم افزار FastQC نشان داد که توالی­ها (خوانش­ها)ی کوتاه دارای کیفیت بالا و فاقد هرگونه آلودگی بودند. طول توالی­های کوتاه برای همه داده­ها 125 نوکلئوتید بود. درصد همردیفی برای هر چهار نمونه بالای 99 درصد بود که این میزان نشان دهنده کیفیت بالای همردیفی داده­های توالی­یابی شده نسبت به ژنوم مرجع بود (جدول 1). چند ریختی­های تک­نوکلئوتیدی بعد از همردیفی توالی­های کوتاه با ژنوم مرجع استخراج شدند. تعداد چند­ریختی­های تک­نوکلئوتیدی برای هر چهار قطعه مرغ بومی فارس محاسبه گردید.

 

 

 

شکل 1- تعیین کیفیت نمونه های DNA استخراج شده با استفاده از ژل آگارز.

Figure 1- DNA quality control by agarose gel electrophoresis.

جدول 1- خلاصه هم ردیفی نمونه ها با ژنوم مرجع.

Table 1- Summary of short read alignment with reference genome.

میانگین عمق

Coverage

درصد همردیفی

Alignment percent

طول توالی های کوتاه

Short reads length

تعداد توالی های کوتاه

Number of short reads

نام نمونه

Sample name

8.02-8.5

99.85%

125

35774097

Fars127s

7.8-8.5

99.77%

125

35233730

Fars128s

7.6-8.3

99.82%

125

34264229

Fars129s

8.9-9.8

99.37%

125

40240508

Fars130s

 

 

در این تحقیق تعداد 8858153 چندریختی تک­نوکلئوتیدی بدست آمد (جدول2) که تعداد هتروزیگوس­ها بیشتر از هموزیگوس­ها بود (جدول4). تعداد کل جهش­های جابه­جایی 24059405 و تعداد کل جهش­های معکوس 10113770 و نسبت این دو نوع جهش به یکدیگر 379/2 بود (جدول4). نتایج مستندسازی چندریختی­های تک­نوکلئوتیدی نشان داد که از تعداد کل چندریختی­های تک­نوکلئوتیدی به ترتیب 677/9%، 794/1%، 158/29%، 727/48% و 945/9% در نواحی پایین دست، اگزون، بین­ژنی، اینترون و بالادست قرار داشتند. این نتایج مستندسازی نشان داده­اند که بیشتر چندریختی­های تک­نوکلئوتیدی در نواحی بین­ژنی و اینترون و کمترین درصد در ناحیه اگزون قرار دارند (جدول5). همچنین تعداد کل چندریختی­های تک­نوکلئوتیدی خاموش(هم معنی) 502/25%، بد معنی 164/0% و بی معنی 335/74% بدست آمد (جدول 6). کالینز و جاکز (1994) در پژوهشی نشان دادند تعداد چندریختی­های تک­نوکلئوتیدی که توسط جهش­های جابه­جایی تولید می­شوند، تقریباً دو برابر تعداد چندریختی­های تک­نوکلئوتیدی ایجاد شده توسط جهش­های معکوس هستند، که این به علت مکانیسم­های مولکولی ایجاد کننده جهش­ها در مولکول DNA ازجمله دی آمیناسیون اکسیداتیو است (Collins and Jukes, 1994). به طور کلی نسبت جهش­های جابه­جایی به معکوس یک شاخص مفید برای نشان دادن میزان خطای مثبت شناسایی چندریختی­های تک­نوکلئوتیدی است (McKenna et al, 2010). شمار کل حذف و اضافه کوچک در ژنوم این چهار نمونه تعداد 895378 بود (جدول2) که در هر چهار نمونه مورد بررسی، تعداد حذف و اضافه­های کوچک هموزیگوس از تعداد حذف­ و اضافه­های کوچک هتروزیگوس بیشتر بود (جدول3). با مقایسه نتایج حاصل از پژوهش حاضر با سایر پژوهش های مشابه ، تفاوت در تعداد چند شکلی های تک نوکلئوتیدی و حذف و اضافه های کوتاه شناسایی شده را می توان دید. این تفاوت را می توان به عواملی همچون تعداد نمونه مورد بررسی، نوع سیستم توالی یابی، عمق توالی یابی و روش مورد استفاده برای آنالیز داده نسبت داد (Abel and Duncavage 2013). نتایج مستندسازی حذف ­و اضافه­های کوچک نشان داد که بیشتر حذف و اضافه­های کوچک در ناحیه اینترون ( 428/50%) و بین ژنی 188/29 % و کم­ترین مقدار مربوط به اگزون 984/0% بود (جدول 5). همچنین نتایج مشابه­ای در سایر مطالعات شناسایی حذف­ و اضافه­های ژنوم با استفاده از تکنیک توالی­یابی کل ژنوم در مرغ (Yan et al, 2014; Fleming et al, 2016) بدست آمد. در مجموع 1023 ژن با جایگاه های شناسایی شده در پژوهش حاضر مرتبط بود (فایل ضمیمه شماره 1) که توزیع این ژن ها در کروموزوم های مختلف در تصویر 2 قابل مشاهده است. همچنین پس از بررسی آنتولوژی مشخص شد که این ژن ها رابطه معنی داری (P < 0.01) با اصطلاحات ژنی مختلف ازجمله تنظیم فرآیندهای متابولیک سلولی، تقارن، اتصال یون ها و... داشتند. نتایج این آنالیز در فایل ضمیمه شماره 2 ارائه شده است. انجام آنالیز مسیرهای زیستی هیچ نتیجه معنی داری در پی نداشت.

 

نتیجه‌گیری

نتایج حاصل از شناسایی واریانت­ها نشان داد که بیشترین فراوانی واریانت مربوط به چندریختی­های تک نوکلئوتیدی است. همچنین، چندریختی­های تک­نوکلئوتیدی هتروزیگوس نسبت به هموزیگوس بیشتر بود که این می­تواند نشان­دهنده تنوع بالای جمعیت مورد نظر باشد.

 

 

شکل 2- توزیع ژن های مرتبط با جایگاه های شناسایی شده در کروموزوم های مختلف.

Figure 2- Frequency of genes related to detected variants in different chromosomes.

جدول 2- تعداد چندریختی­های تک­نوکلئوتیدی و حذف و اضافه­های کوچک برای چهار نمونه قبل و بعد از فیلترکردن.

Table 2- Number of raw and filtered SNPs and Indels.  

تعداد INDELS

Number of Indels

تعداد  SNP بعد از فیلتر

Number of filtered SNPs

تعداد SNP قبل از فیلتر

Number of raw SNPs

نام نمونه

Sample name

661028

5646337

6526386

127s

674423

5919961

6864563

128s

659753

5760609

6673783

129s

675141

6282455

7345131

130s

895378

8858153

10717349

Total

 

جدول 3- تعداد چند ریختی­های تک نوکلئوتیدی و حذف و اضافه­های کوچک هموزیگوس و هتروزیگوس در نمونه ها.

Table 3- Number of homozygous and heterozygous SNPs and Indels.

تعداد Indel هموزیگوس

Number of homozygous Indels

تعداد Indel هتروزیگوس

Number of heterozygous Indels

تعداد SNP هموزیگوس

Number of homozygous SNPs

تعداد SNP هتروزیگوس

Number of heterozygous SNPs

نام نمونه

Sample name

371365

289663

2826390

2819947

127s

370909

303514

2798864

3121097

128s

371547

288206

2841948

2918661

129s

312214

362927

2248136

4034319

130s

 

جدول4- شمار جهش­های جابه­جایی و معکوس در چند ریختی­های تک نوکلئوتیدی.

Table 4- Number of transition and transversion SNPs.

نسبت جهش های جابه­جایی به معکوس

Transition to transversion ratio

تعداد جهش­های معکوس

Number of transversion mutations

تعداد جهش­های جابه جایی

Number of transition mutations

نام نمونه

Sample name

2.372

2501355

5933722

127s

2.377

2570362

6110071

128s

2.378

2535152

6029337

129s

2.388

2506901

5986275

130s

2.379

10113770

24059405

کل

Total

جدول 5- تعداد چند ریختی­های تک نوکلئوتیدی و حذف و اضافه­های کوچک در نواحی مختلف ژنوم.

Table 5- Distribution of SNPs and Indels in genome.

حذف و اضافه­های کوچک    Indels

چند ریختی­های تک نوکلئوتیدی        SNPs

نوع   Type

155709 (9.523%)

1529128 (9.677%)

پایین دست     Downstream

16097 (0.984%)

283475 (1.794%)

اگزون       Exonic

477258 (29.188%)

4607664 (29.158%)

بین ژنی Intergenic

824537 (50.428%)

7699931 (48.727%)

اینترون Intronic

187 (0.011%)

520 (0.003%)

SPLICE_SITE_ACCEPTOR

203 (0.012%)

648 (0.004%)

SPLICE_SITE_DONOR

3607 (0.221%)

27055 (0.171%)

SPLICE_SITE_REGION

147250 (9.006%)

1571534 (9.945%)

بالا دست  Upstream

9200 (0.563%)

67405 (0.427%)

UTR_3_PRIME

1015 (0.062%)

14931 (0.094%)

UTR_5_PRIME

 

جدول 6- شمار چندریختی­های تک­نوکلئوتیدی با اثرات مختلف در ژنوم.

Table 6- Number of SNPs with different effects in genome.

خاموش (درصد) Silent (%)

بی­معنی(درصد) Nonsense (%)

بدمعنی(درصد) Missense (%)

128189 (74.335%)

282 (0.164%)

43977 (25.502%)

 


با توجه به پیشینه چند هزارساله اهلی شدن مرغ در ایران، می­توان انتظار داشت که تطابق پذیری با محیط در جمعیت مورد مطالعه اتفاق افتاده باشد. در نتیجه تغییرات ژنومی در جهت سازگاری با محیط باعث ایجاد تنوع در جمعیت شده است.

باتوجه به نتایج بدست آمده این تحقیق در خصوص وجود تنوع بسیار زیاد ژنومیکی در توده مرغ بومی فارس، می­توان اقدام به انتخاب افراد برتر این توده از لحاظ تولید و مقاومت به شرایط محیطی کرد. با توجه به اطلاعات حاصل از این مطالعه می­توان راهکارهایی برای حفاظت این نژاد در آینده ارائه داد. اطلاعات بدست آمده از آنالیز مقدماتی کل ژنوم مرغ­های بومی فارس، زمینه مناسبی را برای ترکیب سایر داده های موجود برای تخمین مکان و تاریخ اهلی سازی مرغ فراهم نموده است.

 

 

منابع

Abdolbaghi J (1990). Principles of poultry breeding. Bulletin of Animal Science Research Institute 46:23-34 (In Persian).

Abel, H. J., & Duncavage, E. J. (2013). Detection of structural DNA variation from next generation sequencing data: a review of informatic approaches. Cancer genetics 206: 432-440.

Agarwal SK, Cogburn LA, Burnside J (1994). Dysfunctional growth hormone receptor in a strain of sex-linked dwarf chicken: evidence for a mutation in the intracellular domain. Journal of Endocrinology 142: 427-434.

Amiri Ghanatsaman Z, Esmailizadeh A, Asadi Fozi M (2017). Study of structural diversity of genome Iranian native dog and wolf with the method whole genome sequencing. Iranian Journal of Animal Science 47: 271-277 (In Persian).

Arranz JJ, Bayón Y, Primitivo FS (1998). Genetic relationships among Spanish sheep using microsatellites. Animal Genetics 29: 435-440.

Azor PJ, Monteagudo LV, Luque M, Tejedor MT, Rodero E, Sierra I, Arruga MV (2005). Phylogenetic relationships among Spanish goats breeds. Animal genetics 36: 423-425.

Bai Y, Sartor M, Cavalcoli J (2012). Current status and future perspectives for sequencing livestock genomes. Journal of animal science and biotechnology 3: 8-13.

Burt DW (2005). Chicken genome: current status and future opportunities. Genome research 15: 1692-1698.

Collins DW, Jukes TH (1994). Rates of transition and transversion in coding sequences since the human-rodent divergence. Genomics 20: 386-396.

Dehghanzadeh H (2005). Study of genetic variation of Mazandaran, Yazd and West Azerbaijan native chicken using RAPD markers. Proceeding of the first congress on animal science and aquaculture, Iran (In Persian).

Fan WL, Ng CS, Chen CF, Lu MYJ, Chen YH, Liu CJ, Lai YT (2013). Genome-wide patterns of genetic variation in two domestic chickens. Genome biology and evolution 5: 1376-1392.

Fleming DS, Koltes JE, Fritz-Waters ER, Rothschild MF, Schmidt CJ, Ashwell CM, Lamont SJ (2016). Single nucleotide variant discovery of highly inbred Leghorn and Fayoumi chicken breeds using pooled whole genome resequencing data reveals insights into phenotype differences. BMC genomics 17: 812-817.

Futschik A, Schlötterer C (2010). The next generation of molecular markers from massively parallel sequencing of pooled DNA samples. Genetics 186: 207-218.

Hillier LW, Miller W, Birney E, Warren W, Hardison RC, Ponting CP, Bork P, Burt DW, Groenen MA, Delany ME (2004). Sequence and comparative analysis of the chicken genome provide unique perspectives on vertebrate evolution. Nature 432: 695-699.

International Chicken Polymorphism Map Consortium (2004). A genetic variation map for chicken with 2.8 million single-nucleotide polymorphisms. Nature 432: 717-721.

Kanginakudru S, Metta M, Jakati RD, Nagaraju J (2008). Genetic evidence from Indian red jungle fowl corroborates multiple domestication of modern day chicken. BMC evolutionary biology 8: 174-178.

Kerje S, Sharma P, Gunnarsson U, Kim H, Bagchi S, Fredriksson R, Andersson L (2004). The Dominant white, Dun and Smoky color variants in chicken are associated with insertion/deletion polymorphisms in the PMEL17 gene. Genetics 168: 1507-1518.

Kim HM, Cho YS, Kim H, Jho S, Son B, Choi JY, Jang G (2013). Whole genome comparison of donor and cloned dogs. Scientific reports 3: 2998-3002.

McKenna A, Hanna M, Banks E, Sivachenko A, Cibulskis K, Kernytsky A, DePristo MA (2010). The genome analysis toolkit: a mapreduce frame work for analyzing next-generation dna sequencing data.  Genome research 20: 1297-1303.

Mills RE, Pittard WS, Mullaney JM, Farooq U, Creasy TH, Mahurkar AA, Devine SE (2011). Natural genetic variation caused by small insertions and deletions in the human genome. Genome Research 115907.

Mirhosseini Z (1999). Study of genetic variation of silkworm using protein markers. PhD dissertation in animal breeding, Tarbiad Modares University (In Persian).

Moghaddaszadeh Ahrabi S (2003). Investigation of genetic potential of a Holstein herd using test day and random regression models. MSc dissertation in animal breeding, Zanjan University (In Persian).

Mohammadabadi MR, Nikbakhti M, Mirzaee HR, Shandi A, Saghi DA, Romanov MN, Moiseyeva IG (2010). Genetic variability in three native Iranian chicken populations of the Khorasan province based on microsatellite markers. Russian journal of genetics 46: 505-509.

Mohammadifar A, Faghih Imani SA, Mohammadabadi MR, Soflaei M 2014.The effect of TGFb3 gene on phenotypic and breeding values of body weight traits in Fars native fowls. Journal of Agricultural Biotechnology 5: 125-136 (In Persian).

Mohammadifar A, Mohammadabadi MR (2017). The Effect of Uncoupling Protein Polymorphisms on Growth, Breeding Value of Growth and Reproductive Traits in the Fars Indigenous Chicken. Iranian Journal of Applied Animal Science 7: 679-685.

Mullaney JM, Mills RE, Pittard WS, Devine SE (2010). Small insertions and deletions (INDELs) in human genomes. Human molecular genetics 19: R131-R136.

Seo DW, Oh JD, Jin S, Song KD, Park HB, Heo KN, Lee HK (2015). Single nucleotide polymorphism analysis of Korean native chickens using next generation sequencing data. Molecular biology reports 42: 471-477.

Shamsaie AH (1992). Native chicken breeding. Animal Science Research Institute, Karaj, Iran (In Persian).

Siegel PB, Dodgson JB, Andersson L (2006). Progress from chicken genetics to the chicken genome. Poultry science 85: 2050-2060.

Snyder M, fraser AR, Laroche J, Gartner-kepkay KE, Zouros E (1987). Atypical mitochondrial DNA from the deep-sea scallop placopecten magellanicus .Proceeding of the National Academy of Science of the USA. 84:7595-7599.

Stothard P, Choi JW, Basu U, Sumner-Thomson JM, Meng Y, Liao X, Moore SS (2011). Whole genome resequencing of black Angus and Holstein cattle for SNP and CNV discovery. BMC genomics 12: 559.

Tavakolian J (1999) A look at livestock and chicken genetic pool of Iran. Animal Research Institute of Iran (In Persian).

Wong GKS, Liu B, Wang J, Zhang Y, Yang X, Zhang Z, Ni P (2004). A genetic variation map for chicken with 2.8 million single-nucleotide polymorphisms. Nature 432 (7018): 717-722.

Yan Y, Yi G, Sun C, Qu L, Yang N (2014). Genome-wide characterization of insertion and deletion variation in chicken using next generation sequencing. PloS one 9(8): e104652.


 

Identification of single nucleotide polymorphisms in Fars native chicken using whole genome sequencing data

 

Eskandari T.1, Esmailizadeh A.K.*2, Mohammadabadi M.R.2, Sohrabi S.3

 

1 MSc Student, Department of Animal Science, Shahid Bahonar University of Kerman, Kerman, Iran.

2 Professor, Department of Animal Science, Shahid Bahonar University of Kerman, Kerman, Iran.

3 PhD Student, Department of Animal Science, Shahid Bahonar University of Kerman, Kerman, Iran.

 

Abstract

One of the most important approaches in animal breeding is identification of structural variations responsible for economical important traits. Next generation sequencing technologies are provided accurate tools for this purpose. In the present study, Fars province native poultry genome was analyzed using genome sequencing approach. Paired-end sequencing of the whole genome was conducted by Illumina Company in China. Data quality was determined by FastQC software. Short reads of sequences were mapped with the reference genome with the BWA program. Single nucleotide polymorphisms and small deletions and insertions were identified with the GATK program. The short sequences were compared with the reference genome of over 99% and with the mean depth of the X8 coverage. In this study, 8858153 single nucleotide polymorphisms and 895378 small deletions and insertions were identified with the lowest counts in the exon region. Since the results of identifying the variants showed that the most frequent variant is related to single nucleotide polynomials، in this study, heterozygous loci were higher than homozygous loci indicating the high diversity of the population under study. Given the history of several thousand years of chicken domestication in Iran, one can expect that adaptation to the environment has occurred in the population studied. As a result of genomic changes in order to adapt to the environment, it has created a diversity in the population.

Keywords: Next Generation Sequencing, SNP, InDels, Population variation.



*  نویسنده مسئول: علی اسمعیلی زاده                             تلفن: 09133958041 Email: aliesmaili@uk.ac.ir                               

[1] Gene Ontology

[2] Coordinates

[3] Variant Effect Predictor

[4] Ensembl gene IDs

[5] Database for Annotation, Visualization and Integrated Discovery (DAVID )

[6] Functional enrichment

[7] Kyoto Encyclopedia of Genes and Genomes (KEGG) pathway analysis

* Corresponding Author: Esmailizadeh A.K.             Tel: 09133958041                   Email: aliesmaili@uk.ac.ir

 
Abdolbaghi J (1990). Principles of poultry breeding. Bulletin of Animal Science Research Institute 46:23-34 (In Persian).
Abel, H. J., & Duncavage, E. J. (2013). Detection of structural DNA variation from next generation sequencing data: a review of informatic approaches. Cancer genetics 206: 432-440.
Agarwal SK, Cogburn LA, Burnside J (1994). Dysfunctional growth hormone receptor in a strain of sex-linked dwarf chicken: evidence for a mutation in the intracellular domain. Journal of Endocrinology 142: 427-434.
Amiri Ghanatsaman Z, Esmailizadeh A, Asadi Fozi M (2017). Study of structural diversity of genome Iranian native dog and wolf with the method whole genome sequencing. Iranian Journal of Animal Science 47: 271-277 (In Persian).
Arranz JJ, Bayón Y, Primitivo FS (1998). Genetic relationships among Spanish sheep using microsatellites. Animal Genetics 29: 435-440.
Azor PJ, Monteagudo LV, Luque M, Tejedor MT, Rodero E, Sierra I, Arruga MV (2005). Phylogenetic relationships among Spanish goats breeds. Animal genetics 36: 423-425.
Bai Y, Sartor M, Cavalcoli J (2012). Current status and future perspectives for sequencing livestock genomes. Journal of animal science and biotechnology 3: 8-13.
Burt DW (2005). Chicken genome: current status and future opportunities. Genome research 15: 1692-1698.
Collins DW, Jukes TH (1994). Rates of transition and transversion in coding sequences since the human-rodent divergence. Genomics 20: 386-396.
Dehghanzadeh H (2005). Study of genetic variation of Mazandaran, Yazd and West Azerbaijan native chicken using RAPD markers. Proceeding of the first congress on animal science and aquaculture, Iran (In Persian).
Fan WL, Ng CS, Chen CF, Lu MYJ, Chen YH, Liu CJ, Lai YT (2013). Genome-wide patterns of genetic variation in two domestic chickens. Genome biology and evolution 5: 1376-1392.
Fleming DS, Koltes JE, Fritz-Waters ER, Rothschild MF, Schmidt CJ, Ashwell CM, Lamont SJ (2016). Single nucleotide variant discovery of highly inbred Leghorn and Fayoumi chicken breeds using pooled whole genome resequencing data reveals insights into phenotype differences. BMC genomics 17: 812-817.
Futschik A, Schlötterer C (2010). The next generation of molecular markers from massively parallel sequencing of pooled DNA samples. Genetics 186: 207-218.
Hillier LW, Miller W, Birney E, Warren W, Hardison RC, Ponting CP, Bork P, Burt DW, Groenen MA, Delany ME (2004). Sequence and comparative analysis of the chicken genome provide unique perspectives on vertebrate evolution. Nature 432: 695-699.
International Chicken Polymorphism Map Consortium (2004). A genetic variation map for chicken with 2.8 million single-nucleotide polymorphisms. Nature 432: 717-721.
Kanginakudru S, Metta M, Jakati RD, Nagaraju J (2008). Genetic evidence from Indian red jungle fowl corroborates multiple domestication of modern day chicken. BMC evolutionary biology 8: 174-178.
Kerje S, Sharma P, Gunnarsson U, Kim H, Bagchi S, Fredriksson R, Andersson L (2004). The Dominant white, Dun and Smoky color variants in chicken are associated with insertion/deletion polymorphisms in the PMEL17 gene. Genetics 168: 1507-1518.
Kim HM, Cho YS, Kim H, Jho S, Son B, Choi JY, Jang G (2013). Whole genome comparison of donor and cloned dogs. Scientific reports 3: 2998-3002.
McKenna A, Hanna M, Banks E, Sivachenko A, Cibulskis K, Kernytsky A, DePristo MA (2010). The genome analysis toolkit: a mapreduce frame work for analyzing next-generation dna sequencing data.  Genome research 20: 1297-1303.
Mills RE, Pittard WS, Mullaney JM, Farooq U, Creasy TH, Mahurkar AA, Devine SE (2011). Natural genetic variation caused by small insertions and deletions in the human genome. Genome Research 115907.
Mirhosseini Z (1999). Study of genetic variation of silkworm using protein markers. PhD dissertation in animal breeding, Tarbiad Modares University (In Persian).
Moghaddaszadeh Ahrabi S (2003). Investigation of genetic potential of a Holstein herd using test day and random regression models. MSc dissertation in animal breeding, Zanjan University (In Persian).
Mohammadabadi MR, Nikbakhti M, Mirzaee HR, Shandi A, Saghi DA, Romanov MN, Moiseyeva IG (2010). Genetic variability in three native Iranian chicken populations of the Khorasan province based on microsatellite markers. Russian journal of genetics 46: 505-509.
Mohammadifar A, Faghih Imani SA, Mohammadabadi MR, Soflaei M 2014.The effect of TGFb3 gene on phenotypic and breeding values of body weight traits in Fars native fowls. Journal of Agricultural Biotechnology 5: 125-136 (In Persian).
Mohammadifar A, Mohammadabadi MR (2017). The Effect of Uncoupling Protein Polymorphisms on Growth, Breeding Value of Growth and Reproductive Traits in the Fars Indigenous Chicken. Iranian Journal of Applied Animal Science 7: 679-685.
Mullaney JM, Mills RE, Pittard WS, Devine SE (2010). Small insertions and deletions (INDELs) in human genomes. Human molecular genetics 19: R131-R136.
Seo DW, Oh JD, Jin S, Song KD, Park HB, Heo KN, Lee HK (2015). Single nucleotide polymorphism analysis of Korean native chickens using next generation sequencing data. Molecular biology reports 42: 471-477.
Shamsaie AH (1992). Native chicken breeding. Animal Science Research Institute, Karaj, Iran (In Persian).
Siegel PB, Dodgson JB, Andersson L (2006). Progress from chicken genetics to the chicken genome. Poultry science 85: 2050-2060.
Snyder M, fraser AR, Laroche J, Gartner-kepkay KE, Zouros E (1987). Atypical mitochondrial DNA from the deep-sea scallop placopecten magellanicus .Proceeding of the National Academy of Science of the USA. 84:7595-7599.
Stothard P, Choi JW, Basu U, Sumner-Thomson JM, Meng Y, Liao X, Moore SS (2011). Whole genome resequencing of black Angus and Holstein cattle for SNP and CNV discovery. BMC genomics 12: 559.
Tavakolian J (1999) A look at livestock and chicken genetic pool of Iran. Animal Research Institute of Iran (In Persian).
Wong GKS, Liu B, Wang J, Zhang Y, Yang X, Zhang Z, Ni P (2004). A genetic variation map for chicken with 2.8 million single-nucleotide polymorphisms. Nature 432 (7018): 717-722.
Yan Y, Yi G, Sun C, Qu L, Yang N (2014). Genome-wide characterization of insertion and deletion variation in chicken using next generation sequencing. PloS one 9(8): e104652.