comparison of the different clustering methods for population...

30
Comparison of the Different Clustering Methods for Population Structure of Sarabi and Nadjdi Cows by Using Dense Genetic Markers Ahad Khasaliaghtaei PhD Student, Department of Animal Science, Faculty of Agriculture, University of Zabol, Zabol, Iran, Email: [email protected] Mehdi Vafaye Valleh * Assistant Professor, Department of Animal Science, College of Agriculture, University of Zabol ,Zabol, Iran, Tel +98 9358237550 , Email: [email protected] Gholam Reza Dashab Associate Professor, Department of Animal Science, College of Agriculture, University of Zabol, Iran, Email: [email protected] Hossein Moradi Shahrbabak Associate Professor, Department of Animal Science, College of Agriculture and Natural Resources, University of Tehran, Karaj, Iran, Email: [email protected] Abstract Objective So far, various methods have been used to investigate the structure of the population using the markers available in the whole genome (single-nucleotide polymorphism (SNP)), each of which has Weakness and strength. In the present study, an unsupervised network clustering (SPC), a data-mining method, was used to survey the population structure of the Sarabi and Najdi cows. Materials and methods The study population 424 cattle consisted of 213sarabi cattle and 211 Najdi cattle, sequenced with Illumina Bead Chip 40 K v 2 for single nucleotide markers. SORTING POINTS INTO NEIGHBORHOOD(SPIN) was used to analyze population structure. After editing data, 27859 autosomal markers were analyzed. Results

Upload: others

Post on 13-Oct-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

Comparison of the Different Clustering Methods for Population

Structure of Sarabi and Nadjdi Cows by Using Dense Genetic Markers

Ahad Khasaliaghtaei

PhD Student, Department of Animal Science, Faculty of Agriculture, University of Zabol, Zabol,

Iran, Email: [email protected]

Mehdi Vafaye Valleh

* Assistant Professor, Department of Animal Science, College of Agriculture, University

of Zabol ,Zabol, Iran, Tel +98 9358237550 , Email: [email protected]

Gholam Reza Dashab

Associate Professor, Department of Animal Science, College of Agriculture, University of Zabol,

Iran, Email: [email protected]

Hossein Moradi Shahrbabak

Associate Professor, Department of Animal Science, College of Agriculture and Natural

Resources, University of Tehran, Karaj, Iran, Email: [email protected]

Abstract

Objective

So far, various methods have been used to investigate the structure of the population using

the markers available in the whole genome (single-nucleotide polymorphism (SNP)), each

of which has Weakness and strength. In the present study, an unsupervised network

clustering (SPC), a data-mining method, was used to survey the population structure of the

Sarabi and Najdi cows.

Materials and methods

The study population 424 cattle consisted of 213sarabi cattle and 211 Najdi cattle,

sequenced with Illumina Bead Chip 40 K v 2 for single nucleotide markers. SORTING

POINTS INTO NEIGHBORHOOD(SPIN) was used to analyze population structure. After

editing data, 27859 autosomal markers were analyzed.

Results

Page 2: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

26 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

Clustering results based on the similarities and differences between nucleotides led to the

classification of two base populations and nine clusters.

Conclusions

Comparison the number of samples and other existing methods for population layering, the

use of the SPIN method with high computational efficiency and the needn`t for prior

assumptions makes it possible to analyze the structure of populations.

Keywords: Single-nucleotide polymorphism, Unsupervised network clustering, Data mining,

Demographic structure.

Citation: Khasaliaghtaei A, Vafaye Valleh M, Dashab GR, Moradi Shahrbabak H (2019) Comparison of

the Different Clustering Methods for Population Structure of Sarabi and Nadjdi Cows by Using Dense

Genetic Markers. Agricultural Biotechnology Journal 11 (1), 25-54.

Agricultural Biotechnology Journal 11 (1), 25-54. DOI: 10.22103/jab.2019.13193.1098 Received: January 16, 2019; Accepted: April 28, 2019 © Faculty of Agriculture, Shahid Bahonar University of Kerman-Iranian Biotechnology Society

Page 3: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

27 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

با استفاده از گاوهاي سرابی و نجدي بندي جمعیتیهاي مختلف الیهمقایسه روش

نشانگرهاي ژنتیکی متراکم

احد خصالی اقطاعی

_yahoo.com48ahad@دانشجوي دکترا ژنتیک و اصالح نژاد دام، دانشگاه زابل، زابل، ایران، ایمیل:

مهدي وفاي واله

:، ایمیل+98 9358237550 استادیار، گروه علوم دامی، دانشکده کشاورزي، دانشگاه زابل، زابل، ایران، تلفن * [email protected].

غالمرضا داشاب

[email protected] ، گروه علوم دامی، دانشکده کشاورزي، دانشگاه زابل، زابل، ایران، ایمیل:دانشیار

حسین مرادي شهربابک

دانشکده کشاورزي و منابع طبیعی، دانشگاه تهران، کرج، ایران، ایمیل: دانشیار، گروه علوم دامی، دانشکده علوم کشاورزي و مهندسی،

[email protected]

08/02/1398، تاریخ پذیرش: 26/10/1397تاریخ دریافت:

چکیده

هايشکلی ژنوم (چند درکل موجود نشانگرهاي استفاده از با جمعیتی ساختار بررسی براي مختلفی هايروش از تاکنون هدف:

بدون ايشبکه بنديخوشه از حاضر پژوهشدر دارند. قوتی و ضعف نقاط کدام هر که است شده استفاده ))SNP( نوکلئوتیديتک

شد. استفاده گاوهاي سرابی و نجدي ساختار جمعیت بررسی است، براي کاويبر داده مبتنی روشی که SPC یا نظارت

Chip 40 Kرأس گاو سرابی بود که با 211رأس گاو نجدي و 213شامل رأس گاو 424 جمعیت مورد مطالعه ها:مواد و روش

v 2 Illumina Bead افزارينرم يهوکلئوتیدي تعیین توالی شدند. براي تجزیه ساختار جمعیت از بستنبراي نشانگرهاي تک

)SPIN( SORTING POINTS INTO NEIGHBORHOOD نشانگر 27859ها، استفاده شد. بعد از ویرایش داده

اتوزومی تجزیه و تحلیل شدند.

Page 4: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

28 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

شد. زیر جمعیتنه وبندي دو جمعیت پایه هاي نوکلئوتیدها، منجر به طبقهها و تفاوتبندي بر اساس شباهتخوشه :نتایج

ه به عدم نیاز به با توج SPINروش بندي جمعیت، در حال حاضرهاي موجود براي الیهدر مقایسه با سایر روش گیري:نتیجه

هاي پیشین، کارایی مناسبی جهت تجزیه و تحلیل ساختار جوامع دارد.فرض

.معیتیج ساختار کاوي،داده نظارت، بدون ايشبکه بنديخوشه نوکلئوتیدي،تک هايشکلی چند :هاي کلیديواژه

مقدمه

شیرده گاو راس 2048563 ظرفیت با گاوداري صنعتی واحد 18830 تعداد کشاورزي، جهاد وزارت رسمی آمار آخرین طبق

Kharrati Koopaei( تاس بوده رشد به رو روند یک داراي شیر تولید 1387 تا 1383 سالهاي طی. هستند فعالیت مشغول کشور در

et al. 2011(. است ترپایین هانیج استاندارد حد از شیر مصرف سرانه هنوز اما کشور در شیر تولید افزایشی روند وجود با )Kharrati

Koopaei et al. 2012a( .شیر مصرف سرانه که حالی در اشد،بمی کیلوگرم 95 با برابر نفر هر براي کشور در شیر مصرف سرانه ). Kharrati Koopaei, et al. 2011( است سال در کیلوگرم 350 با برابر اروپا در و کیلوگرم 169 با برابر جهان در

کشور در شیر تولید افزایش يبرا بایستی ایران در نژادي اصالح اهداف که دریافت توانمی موجود اطالعات و آمار به توجه با .Kharrati Koopaei et al( بدیامی چندان دو اهمیتی نژادهاي مختلف گاو در ایران بررسی و مطالعه ،لذا. شود یزيربرنامه

2012b.( هايویژگی کنترل آن لدنبا به و سلول عملکرد ریزيبرنامه در اصلی عامل به ژن ژنتیک، علم پیشرفت با یگر،د يسو از

تا یافت؛ افزایش زیستی ياهپدیده توجیه منظور به هانژ بیشتر چه هر شناخت براي تمایل ترتیب این به .شد شناخته زنده موجود

تحقیقات امروزه و تاس یافته افزایش ايگسترده طور به مولکولی تحقیقات در نیاز مورد تجهیرات اخیر، دهه چند در که حدي

.است زیستی هايآزمایشگاه رایج مطالعات جزو مولکولی

هايبانک در هالیتوا کردن خط به در بیوانفورماتیک، علم وسیله به زیستی هايداده تحلیل از آمده دست به اطالعات

میان فیلوژنتیک رتباطا یافتن و هاژن محصوالت عملکرد و ساختار گوییپیش ژنی، هايتفاوت و هاشباهت یافتن براي اطالعاتی

.)Hadizadeh et al. 2013; Hadizadeh et al. 2014( کندمی کمک پروتئینی هايتوالی و هاژنیابی سبب تحول در تجزیه و تحلیل دقیق ها به ویژه با استفاده از توالیشد روزافزون اطالعات حاصل از تعیین ژنوتیپ نمونهر

در مطالعات مرتبط با منشأ، تاریخچه و سیر هاي مختلف شده است. امروزه نشانگرهاي ژنتیکی نقش مهمیساختار جوامع در گونه

هاي کنونی . پیشرفت)Fernández et al. 2013; Lirón et al. 2002; Troy et al. 2001( کنندتکاملی جوامع دامی ایفا میافزارهاي مربوطه و علم بیوانفورماتیک، استفاده ي نرمهاي نشانگري، توسعهیابی ژنوم با تراکم باال با استفاده از تراشهي توالیدر زمینه

Page 5: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

29 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

، اطالعات SNP چند به دلیل دو آللی بودن نشانگرهاي را بسیار مرسوم کرده است؛ هر )SNP( 1نوکلئوتیديهاي تکشکلی چند از

اي کمتر است.ها در مقایسه با نشانگرهاي ریزماهوارهژنتیکی آشکار شده توسط آن یشاوندي حداقل تعداد نشانگري روابط خوها براي تعیین هویت افراد و مطالعهمعادل با دقت ریزماهوارهبراي رسیدن به دقتی

SNP تدو تا شش برابر مورد نیاز اس )Morin et al. 2004(اما ،SNP یشتربها داراي مزایایی همچون فراوانی )Heaton et

al. 2005(پایداري ژنتیکی آن در پستانداران ، )Markovtsova et al. 2000(ودن براي تجزیه و گذاري آسان و مناسب ب، نام .)Wang et al. 1998(ها و تفسیر نتایج هستند تحلیل

اه نگتني و پدیده4ها، اختالط جمعیت3، جهش2تنوع ژنتیکی موجود در بین جوامع، حاصل عوامل بسیاري از جمله مهاجرتو انتخاب را با خود به همراه دارد. آثار متقابل این 6هایی از رانش تصادفیاین تنوع نشانه .) .2008Serre et al( است 5جمعیتی

ي تاریخچه و سیر براي به دست آوردن دیدگاهی درباره .مرتبط با آن شود 7هايتواند سبب ایجاد جوامع و زیرجمعیتعوامل می، براي (نشانگرها) هابسیار با اهمیت است. در مطالعات ارتباط صفات با ژن 8ساختارهاي جمعیتی تکاملی جوامع، مشخص کردن زیر

و همچنین فراهم کردن اطالعاتی ارزشمند در جهت حفظ ) Serre et al. 2008(هاي کاذب زیرساختارهاي جمعیتی کاهش ارتباطامروزه مطالعات متنوعی .)Bowden et al. 2012( هاي مربوط به خود قرار گیرندذخایر ژنتیکی، الزم است افراد در زیرجمعیت

;Decker et al. 2009; Gautier et al. 2010(ها صورت گرفته است براي مشخص کردن زیرساختارهاي جمعیتی در دام

Kijas et al. 2009(. هاي ژنوم، امروزه محققان اطالعات نشانگري با تراکم باال راهاي آنالیز گسترده توالیبا گسترش تکنولوژي ي اجدادي، به در اختیار دارند و وجود ابزاري براي تجزیه و تحلیل ساختار جامعه با استفاده ازاین حجم اطالعات بدون نیاز به پیشینه

.)Lee et al. 2009; Paschou et al. 2007( منظور تعیین زیرساختارهاي جمعیتی، الزم و ضروري استسی ارتباط بین جوامع و مشخص کردن موقعیت افراد در جوامعی که از آن هاي آماري بسیاري براي بررتا به امروز روش

هاي مبتنی و روش 9بندي مبتنی بر فاصلههاي خوشهها، روشروش مهم از میان این روش دو .اند، پیشنهاد شده استنشأت گرفتهبندي به همراه ابزارهاي خوشه) PCA( 11اصلیهاي هستند. در روش اول از فنون کاهش ابعاد از قبیل تجزیه و تحلیل مؤلفه10بر مدل

.)Lee et al. 2009; Paschou et al. 200( شوداستفاده می K-meansهمچون

1. Single nucleotide polymorphisem 2. Migration 3. Mutation 4. Mixing of populations 5. Bottle neck population 6. Random drift 7. Sub population 8. Sub-populations structure 9. Clustring base on distanc 10. Clustring base on model 11. Principle component analysis

Page 6: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

30 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

و کشف 2کاوياست، ماهیت این روش به لحاظ اصولی با داده )SPC( 1بنديهاي مبتنی بر فاصله، روش خوشهیکی از روش

، توانایی 5و منشاء 4توان قوي بودن در برابر اختالالتآن جمله می مرتبط است. این روش داراي مزایاي بسیاري است که از 3دانشها یا ساختار خوشه ي توزیع دادهتر نیاز نداشتن آن به اطالعات قبلی دربارهدر تولید ساختار سلسله مراتبی خود به خودي و از همه مهم

.)Radjiman & Sugiarto 2005( را نام برد

مخمر، SPCان ژن در اي و پروفایل بیي ماهوارهشده مخابره هايداده در آنالیز اطالعات حاصل از روش اینکارائی الگوریتم ،)SCOP )Tetko et al. 2005و SwissProtي هاي دادههاي پروتئین به دست آمده از پایگاهبندي توالیخوشه

.Domany 2003; Getz et al( به اثبات رسیده استي بزرگ و سرطان خون سرطان کولون رودههاي سرطان سینه، داده

2003, Getz et al. 2000a; Getz et al. 2000b(.

ارزیابی براي Hamiltonian inhomogeneous ferromagnetic Pottsنام به هزینه تابع یک از SPIN افزارنرم) با تابعی به Sبندي(در این تابع، طبقه =si,sjδijJij∑-H (S) کند.در فضاي چند بعدي استفاده می SPC توسط بنديخوشه عملکرد

erroF هاي شود. مدلکه تابعی مثبت و کاهشی از فواصل است، معین می ijJو ثابت اتصال Spin-) Spinij(Gنام همبستگی

magnetic Potts 6در یک توالی از دماها )T( ثابت تغییرات دمائی ) با داشتنTΔ( بندي کنند؛ بنا براین خوشهسازي می، شبیه

دارند.نها همبستگی ي داده، همه Tبیان شود. به طورکلی در این تابع براي مقادیر کوچک Tتواند در هر سطحی از می

) با T≤TMAX≤0(دماها ها در امتداد جوار افزایش یافته و دادهبین نقاط هم Spin-Spinبا افزایش دما همبستگی مقدار حدي از طریق تعیین ، یا دما Tبراساس شده هاي ایجادشوند. در نهایت سطح خوشهبندي میاستفاده از تقریب میانگین، خوشه

Spin هايij ) باT(Gij ،ي دمایی شود؛ بنابراین محدودهمیمشخص حداکثري براي هر نقطه از دادهΔT= T2 – T1 که یکاظر با آن است. هر چه خوشه هاي متنبندي دادهشود، معیاري براي پایداري و خوشههاي باال دستی (والدین) جدا میهخوشه از خوش

تر است. روش کار بر دو مرحله استوار است. بزرگ ΔTيپایدارتر باشد، محدوده

نخستین مرحله با استفاده از دو در . گیردبندي انجام میسازي است و سپس عمل خوشهي نخست، فرآیند مرتبمرحلهي بیشتري گیرد و عناصري که با فاصلهاز قبل انجام می 8سازي ماتریس فواصلدوباره مرتب Neighborhood یا STS 7الگوریتم

.)Tsafrir et al. 2005(گیرند ي سمت راست باالیی و همچنین سمت چپ پایینی قرار میاز هم قرار دارند، در گوشه

3. Super Paramagnetic 4. Data mining 5. Knowledge discovery 6. Noise

7. Initialization 8. Tempreture 1. Side2Side 2. Distance Matrix

Page 7: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

31 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

هاي شود از جمله معایب روشهاي جمعیتی استفاده میهاي استاندارد آماري براي برآورد فراسنجهروش دوم، ازروش درهاي تهیه شده شود؛ بنابراین اگر نمونهمبتنی بر مدل این است که معموالً براي هر جامعه فرض تعادل هاردي وینبرگ لحاظ می

. براساس )Gao & Starmer 2007( هاي مناسبی به دست نخواهد آمدآللی، استنتاجکوچک باشند، به دلیل برآورد ناصحیح فراوانی

.STRUCTURE )Pritchard et al افزارهايتوان نرماند که میافزارهاي مختلفی توسعه یافتهنرم ،هاي مبتنی بر مدلروش

2000(، ADMIXTURE )Alexander et al. 2009( وFRAPPE )Tang et al. 2005( نام برد. این دو روش داراي راي ژنومی موجود و همچنین مشکل به تصویر درآوردن و هاي گستردههاي پیشین و عدم توانایی پشتیبانی دادهمحدودیت در فرض

) و بر اساس شرایط آب و هوایی به سه دسته 1گروه (شکل 8بندي به توده گاوهاي بومی ایران بر اساس خوشه .تفسیر نتایج هستندشوند: گاوهاي مناطق معتدل و مرطوب (مازندرانی و تالشی)، گاوهاي منطقه سرد و کوهستانی (سرابی و کردي) و تقسیم می اصلی

.)Karimi et al. 2016( )2گاوهاي منطقه خشک و نیمه خشک (نجدي، پارس، کرمانی و سیستانی) (شکل

، با استفاده )PCA(هاي اصلیتجزیه و تحلیل مؤلفه ایرانی با استفاده از گاو توده نژاد 8بندي خوشه .1 شکل

اتوزومینوکلئوتیدي تکهاي چند شکلیاز

Figure 1. Clustering of 8 Iranian Native Cows, using Basic Component Analysis (PCA),

using Autosomal SNPs

Page 8: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

32 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

تیک آنها بر اساس درصد ژن taurineو indicineهاي نژاد گاو ایران و نسبت توزیع جغرافیایی گونه . 2شکل

)= 2Kگاوهاي نژاد هولشتاین، جرزي و برهمن (

Figure 2. Distribution of species of Iranian Cows breeds and their ratios of indicine and

taurine based on the genetic rate of Holstein, Jerzy and Brahman breeds (K = 2)

ترین دو توده بومی داراي اهمیت اقتصادي، اما با اندازه کم جمعیت هستند. گاو سرابی یکی از مهم 2و نجدي1سرابیگاوهاي

باغ وارد ها دارد. این توده از قرهها و انگلگاوهاي دو منظوره بومی در ایران است که سازگاري باالئی با آب و هواي سرد، بیماريهاي شود، تولید شیر این توده به میزان قابل توجهی باالتر از سایر تودهنه و اردبیل پرورش داده میایران شده و در مناطق سراب، میا

اي شکل بوده و به خوبی با شرایط گاوهاي سرابی، از دید پهلو، داراي بدنی ذوزنقه . اکثر)Khansefid 2010( گاو ایرانی استباشد کره محلی می هاي تولید سنتی پنیر واقتصادي آنها مربوط به سیستمغربی سازگار شده و اهمیت سخت مناطق کوهستانی شمال

)Tavakkilian 2000(. شود، مقاومت غربی ایران پرورش داده می که به طور عمده در خوزستان در جنوب است تولید هاي بومی کمگاو نجدي از گاو

گاو نجدي .)Karimi et al. 2009( از خصوصیات این توده است هاي روستاییها و نقش آنها در اقتصاد خانوادهدر برابر بیماري

1. Sarabi 2. Najdi

Page 9: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

33 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

غربی ایران که بیشتر از در طول سالیان متمادي خود را با شرایط آب و هوایی گرم و خشک و منابع غذایی محدود نواحی جنوب

.)Tavakkilian 2000( شودگیاهان مرتعی ناحیه جلگه تشکیل شده است، تطبیق داده و براي تولید گوشت و شیر نگهداري می از و نژادي اصالح هايطرح براي زيیربرنامه به منظور یبزرگ کمک هاتیجمع یکیژنت ساختار از اطالع ،از طرف دیگر

نشانگرهاي از استفاده و یمولکول هايروش ).Mohammadabadi et al. 2017( باشدمی یکیژنت ریذخا حفظ تر،مهم همه

یجینتا تواندیم دهدیم دست به که اديیز اطالعات به توجه با رایز د،یآیم حساب به هانهیگز نیبهتر از یکی نهیزم نیا در یمولکول کند رد را آنها که است ممکن یحت و نموده لیتکم و دییتأ را است آمده دست به آماري هايروش با رکوردها لیتحل و هیتجز از که

)Alinaghizadeh et al. 2010 .( یخاص گاهیجا يبرا افراد پیژنوت نییتع داریمعن دیفوا نیا از یکی که دارد يادیز دیفوا یملکول کیژنت از استفاده عالوه، به

است ممکن واناتیح نژاد اصالح و انتخاب در یکیژنت ينشانگرها از استفاده نیهمچن .)Vajed Ebrahimi et al. 2016( است یبوم ينژادها یکیژنت تنوع مطالعهعالوه بر این، ). Mohammadabadi 2017( کند عیتسر را یکیژنت شرفتیپ یجیمه طور به .Mohammadi et al. 2009; Vajed Ebrahimi et al( است يضرور و الزم یبوم ریذخا یکیژنت منابع از حفاظت يبرا

اتیخصوص نییتع و ییشناسا يبرا تالش لذا باشد، خاص ينژادها یکیژنت منابع از یقیعم دانش اساس بر دیبا حفاظت). 2017

).Khodabakhshzadeh et al. 2016; Zamani et al. 2015( دارد تیاهم اریبس یمحل و یبوم ينژادها یکیژنت ;Ghasemi et al. 2010لشتاین ایران (وهاي مختلف انجام شده بر روي گاوهاي هنتایج پژوهش به توجه با

Mohammad Abadi & Mohammadi, 2010; Kharrati Koopaei et al. 2012; Ebrahimi et al. 2015a and

2015b; Pasandideh et al. 2015; Barazandeh et al. 2016 (ها این دام که دریافت توانمی موجود اطالعات و و آمار

اي بدون نظارت در بندي شبکهسنجی خوشهحاضر امکانهدف از تحقیق بنابراین، .هاي گوناگون مورد مطالعه قرار گیرندباید از جنبه .هاي همگن استگاوهاي سرابی و نجدي به منظور دسترسی به خوشه SNPي ساختار جمعیتی به کمک نشانگرهاي متراکمتجزیه

هاروش و مواد

رأس مربوط به ایستگاه اصالح 93رأس گاو سرابی ( 213رأس گاوهاي سرابی و نجدي شامل: 424در این مطالعه از تعداد رأس مربوط به 90رأس مربوط به ایستگاه اصالح نژاد و 121رأس گاو نجدي ( 211هاي مردمی) و رأس مربوط به گله 120نژاد و

هاي مردمی ، ایستگاه اصالح نژاد شهرستان سراب و گلهگیري گاوهاي سرابیمد. محل نمونهگیري به عمل آهاي مردمی) خونگلههاي هاي مردمی از شهرستان، ایستگاه اصالح نژاد شهرستان شوشتر و گلهگیري گاوهاي نجدياب و محل نمونهشهرستان سر از

سوسنگرد، هندیجان و ماهشهر بودند.به آزمایشگاه ژنتیک مولکولی گروه علوم دامی دانشگاه علوم کشاورزي و منابع DNA هاي خون جهت استخراجنمونه

DNA هايخون کامل به روش بهینه یافته استخراج نمکی انجام شد. نمونه از DNA استخراج .ال داده شدندطبیعی کرج انتق

Page 10: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

34 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

GeneSeek درجه سانتیگراد تا زمان تعیین ژنوتیپ در آزمایشگاه نگهداري شدند و سپس به آزمایشگاه -20ي استخراج شده در دما

Illumina Bead Chipنوکلئوتیديتیپ با استفاده از تراشه نشانگرهاي تککشور آمریکا جهت تعیین ژنوتیپ انتقال داده شد. ژنو

40 K v 2 بعد از انجام مراحل تعیین ژنوتیپ خوانش . گیري پروتکل استاندارد ارائه شده توسط شرکت ایلومینا انجام گرفتو با بکار

حیوان با استفاده از اسکنر ارائه شده توسط شرکت هاي مربوط به هر هاي موجود روي تراشهSNPها به منظور تعیین نوع تراشه

انجام شد. 1ایلومیناها یک مرحله مهم در مطالعات ژنومی براي به حداقل رساندن خطاي تعیین ژنوتیپ است. براي اطمینان SNPکنترل کیفیت 3درصد، حداقل فراوانی آللی 10ز کمتر ا 2نیهاي مورد استفاده در آنالیزهاي بعدي باال باشد با اعمال نرخ فراخوااز این که کیفیت داده

.هاي با کیفیت پایین و با اطالعات کم از آنالیزهاي بعدي حذف شدنددرصد و تعادل هاردي واینبرگ، داده 95کمتر از

براي بررسی ساختار جمعیت و ارتباط میان افراد بر اساس ماتریس همبستگی همسانی MDSیا 4چندبعدي پایش یا ارزیابیاستفاده شد. ) .PLINK )2007Purcell et al افزارکند که براي این کار از نرمبین دو فرد، عمل می IBS 5وجودي درجایگاه

اجرا شد. Rافزار در نرم cmd scaleدر این ماتریس با تابع MDS سپس رفت. آماره گانجام Q-Q plotبندي جمعیتی با استفاده از آماره المبدا و نمودار براي برآورد الیه، GCکنترل ژنومیک یا

باشد. اگر مقدار میinflation شود، فاکتورالمبدا که از تقسیم میانه مقادیر کاي مربع مشاهده شده بر میانه مورد انتظار حاصل می-Qترسیم ه روش کنترل ژنومیک وباشد. در این مطالعبندي میالیه آماره المبدا کمتر یا مساوي یک باشد، نشان دهنده عدم وجود اثر

Q plot افزاردر نرم R و با پکیجSNP assoc .اجرا گردید

هاي چند متغیره در داده هاي اصلی آن است که واریانس موجودتجزیه به مؤلفه هدف از، PCAهاي اصلی یاآنالیز به مؤلفهها باشد. دومین مؤلفه علت ادهداولین مؤلفه تا آنجا که ممکن است علت بیشترین واریانس موجود در هایی تجزیه کند کهرا به مؤلفه

هاي دیگر است، یعنی بین ؤلفهمبیشترین واریانس ممکن بعد از مؤلفه اول و الی آخر باشد. بعالوه، در این روش هر مؤلفه مستقل از هاي دیگر قراراست مؤلفهرفضا هر مؤلفه از نظر جهت در زاویه طرف . یعنی درهاي دیگر همبستگی وجود نداردهر مؤلفه و مؤلفه

انجام گرفت. Rافزار در نرم prcompبا تابع PCAدارد. آنالیز در محیط لینوکس صورت Admixture 1.23 افزارآنالیز اختالط نژادي با استفاده از نرم، هابررسی آمیختگی بین جمعیت

استاندارد هايداده فرمت از (Alexander et al. 2009)د ك ژنتیکی این دو توده به صورت گرافیکی بدست آمگرفت و میزان اشترا

این به مربوط گراف و بود متنی فایل یک آن خروجی فایل و شد استفاده افزارنرم این ورودي هايداده به عنوان PLINK باینري و

1. Illumina scan reder 2. Call Rate 3. Minor AllelFerquency 4. Multiple Dimensional Scaling 5. Identical by State

Page 11: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

35 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

در تشخیص تعداد (فاکتور مربوط به تعداد جمعیت مورد بررسی)K افزار فاکتور رسم شد. در این نرمR محیط در خروجی فایل

ترین کم 1باشد و با توجه به خطاي اعتبارسنجی متقابلها مقدار عددي این فاکتور میها نقش دارد و مبناي تفکیک جمعیتجمعیتو توسط بررسی همسانی PLINK افزارفواصل در نرماین ي ژنتیکیگیري فاصلهاندازه شود.مقدار براي این منظور انتخاب می

.محاسبه شدند 1عدد از با کسر (IBS) وجودي درجایگاه

هاي تک اي بدون نظارت در آنالیز ساختار جمعیتی با استفاده از چند شکلیبندي شبکهخوشهفوق پارامغناطیسی، بندي خوشهي براي این منظور از بسته ساختار جمعیتی گاوهاي سرابی و نجدي استفاده شد.به منظور استنتاج (SPC) بندينوکلئوتیدي یا خوشه

براي Hamiltonian Pottsاستفاده شد که در آن از مدل ) .2SPIN )2005b; Tsafrir et al. 1996Blatt et al افزارينرم .(Neuditschko et al. 2012)شود ها استفاده میمعین کردن ساختارهاي جمعیتی در شبکه

Modularityبه نام ايفراسنجه KNNي براي تعیین تعداد بهینه، K-Nearest-Neighbor (KNN)انتخاب بهترین MODULARافزارنظور از نرممها در فرایند پس از ارزیابی، معرفی شد. براي این گیري کیفیت شبکهبه عنوان معیاري براي اندازه

(Marquitti et al. 2014) ي استفاده شد. محدودهModularity اعی بهتر استنشانگر تقسیمات اجتم 1است که 1تا 0از (Holmström et al. 2009).

بندي به تصویر هاي نهایی خوشهبراي پاسخ SPCتر بین افراد، نمودار استخراجی ي خویشاوندي دقیقبراي یافتن رابطهها به قالب مختصات داده 2008Brohée et al. ( 3NeAT( گر شبکهاستفاده از ابزار تحلیلکشیده شد. براي این منظور، ابتدا با

.)Shannon et al. 2003(استفاده شد Cytoscapeافزار تبدیل شدند و سپس از نرم

نتایج و بحث

نجدي مردمی رأس، 43رأس، نجدي ایستگاهی 18رأس، سرابی مردمی 15رأس گاو شامل سرابی ایستگاهی 113تعداد

ه علت حداقل فراوانی آللی نشانگر ب 1211درصد حذف شدند، تعداد 10ز نشانگر به علت نرخ فراخوانی کمتر ا 415 رأس، و تعداد 37ر اتوزومی براي تجزیه و نشانگ 27859نشانگر به علت تعادل هاردي واینبرگ حذف شدند. در انتها 621درصد و تعداد 95کمتر از

هاي نهایی در نظر گرفته شدند.تحلیلگر میانه اجرا شد. پارامتر تورم وجود دارد که در این تحقیق روش تخمین 4چندین روش براي تخمین کنترل تورم ژنومیکی

دهد. به عبارتی انحراف از بندي جمعیتی ضعیفی را نشان میکه الیهتخمین زده شده (λGC=1.0343)0343/1 ژنتیکی حدود یک نشان دهنده این موضوع است که گاوهاي سرابی و نجدي کامالً خالص نیستند و اختالط ژنتیکی بین این حیوانات وجود دارد.

1. Cross validation error 2. Sorting Points Into Neighborhood 3. Net analysis tools 1. Genomic inflation

Page 12: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

36 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

است. بندي جمعیتیالیه ) ارائه شده است. هرگونه انحراف از خط نشان دهنده وجود اثر3(شکلQ-Q گراف مربوط به

هاي مختلف گاوهاي سرابی و نجديبندي جمعیتارزیابی الیهبراي Q-Q plot .3شکل

Figure 3. Q-Q plot to evaluate the layering of different populations of Sarabi and Najdi

Cows

نشان را جمعیت دو افراد توزیع است، کم ابعاد با فضاي در تفاوت یا شباهت مشاهده براي که بعدي چند ارزیابی تجزیه

و دارند ند،اگرفته قرار میانه در که افرادي به نسبت بیشتري خلوص دورترند که افرادي که است این از حاکی نتایج ،)4شکل( هدمی

هاي موجود در دو جمعیت را نشان هاي مختلف خوشهدر این شکل رنگ. هستند هیبرید و داشته اختالط هستند میانه در که افرادي تفکیک است داده رخ شکل میانه در که اختالطی به توجه با ولی ،که بیشترین فاصله را گاوهاي سرابی و نجدي ایستگاه دارنددهد می

.نیست پذیرامکان مردمی هايگله به مربوط نجدي و سرابی گاوهاي کامل

Page 13: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

37 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

ایران نجدي و سرابی گاوهاي MDS روش به جمعیتی بنديالیه . 4شکل

Figure 4. MDS layering in Iranian Sarabi and Najdi Cows

دارد، شناسایی هاي اصلی که ساختار جمعیت را بر اساس همبستگی ژنتیکی میان افراد بیان می، مؤلفهPCAروش به آنالیز

نزدیکی ) که نشان دهنده5شکل( ترسیم شدPCA براي ارزیابی اختالف ژنتیکی میان جمعیت گاوهاي سرابی و نجدي کند.میهاي موجود در دو هاي مختلف مربوط به خوشهدر این شکل رنگ MDSژنتیکی افراد در دو جمعیت مزبور است که مثل نتایج

PCA1بر اساس PCA باشند، که بیشترین فاصله را گاوهاي ایستگاه اصالح نژاد سرابی و نجدي دارند، ولی نتایج آنالیز جمعیت میهاي مردمی که در میانه شکل رخ داده است نشان داد که تا حدودي ارتباط ژنتیکی بین گاوهاي گله با توجه به اختالطیPCA2 و

58بیانگر تأثیر PCAمقدار واریانس توجیه شده توسط تواند مربوط به استفاده از گاوهاي نر هولشتاین باشد.وجود دارد، که میاست. که باال بودن مقدار واریانس توجیهی نشان دهنده (PCA2)دوم ي درصدي مؤلفه 32و تأثیر (PCA1)ي اول درصدي مؤلفه

).6ها است (شکلتمایز بیشتر جمعیت

Page 14: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

38 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

براي گاوهاي سرابی و نجدي ایران PCAبندي جمعیتی با روش الیه .5شکل

Figure 5. Demographic layering with PCA method for Iranian Sarabi and Najdi Cows

32و تأثیر (PCA1) ي اولدرصدي مؤلفه 58نمودار مقدار واریانس توجیه شده نمایانگر تأثیر .6 شکل

(PCA2) ي دوم در گاوهاي سرابی و نجدي ایران استدرصدي مؤلفه

Figure 6. The magnitude of the variance value justifies the effect of 58% of the first

component (PCA1) and the effect of 32 (PCA2) percentage of the second component in

Iranian Sarabi and Najdi Cows

Page 15: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

39 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

در نظر گرفته 6تا 1باشد در دامنه بین ها میجمعیتکه بیانگر تعداد k فاکتور ، Admixtureها یا آمیختگی بین جمعیتکه درصد اختالط در سمت چپ 8طبق شکل شماره ). 7 بار اعتبار سنجی متقابل کمترین خطا را نشان داد (شکل 10با =k 2و شد

هاي مختلف را با قابل مشاهده است افرادي که تا باالي نمودار با یک رنگ مشخص ادامه دارند خالص هستند و افرادي که رنگ

باشند. نتایج حاکی از این است که اختالط ژنتیکی بین دو جمعیت وجود دارد.درصدهاي متفاوت دارند مخلوط بوده و هیبرید می

مربوط به K هاي مربوط به گاوهاي سرابی و نجدي ایران براي تعییناعتبار سنجی متقابل براي داده .7کلش

تعداد جمعیت

Figure 7. Cross validation for data related to Iranian Sarabi and Najdi Cows for

determining K population

Page 16: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

40 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

باشدمی 2دو توده نژاد گاو سرابی و نجدي ایران، تعداد جمعیت Admixtureآنالیز .8شکل

Figure 8. Admixture analysis of two populations of Sarabi and Najdi Native Iranian Cows,

the Number populations are 2

با اعداد متفاوت از یکدیگر مشخص ها؛ خوشه KNNبراي تعداد متفاوت بندي فوق پارامغناطیسیهاي خوشهتعدادي از پاسخ

تر و به مرور به تقسیمات خردتر تفکیک ها ابتدا به تقسیمات بزرگها)، خوشهyاند که با توجه به دماي مشخص شده (محور شدهاعداد هاي بزرگ و ، مربوط به گروه nتر برايي گروه است. اعداد کوچکدهندهنشان )ها (nروي تقسیمات هر عدد بر شوند.می

).9 افزایش یافت (شکل (K) ها، تعداد خوشه KNNهاي خردتر است. با کاهشبنديبزرگتر مربوط به دسته

Page 17: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

41 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

A (الف K=7, KNN =10 B (ب K=6, KNN =15

C (ج K=4, KNN =20 D (د K=3, KNN =30

هاي مختلفKNNبا spinنتایج آنالیز جمعیت گاوهاي سرابی و نجدي با نرم افزار .9شکل

Figure 9. Results of the Sarabi and Najdi Cows population with SPIN software and different

KNN

Page 18: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

42 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

ا ت KNN=2 مورد بررسی یعنی KNNي براي محدوده Modularity مقادیر ي ترسیمبه وسیله KNNمقدار بهینه 70=KNN ر شود که دبدست آمد. مشاهده میKNN=2 ،986/0با مقدار یک حداکثر =Q 10(شکل به دست آمد.(

براي گاوهاي سرابی و نجدي Modularityبا استفاده از مقادیر مختلف KNNتعیین مقدار بهینه .10شکل

ایران

Figure 10. Determining the optimal value of KNN using different Modularity values for

Iranian Sarabi and Najdi Cows

براي جمعیت گاوهاي سرابی و نجدي SPC يبندي به وسیلهي خوشهنمودار تأیید شده KNNپس از انتخاب بهینه بندي شدند که خوشه گروه 9است. حیوانات در KNN =2بندي با ي خوشه). این نمودار نمایانگر سطح بهینه11مشخص شد (شکل

جواري بین ي سطح همي افقی نشانهاند. فاصلههایی تقسیم شدههستند که خود به زیرجمعیتي پایه و اصلی جامعه 2مربوط به ي پایداري هر خوشه است.هاست و دما یا همان محور عمودي نشان دهندهخوشه

افراد ها نمایانگر کند. در این شکل،گرهرا منعکس می 11بندي شکل هاي خوشه، جواب12ساختار جمعیتی ارائه شده در شکلي بین حیوانات مرتبط است. هر حیوان با یک گره مشخص شده است و حیوانات قرار و خطوط اتصالی بین دو گره نشانگر رابطه

اند. در این ي متراکم معین شدهها به صورت تودهجوامع هم در درون جامعهاند وخرده گرفته در هر جامعه به خوبی از هم مجزا شده

شود. این تصویر، بیانگر تفسیر راحت این رویکرد در ي اصلی گاوهاي سرابی و نجدي مشاهده میو جامعهشکل به وضوح جدایی دافزار ) یا کاربرد رویکرد مبتنی بر مدل با استفاده از نرم13گذاري چند بعدي (شکلها مانند مقیاسمقایسه با استفاده از سایر روش

STRUCTURE روي همین مجموعه داده اعمال شدند.) است که به منظور مقایسه 14(شکل

Page 19: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

43 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

جمعیت گاوهاي سرابی و نجدي ایرانبراي SPC يبندي به وسیلهي خوشهنمودار تأیید شده .11شکل

Figure 11. Confirmation chart for clustering by SPC for Iranian Sarabi and Najdi Cows

هاي واقعی این موجود، تصویري کامل و دقیق نیست و با توجه به دادههاي سنتی با توجه به فضاي تفسیر نتایج در روش

ها، تفسیر نمودارهاي حاصل از بررسی ها و زیرجمعیتتحقیق از جوامع دامی، به سبب اختالط وسیع جمعیتی و عدم وضوح جمعیتPCA محدودیت دیگر 5شود (شکلبسیار پیچیده می .(PCA زیادي مؤلفه به طور همزمان این است که به تصویر کشیدن تعداد

به سبب PCA ). از طرفی برخی محققان معتقدند روشGao & Starmer 2007براي نمایان کردن ساختار جامعه ممکن نیست (شود (همانند فراوانی آللی)، براي کشف ساختار جمعیتی مناسب نیست پوشی میاینکه در آن از برخی اطالعات ژنتیکی چشم

)Pritchard et al. 2000.(

Page 20: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

44 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

SPCطریق روش ي ارتباطی بین جوامع و خرده جوامع گاوهاي سرابی و نجدي ایران ازشبکه .12شکل

Figure 12. Communication network between populations and Sub populations of Iranian

Sarabi and Najdi Cows by the SPC method

نشان داد که کشف خرده ساختارهاي جمعیتی در این روش با محدودیت مواجه است و فقط نتایج رویکرد مبتنی بر مدل هم

بررسی ADMIXTUREافزار کند. ساختار جمعیت گاوهاي سرابی و نجدي توسط نرمي جمعیتی را نمایان میساختارهاي عمدهبا PCAبندي بیزي و اومیش با روش خوشهنمایش داده شده است. در آنالیز ساختار جمعیت نژادهاي گ 14شد که نتیجه در شکل

، نژادها از نظر ساختاري به هم نزدیک بودند و Bovine SNP 50 K Bead Chipنکلئوتیدي ازچند شکلی تک 935استفاده از هاي معیتاي روي ج). در مطالعهWu et al. 2013داري هم نداشتند (زمینه تفاوت ژنتیکی معنیاین در حالی بود که این نژادها پیش

ترین مقدار مربوط به مؤلفه اول به مقدار درصد واریانس را توجیه کردند که بزرگ 16مؤلفه اول در مجموع فقط 20گوسفند دنیا، از

).Kijas et al. 2012درصد بود ( 98/1

Page 21: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

45 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

جمعیت گاوهاي سرابی و نجدي ایرانبندي گذاري چند بعدي براي تعیین طبقهاجراي مقیاس .13شکل

Figure 13. Multi-dimensional Scaling to determine the classification of the population of

Iranian Sarabi and Najdi Cows

درصد 70/19درصد واریانس و مؤلفه دوم 39/25نشانگر ریزماهواره مؤلفه اول 14اي روي هفت نژاد بز ایرانی با در مطالعههاي مبتنی بر مدل است، نژادهاي که جزء روش STRUCTUREنیز محاسبه گردید و آنالیز STFواریانس را توجیه نمود، آماره

1هاي مرکزي و شمالی مشهود بود در حالی که خوشه غربی استخر ژنیین خوشهبز ایرانی را به سه خوشه تقسیم کرد و اختالطی ب

). در بررسی ساختار ژنتیکی گاوهاي بومی ایران بر اساس نشانگرهاي چند شکل Vahidi et al. 2014کامالً مجزایی تشکیل داد ( ).Karimi et al. 2015توجیه کرد (نوکلئوتیدي، روش مبتنی بر مدل به کار گرفته شد و نتایج تعداد سه خوشه را تک

1. Gene pool

Page 22: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

46 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

، هر STRUCTUREافزار بندي جمعیت گاوهاي سرابی و نجدي توسط نرمنمودار مربوط به خوشه .14 شکل

ي رنگی تقسیم شده، نشان داده شده است که طول آن نشانگر سهم قطعه Kفرد با یک خط عمودي که به

ي استنتاجی استخوشه Kهر کدام از

Figure 14. shows the cluster diagram of the population of Sarabi and Najdi Cows by the

STRUCTURE software, each person is represented by a vertical line divided into K colored

segments, the length of which represents the contribution of each of the K clusters

بررسی شد. نتایج ساختار جمعیت و K80 ساختار ژنتیکی و تنوع ژنتیکی گاوهاي وحشی و اهلی بنگالدش با اسنیپ چیپ

Uzzaman( ساختار ضعیفی داشتند 3بوده و دو جمعیت زبو 2ایندیکوس جدا از بوس 1ي اصلی پیشنهاد کرد که گایالآنالیز مؤلفه

et al. 2014(. این روش) هایی که ذکر شدPCA و MDSهاي بدون نظارت هستند که اطالعات اولیه در آنالیزها )، جزء روشهاي با حجم زیاد (صدها هزار نشانگر و هزاران نمونه) را دارند. در ها توانائی اجراي سریع دادهشود. همچنین، این روشوارد نمی

براي بررسی ساختار جمعیتی، در حالی که هر دو روش ساختار جمعیتی مشابهی را شناسایی MDSو PCA مقایسه دو روش

.)Wang et al. 2009( بندي جمعیتی عمل کرددر تصحیح الیه MDSکمی بهتر از PCAکردند،

نتایج Admixtureشمالی با روش آمریکاي غربجمعیت ساکنان شمالدر بررسی الگوهاي اختالطی و ساختار جمعیتی، التین وجود داشتغرب اقیانوس آرام و آمریکايها را نشان داد، ولی اختالف در بین الگوهاي اختالط در شمالبرخی از شباهت

)2014et al. Verduروش .( هايGC 4 براي تست آماري GWAS تواند اعمال شودهاي متنوع توارثی میبا مدل )Tsepilov

2. Gaial 3. Bus indicus 4. Zebu 1. Genomic wide association study

Page 23: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

47 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

et al. 2013(. هاي مبتنی بر روش ،در این بینهاي مختلفی مقایسه شدند که بندي جمعیتی روشبراي بررسی الیهاي در مطالعهخوبی نداشت عملکرددار، بندي جمعیتی معنیهاي با الیهعملکرد مشابهی داشتند اما روش کنترل ژنومیک در جمعیت PCAمدل و

)Zhang et al. 2008(. از روشAdmixture هاي پایه از طریق اعتبار سنجی متقابل استفاده تعداد جمعیت توان براي تخمینمی

. )Alexander & Lange 2011( برد کرد و افراد از انساب شناخته شده را براي دقت بیشتر تخمین اجداد بکار

ی ها است در حالاي دادهنیازمند پیش فرض توزیع نرمال چند جمله PCAبود. PCAپذیرتر از روش انعطاف MDSروش شود بندي جمعیتی یکسان میدر این صورت نتایج دو روش در تصحیح الیه ،تواند از ماتریس کواریانس بدست آیدمی MDSه ک

)Li & Yu 2008(. مقادیرΔK محاسبه شده با استفاده از روشEvanno et al. )2005 (ي بهترین توزیع مقادیر، نشان دهنده ).15خوشه مناسب شناخته شد (شکل 2ها است که براي این کار تعداد تعداد خوشه با توجه به ساختار داده

هاي سرابی و نجدي ایرانبراي گاو، .Evanno et alمحاسبه شده با استفاده از روش ΔKمقادیر .15شکل

Figure 15. Calculated values of ΔK using Evanno et al. For Iranian Sarabi and Najdi Cows

کند، به شدت به استاندارد آماري براي برآورد پارامترهاي جمعیتی استفاده می رویکردهايکه از STRUCTUREروش هاي آللی را ي نمونه محدود و کوچک باشد، کارایی مناسبی ندارد؛ چرا که فراوانیهاي مدل وابسته است و زمانی که اندازهفرض

چیدگی محاسباتی، سرعت کمی دارد و محاسبات با تعداد زیاد نشانگر، قابل اجرا نیست. کند. از طرفی به دلیل پیبدون دقت برآورد میاست و SPCهاي پیشین در روشمزیت اصلی که در این بررسی به آن اشاره شد، کارایی محاسباتی باال و کمترین نیاز به فرض

ن داشتن هر گونه اطالعاتی از شجره و نژاد، براي بررسی دهد که اطالعات هزاران حیوان را بدوبنابراین به محقق این امکان را می

Page 24: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

48 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

سازي بندي سه جمعیت دامی شبیهدست آمده از این تحقیق با نتایج حاصل از خوشهنتایج به .ساختار جمعیتی تجزیه و تحلیل کند

ا استفاده از نشانگرهاي هاي گاومیش ایران بو بررسی تنوع ژنتکی و ساختار جمعیتی توده )Rahmanienia et al. 2015a( شده .)Rahmanienia et al. 2015a( مطابقت دارد SNPمتراکم

هاي ذکر شده جمعیت بکار برده شد، و همه روش هاي مختلفی براي بررسی ساختاردر این مطالعه با توجه به اینکه روش

از این بود که با وجود افراد خالص در این هاي دو توده نژادي را نشان دهند و نتایج بدست آمده حاکی توانستند ساختار جمعیتها، این افراد از دو جمعیت مختلف متعلق به یک نژاد هستند و اشتراك ژنتیکی زیادي دارند. نتایج این تحقیق در صورت وجود جمعیت

ها و مقایسه یرجمعیتو با استفاده از اطالعات نژادهاي دیگر و با در نظر گرفتن زGWAS صفات فنوتیپی و نتایج حاصل از آنالیز بندي جمعیت شود. تواند منجر به فهم بهتر اهمیت بررسی ساختار و الیهها، میآن با نتایج حاصل از در نظر نگرفتن زیر جمعیت

سپاسگزاري

.گردد، تشکر و قدردانی میSPINافزار نیا به دلیل همکاري در استفاده از نرمیدکتر جواد رحمانآقاي از

منابع

تولیدي صفات ژنتیکی پارامترهاي برآورد) 1392(مجتبی پورطهمورث ، اصغرنژاد علیاسلمی علی، امینی محمدرضا، بحرینی بهزادي .21-24، )9(25 روستایی توسعه دامداري تحقیقات. ایران شیري هولشتاین گاوهاي

.4-27 ص ایران بومی دام و طیور ژنتیکی ذخائر )1377( جواد توکلیان جمعیت در شیر تولید با آن ارتباط و DGAT1 ژن ژنتیکی تغییرات )1390(و همکاران محمدآبادي محمدرضا کوپایی حامد،خراتی

. 185-192 ،)2(3 ایران پژوهشی علمی مجله. ایران هولشتاین گاو

ورم با DGAT1 ژن آلل تغییرات بین ارتباط بررسی )1391( و همکاران رضاعلی ترنگ محمدآبادي محمدرضا، کوپایی حامد،خراتی

.104-101)، 1(7 نوین ژنتیک مجله. ایران هولشتاین گاوهاي در پستان

و جمعیت ساختار نظارت بدون ايخوشه تحلیل و تجزیه )1394حسین ( مرادي شهرباباك آشتیانی سیدرضا،میرائی جواد، نیارحمانی .277-877، )46(3 ایران دامی علوم مجله. متراکم SNP نشانگرهاي از استفاده با زیرجمعیت

با ایران هايجمعیتی گاومیش ساختار و ژنتیکی تنوع )1394( حسین شهربابک مرادي ،سیدرضا آشتیانیمیرائی جواد، نیارحمانی .114-120 رساله دکترا. ص. SNP نشانگرهاي متراکم از استفاده

مجله. بارز جبال در بز قرمز BMP15 ژن 2 چند شکلی اگزون) 1389(سونیا زادهزکی محمدرضا، محمدآبادي اهللا،زاده روحعلینقی .69-80،)1(2 کشاورزي بیوتکنولوژي

Page 25: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

49 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

. کرمان استان هولشتاین و بومی گاوهاي در بتا الکتوگلوبولین هايژنوتیپ ) بررسی1389( اکرممحمدي محمدآبادي محمدرضا،

. 61-67)، 2(12 دامی تولیدات مجله

هولشتاین و بومی شیري گاوهاي کاپاکازئین ژن بررسی) 1389( و همکاران حمیدرضا میرزایی محمدآبادي محمدرضا، ، اکرم محمدي

. 125-132)2(16 طبیعی منابع و کشاورزي علوم . مجله PCR-RFLP روش از استفاده با کرمان استان در

تجزیه و تحلیل تنوع ژنتیکی در پنج گروه )1396زاده کشکوئیه علی (محمدرضا، اسمعیلی واجدابراهیمی محمدتقی، محمدآبادي .143-158، 7 بیوتکنولوژي کشاورزي مجله گوسفند ایرانی با استفاده از نشانگرهاي ریزماهواره.

2 اگزون مطالعه براي بیوانفورماتیک ابزارهاي از استفاده )1392( و همکاران نیازي علی محمدآبادي محمدرضا، زاده مرتضی،هادي .283-288 ،)334 (8 نوین ژنتیک مجله. تالبی و تالی هاي بز در GDF9 ژن

BMP15ژن 2 اگزون از بیوانفورماتیک تحلیل و تجزیه )1392(و همکاران محمدآبادي محمدرضا علی، نیازي زاده مرتضی،هادي .117-120)،1(9 نوین ژنتیک. تالبی و تالی بزهاي در

References Alexander DH, Lange K (2011) Enhancements to the ADMIXTURE algorithm for individual

ancestry estimation. BMC Bioinformatics 12, 246.

Alexander DH, Novembre J, Lange K (2009) Fast model-based estimation of ancestry in unrelated

individuals. Genome Res 19, 1655-1664.

Alinaghizadeh H, Mohammadabadi MR, Zakizadeh S (2010) Exon 2 of BMP15 gene

polymorphismin Jabal Barez Red Goat. Agric Biotechnol J 2, 69-80 (In Persian).

Barazandeh A, Mohammadabadi MR, Ghaderi M, Nezamabadipour H (2016) Predicting CpG

Islands and Their Relationship with Genomic Feature in Cattle by Hidden Markov Model

Algorithm. Iran J Appl Anim Sci 6, 571-579.

Behzadi Behzadi MR, Amini A, Slaminejad A, Tahmoorespour M (2013) Estimation of genetic

parameters for production traits of Iranian Holstein dairy cattle. Livest Res Rural Develop

25, 21-24 (In Persian).

Bowden R, MacFie TS, Myers S et al. (2012) Genomic tools for evolution and conservation in

thechimpanzee: Pan troglodytesellioti is a genetically distinct population. PLOS Genet 8,

e1002504.

Brohée S, Faust K, Lima-Mendez G et al. (2008) NeAT: a toolbox for the analysis of biological

networks, clusters, classes and pathways. Nucleic Acids Res 36, W444-W451.

Decker JE, Pires JC, Conant GC et al. (2009) Resolving the evolution of extant andextinct

ruminants with high-throughput phylogenomics. Proceedings of the National Academy of

Sciences 106, 18644-18649.

Page 26: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

50 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

Domany E (2003) Cluster analysis of gene expression data. J Statistical Physics 110, 1117-1139.

Ebrahimi Z, Mohammadabadi MR, Esmailizadeh AK et al. (2015a). Association of PIT1 gene

with milk fat percentage in Holstein cattle. Iran J Appl Anim Sci 5, 575-582.

Ebrahimi Z, Mohammadabadi MR, Esmailizadeh AK et al. (2015b) Association of PIT1 gene and

milk protein percentage in Holstein cattle. J Livest Sci Technol 3, 41-49.

Evanno G, Regnaut S, Goudet J (2005) Detecting the number of clusters of individuals using the

software STRUCTURE: a simulation study. Mol Ecol 14, 2611-2620.

Faraji-Arough H, Aslaminejad A, Tahmoorespur M et al. (2015) Bayesian Inference of (Co)

Variance Components and Genetic Parameters for Economic Traits in Iranian Holsteins via

Gibbs Sampling. Iran J Appl Anim Sci 5, 51-60.

Fernández ME, Goszczynski DE, Lirón JP et al. (2013) Comparison of the effectiveness of

microsatellites and SNP panels for genetic identification, traceability and assessment of

parentage in an inbred Angus herd. Genet Mol Biol 36, 185-191.

Gao X, Starmer J (2007) Human population structure detection via multilocus genotype

clustering. BMC Genet 8, 34.

Gautier M, Laloë D, Moazami-Goudarzi K (2010) Insights into the genetic history of French cattle

from dense SNP data on 47 worldwide breeds. PloS One 5, e13038.

Getz G, Gal H, Kela I, Notterman DA et al. (2003) Coupled two-way clustering analysis of breast

cancer and colon cancer gene expression data. Bioinformatics 19, 1079-1089.

Getz G, Levine E, Domany E (2000a) Coupled two-way clustering analysis of gene microarray

data. Proceedings of the National Academy of Sciences 97, 12079-12084.

Getz G, Levine E, Domany E et al. (2000b) Super-paramagnetic clustering of yeast gene

expression profiles. Physica A: Statistic Mechanic Appl 279, 457-464.

Ghasemi M, Baghizadeh A, Abadi MRM (2010) Determination of genetic polymorphism in

Kerman Holstein and Jersey cattle population using ISSR markers. Australian J Basic Appl

Sci 4, 5758-5760

Hadizadeh M, Mohammadabadi MR, Niazi A et al. (2013) Use of bioinformatics tools to study

exon 2 of GDF9 gene in Tali and Beetal goats. Modern Genet J 8, 283-288 (In Persian).

Hadizadeh M, Niazi A, Mohammadabadi MR et al. (2014) Bioinformatics analysis of the BMP15

exon 2 in Tali and Beetal goats. Modern Genet J 9, 117-120 (In Persian). Heaton MP, Keen JE, Clawson ML et al. (2005) Use of bovine single nucleotide polymorphism

markers to verify sample tracking in beef processing. J Am Vet Med Assoc 226, 1311-1314.

Holmström E, Bock N, Brännlund J (2009) Modularity density of network community divisions.

Physica D: Nonlinear Phenomena 238, 1161-1167.

Page 27: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

51 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

Karimi K, Strucken Eva M, Moghaddar N et al. (2016) Local and global patterns of admixture

and population structure in Iranian native cattle. BMC Genet 17, 108.

Karimi K, Beigi Nassiri MT, Mirzadeh Kh et al. (2009) Polymorphism of the β-lactoglobulin

gene and its association with milk production traits in Iranian Najdi cattle. Iran J Biotchnol

7, 82-85.

Khansefid SM (2009) An introduction to Sarabi cow breed a vernacular cow breed of Iran. Nolan

Special Magazine on Dairy cows. No3/Jan-Mar. Kharrati Koopaei H, Mohammadabadi MR, Ansari.Mahyari S et al. (2012a) Effect of DGAT1

variants on milk composition traits in Iranian Holstein cattle population. Anim Sci Paper

Report 30, 231-240

Kharrati Koopaei H, Mohammadabadi MR, Ansari Mehyari S et al. (2011) Genetic Variation of

DGAT1 Gene and its Association with Milk Production in Iranian Holstein Cattle Breed

Population. Iran J Anim Sci Res 3, 185-192 (In Persian).

Kharrati Koopaei H, Mohammadabadi MR, Tarang A et al. (2012b) Study of the association

between the allelic variations in DGAT1 gene with mastitis in Iranian Holstein cattle. Modern

Genet J 7, 101-104 (In Persian).

Kijas JW, Lenstra JA, Hayes B et al. (2012) Genome-wide analysis of the world's sheep breeds

reveals high levels of historic mixture and strong recent selection. Plos-Biol 10, 331.

Kijas JW, Townley D, Dalrymple BP et al. (2009) A genome wide survey of SNP variation reveals

the genetic structure of sheep breeds. PloS One 4, e4668.

Lee C, Abdool A, Huang CH (2009) PCA-based population structure inference with generic

clustering algorithms. BMC Bioinformatics 10, S73.

Levy M, Feingold J (2000) Estimating prevalence in single-gene kidney diseases progressing to

renal failure. Kidney International 58, 925-943.

Li Q, Yu K (2008) Improved correction for population stratification in genome‐wide association

studies by identifying hidden population structures. Genet Epidemiol 32, 215-226. Lirón J, Ripoli M, De Luca J et al. (2002) Analysis of genetic diversity and population structure

in Argentine and Bolivian Creole cattle using five loci related to milk production. Genet Mol

Biol 25, 413-419.

Markovtsova L, Marjoram P, Tavaré S (2000) The age of a unique event polymorphism. Genet

156, 401-409.

Marquitti FMD, Guimarães PR, Pires MM, Bittencourt LF (2014) MODULAR: software for the

autonomous computation of modularity in large network sets. Ecography 37, 221-224.

Page 28: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

52 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

Meuwissen T, Solberg TR, Shepherd R, Woolliams JA (2009) A fast algorithm for BayesB type

of prediction of genome-wide estimates of genetic value. Genet Sel Evol 41, Doi:

10.1186/1297-9686-41-2.

Mohammadabadi MR, Mohammadi A (2010) Study of beta-lactoglobulin genotypes in native and

Holstein cattle of Kerman province. J Anim Prod 12, 61-67 (In Persian).

Mohammadabadi MR (2017) Role of clostridium perfringens in pathogenicity of some domestic

animals. Journal Adv Agric 7, 1117-1121.

Mohammadabadi MR, Esfandyarpoor E, Mousapour A (2017) Using Inter Simple Sequence

Repeat Multi-Loci Markers for Studying Genetic Diversity in Kermani Sheep. J Res Dev

5, 154-157.

Mohammadi A, Mohammadabadi MR, Mirzaei H et al. (2009) Study of Kappa Casein gene of

local and Holstein dairy cattle in Kerman province using PCR-RFLP method. J Agric Sci

Natural Resources 16, 125-132 (In Persian).

Morin PA, Luikart G, Wayne RK (2004) SNPs in ecology, evolution and conservation. Trends

Ecol Evol 19, 208-216.

Neuditschko M, Khatkar MS, Raadsma HW (2012) NetView: A High-Definition Network-

Visualization Approach to Detect Fine-Scale Population Structures from Genome-Wide

Patterns of Variation. PloS One 7, e48375.

Newman ME, Girvan M (2004) Finding and evaluating community structure in networks. Phys

Rev 69, 026113.

Ojango J, Pollott G (2001) Genetics of milk yield and fertility traits in Holstein-Friesian cattle on

large-scale Kenyan farms. J Anim Sci 79, 1742-1750.

Pasandideh M, Mohammadabadi MR, Esmailizadeh AK, Tarang A (2015) Association of bovine

PPARGC1A and OPN genes with milk production and composition in Holstein cattle. Czech

J Anim Sci 60, 97-104.

Paschou P, Ziv E, Burchard EG, Choudhry S et al. (2007) PCA-correlated SNPs for structure

identification in worldwide human populations. PLoS Genet 3, e160.

Pritchard JK, Stephens M, Donnelly P (2000) Inference of population structure using multilocus

genotype data. Genet 155, 945-959.

Purcell S, Neale B, Todd-Brown K et al. (2007) PLINK: a tool set for whole-genome association

and population-based linkage analyses. Am J Hum Genet 81, 559-575.

Radjiman & Sugiarto (2005) Super Paramagnetic Clustering of DNA Sequences. Master of

Science dissertation. National University of Singapore.

Page 29: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

1398و همکاران، خصالی اقطاعی

53 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

Rahmanienia J, Miri Ashtiani SR, Moradi Shahrbabak H (2015a) Unsupervised clustering

analysis of population and subpopulation structure using dense SNP markers. Iran J Anim

Sci 46, 287-277 (In Persian).

Rahmanienia J, Miriya Ashtiani R, Moradi Shahrbabak H (2015b) Genetic diversity and

demographic structure of Iranian buffaloes using dense SNP markers. Ph.D. thesis p. 120-

114 (In Persian).

Sargolzaei M, Schenkel FS (2009) QMSim: a large-scale genome simulator for livestock.

Bioinform 25, 680-681.

Seo TK, Thorne JL, Hasegawa M, Kishino H (2002) Estimation of effective population size of

HIV-1 within a host: a pseudomaximum-likelihood approach. Genet 160, 1283-1293.

Serre D, Montpetit A, Paré G et al. (2008) Correction of population stratification in large multi-

ethnic association studies. PloS One 3, e1382.

Shannon P, Markiel A, Ozier O et al. (2003) Cytoscape: a software environment for integrated

models of biomolecular interaction networks. Genome Res 13, 2498-2504.

Tang H, Peng J, Wang P, Risch NJ (2005) Estimation of individual admixture: analytical and

study design considerations. Genet Epidemiol 28, 289-301.

Tavakkolian J (2000) Genetic Resources of Native Farm Animals in Iran. P. 4-27 (In Persian).

Tetko IV, Facius A, Ruepp A, Mewes HW (2005) Super paramagnetic clustering of protein

sequences. BMC Bioinform 6, 82.

Troy CS, MacHugh DE, Bailey JF et al. (2001) Genetic evidence for Near-Eastern origins of

European cattle. Nature 410, 1088-1091.

Tsafrir D, Tsafrir I, Ein-Dor L et al. (2005) Sorting points into neighborhoods (SPIN): data

analysis and visualization by ordering distance matrices. Bioinform 21, 2301-2308.

Tsepilov YA, Ried JS, Strauch K et al. (2013) Development and application of genomic control

methods for genome-wide association studies using non-additive models. Plos One 8,

e81431.

Uzzaman MR, Edea Z, Bhuiyan MSA et al. (2014) Genome-wide Single Nucleotide

Polymorphism Analyses Reveal Genetic Diversity and Structure of Wild and Domestic

Cattle in Bangladesh. Asian-Australas J Anim Sci 27, 1381.

Vahidi SM, Tarang AR, Naqvi AU et al. (2014) Investigation of the genetic diversity of domestic

Capra hircus breeds reared within an early goat domestication area in Iran. Genet Sel Evol

46, 27.

Vajed Ebrahimi MT, Mohammadabadi MR, Esmailizadeh AK (2016) Analysis of genetic

diversity in five Iranian sheep population using microsatellites markers. Agric Biotechnol

J 7, 143-158 (In Persian).

Page 30: Comparison of the Different Clustering Methods for Population …jab.uk.ac.ir/article_2348_576170ff533d489fd6f812a4a3cb28c1.pdf · 1398 ،نارﺎﮑﻤﻫ و ﯽﻋﺎﻄﻗا ﯽﻟﺎﺼﺧ

)1398 بهار، 1، شماره 11مجله بیوتکنولوژي کشاورزي (دوره

54 Agricultural Biotechnology Journal; Printing ISSN: 2228-6705, Electronic ISSN: 2228-6500

Vajed Ebrahimi MT, Mohammadabadi MR, Esmailizadeh AK (2017) Using microsatellite

markers to analyze genetic diversity in 14 sheep types in Iran. Archiv fuer Tierzucht

(Archives Anim Breed) 60, 183-189.

Verdu P, Pemberton TJ, Laurent R et al. (2014) Patterns of admixture and population structure in

native populations of Northwest North America. Plos Genet 10, e1004530.

Wang D, Sun Y, Stang P et al. (2009) Comparison of methods for correcting population

stratification in a genome-wide association study of rheumatoid arthritis: principal-

component analysis versus multidimensional scaling, BMC proceedings, BioMed Central 3,

S109.

Wang DG, Fan JB, Siao CJ et al. (1998) Large-scale identification, mapping, and genotyping of

single-nucleotide polymorphisms in the human genome. Sci 280, 1077-1082.

Zamani P, Akhondi M, Mohammadabadi MR (2015) Associations of Inter-Simple Sequence

Repeat loci with predicted breeding values of body weight in sheep. Small Rumin Res 132,

123-127.