Structure-Clumpp_Distruct简易使用指南一、数据准备1.毛细管电泳的数据,经过Genepop检查,更正读带错误,比如双碱基变异的引物,不可能出现单碱基变异。
2.在Excel中通过分列,将等位基因数据分两列显示,再通过条件排序,将同一个体的数据上下相邻,个体编号从小到大。
3.将结果另存为文本文件(制表分隔符)。
二、Structure运行1.打开数据File-newproject–命名、选择存放结果的文件夹、选择输入文件–输入个体数、倍性、所用位点数、缺失值的表示值–Rowofmarkername–IndividualIDforeachindividual–一直点继续2.参数设置Parameterset–New–LengthofBunrinPeriod一般设10万,NumbersofMCMCRepsafterBunrin一般设100万(前者为后者的10-25%)-命名所设参数。
3.开始运行Project–Starajob–出来如下对话框,选中所命名的参数(图中1),K必须从1开始,上限根据自己的居群来定,每个K跑的重复次数(Numberofiteration)一般设为10.点击Star运行4.数据保存当运行结束,在观测运行参数的窗口(SummaryofSilulations)左上角点File,将结果另存为txt文件,其必须保存在与运行结果同一文件夹内。
也可重新打开程序,File–Openproject–选择自动生成的.spj文件,再另存为txt三、结果分析1.确定合适的K值将另存为的txt文件用Excel打开保存为Excel格式,分列,保留K与LnP两列,计算Ln平均值(A-Ln),Ln标准差(ΔLn),B值(A-Ln后一个减前一个),C值(B值前一个减后一个),D值(C值的绝对值),ΔK(D值/ΔLn),然后绘制ΔK随K的变化曲线,拐点所对应的K即为合适值。
(也可对ΔLn做随K的变化曲线,拐点对应值即为合适值)2.运行CLUMPP2.1将运行结果Results文件中对应最合适K值的结果文件(n1-n9,n=0,…)复制到新文件夹,将每个文件中Inferredancestryofindividuals下面的结果复制到Excel中,分列(带括号的一列分列时用文本格式保留括号),做适当修改,另存为文本文件(制表分隔符)2.2将保存的txt文件后缀改为.indfile,同时将CLUMPP的自带文件paramfile中的参数做相应更改,将CLUMPP.exe,##.Indfile和paramfile放在一个文件夹中,双击程序运行2.3将自动生成的.outfile文件中的数据复制到Excel中,分列后仅保留样品与每组频率列,选中所有样品频率列,用条件格式将每列最大值用颜色标注出来。
四、图像生成(Distruct1.1)1.准备casia.indivq文件。
将CLUMPP的结果文件.outfile打开,做成格式如下前三列来自.outfile结果,第四列表示第几个居群,冒号后为每组的频率(本例中分了7组)2.准备nguages文件,给每个居群命名,名字出现在结果图上方3.准备s文件,与第二步一样,但名字显示在结果图的下方4.准备casia.perm文件,即定义每个显示分组的颜色。
5.准备casia.popq文件,第一列为居群序号,后面为各组的频率(此频率为每个居群内,所有个体的平均数),最后一列为居群的个体数。
6.casia_f文件是以上各个文件中包含信息的汇总,前半部分信息来自Structure的结果文件,如##_run_10_f。
7.drawparams文件为参数文件,用word方式打开,编辑对应信息,特别是下面三项,如8.准备好文件后,双击distructWindows1.1.exe运行,闪一下,结果写入casia.ps文件,.ps文件可在CorelDRAW等图像软件中打开和编辑。
注意:所有过程中,尽量将输入数据,运算结果等都放在一起,或放在相应软件的根目录下。