快递查询
测试调用测试设计Survival生存曲线绘制软件环境微生物多样性软件转录组分析软件转录组软件购买重测序软件环境微生物多样性软件(1)桌面软件中药空间代谢组学检测中药非靶代谢组检测中药入血/入靶成分分析中药成分鉴定检测中药组学ATAC-seqCHIP-seqHi-C测序基因调控OmicsBeanMicrobe Trakr(微生物基因组鉴定分析工具)网页分析系统WEB分析系统澳洲血清 BovineBD科研管KAPAQIAGENThermoFisherMVE液氮罐4titude® 样品管标记系统Hi-C建库试剂盒及基因组组装软件无血清细胞冻存液Cell Freezing Medium纳米流式检测仪lexogen支原体检测试剂盒仪器试剂耗材数据库开发数据中心TCGA生存数据包功能医学报告系统开发PlantArray植物生理组平台特色服务单细胞测序空间代谢组DSP空间蛋白质组Visium空间转录组测序空间多组学类器官基因芯片染色体级别基因组组装Hi-C建库叶绿体、线粒体基因组测序一代测序动植物基因组de novo测序细菌基因组测序真菌基因组测序病毒基因组测序简化基因组遗传图谱测序简化基因组GWAS测序基因组重测序表观组基因分型外显子捕获目标区域捕获简化基因组遗传图谱性状定位扫描图DNA中5-hmC图谱测定全基因组甲基化测序真菌基因组扫描图测序epiGBS-简化甲基化BSA混池测序基因组SSR开发基因组(DNA)UMI-RNAseq转录组测序真核有参转录组测序真核无参转录组测序原核链特异性转录组测序全转录组测序 降解组表达谱芯片circRNA芯片circRNA测序Small RNA测序Lnc RNA测序m6A甲基化测序互作转录组测序UMI-RNAseq转录组(RNA)16S扩增子全长测序Meta-Barcoding(eDNA)技术研究微生物多样性测序宏基因组测序宏基因组Binning分析宏基因组抗性基因测序HiC-Meta宏基因组宏转录组差异表达测序宏病毒组测序环境DNAHiFi-Meta宏基因组肠道菌群临床检测基于肠道菌群检测和移植的肠道微生态学科建设宏基因组元素循环测序微生物组蛋白组代谢组抗体芯片Raybiotech芯片蛋白芯片蛋白芯片4D蛋白质组Raybiotech芯片OLINK精准蛋白质组学解决方案常规定量蛋白质组蛋白质组定性分析靶向蛋白质组学修饰蛋白质组学非靶向代谢组学靶向代谢组学脂质组学蛋白和代谢组GC-MS全代谢组LC-MS全代谢组靶向代谢组脂质组学代谢组学分子生物学CRISPR基因编辑细胞定制细胞株构建iPS构建CRISPR/Cas9DNA甲基化修饰细胞FAQ基因编辑切片图像扫描组织芯片免疫组化微量基因组建库专家病理切片数字存档多色免疫荧光病理形态学数据陪护扩增子时序分析基因突变体克隆动物中心小动物疾病模型构建和检测服务基因编辑小鼠动物实验支原体污染检测服务细胞系遗传背景鉴定细胞系鉴定外泌体全转录组测序外泌体分离与鉴定单外泌体蛋白质组学分析服务外泌体专题甲基化焦磷酸测序cfDNA甲基化测序DNA甲基化测序850K甲基化芯片935K甲基化芯片全基因组甲基化测序(WGBS)简化基因组甲基化测序 (RRBS)目标区域甲基化测序 (Targeted Bisulfite Sequencing)甲基化DNA免疫沉淀测序 (MeDIP-seq)氧化-重亚硫酸盐测序 (oxBS-seq)TET-重亚硫酸盐测序(TAB-seq)5hmC-Seal,超高灵敏度的羟甲基化检测羟甲基化免疫共沉淀测序 (hMeDIP-seq)DNA 6mA免疫沉淀测序 (6mA-IP Seq)甲基化专题RNA修饰研究专题免疫印迹(Western-blot)技术服务定量Western检测Simoa单分子免疫分析qPCRCNVSNPPGM测序PCR array数字PCR精准检测ATAC-SeqChIP-SeqRIP-Seq基因调控Ribo-seq核糖体印迹测序技术Active Ribo-seq活跃翻译组测序技术翻译组10x官方发布样本准备样本要求样本取材以及样本编号技巧精简版细胞库组织库动物模型蛋白组代谢组Hi-C单细胞与空间转录组单细胞悬液外泌体Raybiotech蛋白芯片Simoa样本准备样本准备要求表单留言板SaaS 帮助搜索Mac谷歌浏览器2019国自然基金查询生信相关工具集合数据分析项目信息单提交资料分享核酸抽提产品资料转录组软件教学视频微生物多样性软件教学视频Lexogen产品培训视频Olink精准蛋白组学专题项目进度个人中心会员登录会员注册购物车联系我们公众号手机商城公司愿景知识分享
当前位置

进化树专题(三) | 比对及用Gblocks处理比对序列

多序列比对是进化分析的基础,有时用来区分一组序列之间的差异,但其主要用于描述序列之间的相似性关系,常用的软件有 Muscle / MAFFT / ClustalW / T-coffee。

2004年Robert C. Edgar发表的文章对这几个软件进行了评估,在准确性和速度方面,Muscle的综合性能是最高的。

01

MUSCLE序列比对

Muscle及其他比对软件都可以接受DNA和Protein序列,输出格式默认是FASTA,也可以根据需要指定其他输出类型 ClustalW / GCG MSF / Phylip format。

命令行运行示例:

可以直接用Muscle 建树,树的格式是Newick format,但是能选用的算法有限,推荐还是使用PhyML v3.0 或 MrBayes。

如果需要进行自然选择分析,如利用 CodeML (PAML) 进行选择压力分析,就需要进行Codons方式比对,依然推荐 Muscle

选择物种对应的密码子表,进行Codons方式的比对后,可以翻译成对应的氨基酸而不会产生内部终止子。需要注意的是输入的CDS必须完整且不含末端的终止密码子。


参考文献:

Robert C. Edgar. 2004. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32(5): 1792-1797.


02

Gblocks

Gblocks(Version 0.91b,http://molevol.cmima.csic.es/castresana/Gblocks_server.html)用于从多序列比对结果中提取保守位点,以利于下一步的进化分析。尤其是差异比较大的序列,比对后Gaps区特别多,更需要用Gblocks做进一步处理。

Gbloks 有两种使用方式,**种是交互式的方式(按提示输入文件改变参数),第二种是命令行方式(在命令行中输入参数)。

命令行运行示例:

参数说明 ---

-t= Default:p

设置序列的类型,可选的值是 p / d / c 分别代表 protein / DNA / Codons,如果前一步的比对选择的是Codons方式,则该参数设置为-t=c

-b1= Default: 50% of the number of sequences + 1

设定保守性位点必须有 >= 该值的序列数。该参数后接一个 integer 数,默认序列条数的 50% + 1

-b2= Default: 85% of the number of sequences

确定保守位点的侧翼位点时,其位点必须有 >= 该值的序列数

-b3= Default: 8

**连续非保守位点的长度;

-b4= Default: 10

保守位点区块的最小长度。该值必须 >=2

-b5= Default: n

设置允许含有 Gap 位点。可选的值有 n / h / a 分别代表 None / With Half / All

-b6= Default: y (Use Similarity Matrices)

默认使用相似性矩阵,仅适用于蛋白比对序列。

-e= default: -gb

设置输出结果的后缀。

结果文件 ---


参考文献:

Talavera, G., and Castresana, J. (2007). Improvement of phylogenies after removing divergent and ambiguously aligned blocks from protein sequence alignments. Systematic Biology 56, 564-577.