生物学常用软简介.ppt

  1. 1、本文档共87页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物学常用软简介

生 物 信 息 学 常 用 软 件 简 介 前言 生物信息学是一门新兴的交叉学科,它将数学和计算机知识应用于生物学,以获取、加工、存储、分类、检索与分析生物大分子的信息,从而理解这些信息的生物学意义。 上面是狭义的生物信息学含义,也是现阶段生物信息学的基本工作. 内容概要 一 生物信息学软件的主要功能简介 1.数据的基本处理 2.序列的比对 3.基因/基因组的注释 4.Snp分析 5.进化分析 6.基因表达分析 7.蛋白质结构预测 二.生物学软件部分常见功能使用技巧 PCR 引物设计 DNA、蛋白质序列同源分析及进化树构建 Contig Express----DNA 序列片断拼接 DNA 模拟电泳 三 生物信息学软件的系统平台 生物信息学软件一般可以分成商业的和开源的两大类,大部份商业的软件都是用在windows平台下的,而大部分开源软件是在unix/linux平台下的. 大部分的软件基于unix/linux平台. 一 生物信息学软件的主要功能简介 1.数据的基本处理 (1)数据的常用格式: 生物信息学中数据的常用格式有: Fasta、NBRF/PIR,EMBL、CLUSRAL、Genbank、phylip等。 这些格式虽然不同,但用一些软件可以进行转换,下面一起看一下Fasta和EMBL FASTA格式又称Pearson的格式,该序列格式要求序列的标题行以大于号">"开头,下一行起为具体的序列。一般建议每行的字符数不超过60个,以方便程序处理。多条核苷酸序列格式即将该格式连续列出即可 (2)峰图转化(phred) Phred是phred\phrap软件包的一部分,主要是用来分析和装配基因组中大片段序列。 phred能处理测序仪直接生成的色谱图,并且产生相关的信息。 phred\phrap软件包由华盛顿大学分子生物技术学院的Phil?Green和Brent?Ewing开发,主要用于学术科研活动。官方网站: 中文教程: /chinese/documents/quickguide/guidePhrap.pdf (3)文件转换(phd2fasta) 作用:把phred或phrap的计算结果转换成fasta格式软件的主页: /mtucker/Public/Consed/phd2fasta.html (4)载体屏蔽(cross_match) 它是phrap软件的一部份,用于比对两套DNA序列,要求输入fasta格式的数据,输出的内容可以有三种:日志、被屏蔽了相应序列后的序列文件(也是用fasta格式),标准屏幕输出。 Cross_match is a general purpose utility for comparing any two DNA sequence sets using the Smith-Waterman algorithm. For example, it can be used to compare a set of reads to a set of vector sequences and produce vector-masked versions of the reads, a set of cDNA sequences to a set of cosmids, contig sequences found by two alternative assembly procedures (for example, phrap and xbap) to each other, or phrap contigs to the final edited cosmid sequence. It is slower but more sensitive than BLAST. (5)序列的聚类拼接 I 序列组装(phrap) phrap is a program for assembling shotgun DNA sequence data. Among other features, it allows use of the entire read and not just the trimmed high quality part, it uses a combination of user-supplied and internally computed data quality information to improve assembly accuracy in the presence of repeats, it constructs the contig sequence as a mosaic of the highest quality read segments

文档评论(0)

173****7830 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档