生物信息学大作业.doc

下载文档 降价啦

120
0
约1.3万字
约 6页
2019-01-29 发布于山东
举报
版权申诉
保障服务

生物信息学大作业.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

宁波大学科学技术学院答题纸班级：__ ___ 学号: ___ 姓名: __ _____ 学年学期：_ 2010--2011 学年第 1 学期__ 课号：__ HYPERLINK 0/scripts/general.exe/query?page=1pagename=coursedetail.htmcourseno=EO3G26A \t _blank EO3G26A02___ 课名：_生物信息学___ 阅卷教师: __ 成绩: _____________ 第页（共页）序号序列比对算法研究进展 State-of-the-art of Sequence Alignment Abstract Sequence alignment is an important method and problem in bioinformatics. First this paper analyses and compares detailedly about dot matrix method, Smith -Water man algorithm, FAST A algorithm, BLAST algorithm, and MUMmer algorithm in twin sequence alignment. Then this paper summarizes more sequence alignment .Finally, it pointed out study direct of sequence alignment . Key words Bioinformatics twin sequence alignment algorithm more sequence alignment algorithm study direct 摘要:序列比对是生物信息学研究的一个基础而又重要的工具，也是生物信息学中的一大难题。本文对了双序列比对中的点阵法、动态规划算法（Needleman-Wunsc算法、Smith-Waterman算法）、FASTA算法、BLAST 算法、MUMmer算法进行了详细的分析及比较，然后对多序列比对进行了较全的总结并指出其意义。最后指出今后序列比对研究的发展方向。关键词: 生物信息学双序列比对算法多序列比对算法发展方向 0前言生物信息学（Bioinformatics）是在生命科学的研究中，以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一，同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学和蛋白学两方面，具体说就是从核酸和蛋白质序列出发，分析序列中表达的结构功能的生物信息[1，2]。在这门学科中，序列比对是最重要的原始操作,是许多其他更复杂操作的基础。所谓序列比对[3]就是运用某种特定的数学模型或算法，将查询序列与整个数据库的所有序列进行比对,迅速地获得有关查询序列的大量有价值的参考信息。生物信息学中的序列比对算法的研究具有非常重要的理论意义和实践意义，它是将未知序列同已知序列进行相似性比较是一种强有力的研究手段,从序列的片段测定, 拼接, 基因的表达分析, 到RNA和蛋白质的结构功能预测。序列比对问题根据同时进行比对的序列数目分为双序列比对和多序列比对。 1研究历史到目前为止，序列比对已有40多年的发展历史了。点阵图法[4]是较早的序列比对方法，Gibbs AJ 和 McIntyre GA在 1970 年提出的。点阵图法是一种图像显示方法,也揭示蛋白质同源性敏感而直观的方法[5]。点阵法进行氨基酸和核酸的序列比较：当相同的字母在两条序列中同时出现时，在交叉处置点。之后Maizel 利用带颜色的点阵法来识别各种相似区域[6]。 1981 年Smith -waterman提出了动态规划算法[7],使用动态规划解题，对于不少问题具有空间耗费大、时间效率高的特点，因此人们在研究它解决问题时更多的注意空间复杂度的优化，运用各种技巧将空间要求控制在软件可以承受的范围之内。但是这种方法所需的时间和空间复杂度太高,不适应于数据库的搜索. 随后出现了各种启发式算法,其中应用最为广的要数 Fasta[8]和Blast算法[9,10]。随着人类基因组计划的进行,各种模式生物的全基因组序列不断涌现 ,对序列比对的算法提出了更高