- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
. . .
基因家族生信分析
什么是基因家族
概念:是来源于同一个祖先,有一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,他们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。
划分:
按功能划分:把一些功能类似的基因聚类,形成一个家族。
按照序列相似程度划分:一般将同源的基因放在一起认为是一个家族。
1.常见基因家族:
WRKY基因家族:是植物前十大蛋白质基因家族之一,大量研究表明,WRKY基因家族的许多成员参与调控植物的生长发育,形态建成与抗病虫。
NBS-LRR抗病基因家族:是植物中最大类抗病基因家族之一。
MADS-BOX基因家族:是植物体内的重要转录因子,它们广泛地调控着植物的生长、发育和生殖等过程。在植物中参与花器官的发育,开花时间的调节,在果实,根,茎,叶的发育中都起着重要的作用。
热激蛋白70家族(HSP70)是一类在植物中高度保守的分子伴侣蛋白,在细胞中协助蛋白质正确折叠。
基因家族分析流程:
利用蛋白保守域结构提取号在Pfam数据库提取其隐马尔科夫模型矩阵文件(*.hmm)
在数据库(Ensemble 、JGI、NVBI)下载你所需要的物种的基因组数据(*.fa,*.gff)
在虚拟机中Bio-Linux中的hummsearch程序,用隐马尔科夫模型矩阵文件在蛋白序列文件中搜索含有该保守结构域的蛋白
将蛋白序列导入MEGA软件构建进化树(可以阐明成员之间系统进化关系,从进化关系上揭示其多样性)
利用MEME搜索蛋白质的保守结构域
利用MEME搜索基因家族成员的motif可以揭示基因家族在物种内的多样化及其功能,如果他们都含有相同的motif表明其功能具有相似性,如果部分家族成员含有其他不同的motif,很可能这些成员有其他特异功能,或者可以归分为一个亚族
绘制基因染色体位置图
从*.gff文件中抽取我们搜索到的基因位置信息, http://mg2c.iask.in/mg2c_v2.0/ 在线绘制基因染色体位置图
通过染色体位置分布,可以了解基因主要分布字哪条染色体上,及是否能形成基因簇(被认为是通过重组与错配促进基因交流)
基因结构分析
从gff文件中抽取基因的结构信息,绘制转录本结构图。
计算串联重复基因的Ka,Ks
首先将筛选到的基因的cds序列进行多序列对比,筛选identity 75%,tength大于对比的两条序列中较长的那条的长度的75%,将筛选到的基因分别用clustalw进行比对,比对结果导入KsKs_Calculster计算Ka,Ks、
Ka/ks比,计算核苷酸的非同义替代(ka)与核苷酸的同义替代(ks)的平均速率。
Ka/ks比值1表明:通过纯化选择降低了氨基酸变化的速率;比值=1表示中性选择;比值1,表明这些基因可能已经收到积极选择,有利于适应性遗传,这些受正向选择的基因将作为以后的研究重点。
软件的安装
从图片中获得进入NCBI-blast官网复制blast-linux版本的链接
在Linux终端
blast的安装
#wget blast链接
#tar xvfz 文件名 解压缩文件
# mv 解压缩文件 /root/local/app
# mv 解压缩文件 blast
# vi .bashrc
#在最后一行添加export $PATH=/root/local/app/blast/bin:$PATH 并保存退出
#source .bashrc 运行
#blastp -version 查看是否安装成功。
2.hummer的安装
#yum install -y wget //安装wget
#wget hmmer源码链接
#tar -zxvf hmmer-3.2.1
# vi .bashrc
#(在最末端添加的语句) PATH=$PATH:~/biosoft/ hmmer-3.2.1/binaries
#yum install -y gcc
#./configure
#make
#make check
#make install
#which hmmsearch 查看是否安装成功。
3.perl的安装
#wget 源代码链接
# tar xvfz perl-5.28.1.tar.gz 解压缩
#cd perl-5.28.1
#./configure
#make
#make install 安装完成。
3.bioperl 的安装
#wget -O - https://install.perlbrew.pl | bash
#perlbrew install-cpanm
#/root/perl5/perlbrew/bin/cpanm Bio::Perl
具体操作:
1.保守域结构分析
下载蛋白保守结构域文件、cd
您可能关注的文档
- MS_EEPO小学四年级数学(上册)第一单元教(学)案.doc
- SQE年度工作计划总结.doc
- 安全教育培训与交底.doc
- 北京市初中毕业升学体育考试过程性考核实施计划方案.doc
- 采购部管理制度(修改版).doc
- 成都(含郊县)旅游线路的最优设计论文.doc
- 冲压工艺与模具设计实例91973.doc
- 初级会计经济法基础考试真题与答案(512).doc
- 春季高考《财会类专业知识》模拟试题与答案.doc
- 纯化水制备与分配系统验证方案.doc
- 2024年05月福建厦门市同安区所属卫生事业单位招考聘用20人笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年05月舟山市档案馆2024年招考1名工作人员笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年3月上半年四川内江市东兴区部分事业单位招考聘用97人笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年3月上半年四川广播电视台下属事业单位招考聘用2人笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年05月贵州黔西南州晴隆县事业单位引进人才17人笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年05月湖南省道路运输管理局2024年公开招考11名工作人员笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年05月陕西西安医学院急需紧缺专业专任教师招考聘用19人笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年3月上半年四川凉山布拖县招考聘用小学教师123人笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年05月辽宁朝阳师范高等专科学校专任教师招考聘用26人笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年3月2025学年河南驻马店明德高级中学招考聘用学科教师52人笔试历年典型题及考点剖析附带答案含详解.docx
文档评论(0)