《植物分子生物学》PPT课件.ppt
文档简介
植物分子生物学 生物信息学基础(10学时) 唐玉荣 1. 绪论 2. 分子数据库及NCBI序列检索 3. 双序列比对及BLAST比对工具 4. 多序列比对和分子系统发育 5. 核酸和蛋白质序列分析工具 主要内容 2学时 4学时 4学时 主要参考书 1.1.基础生物信息学及应用,蒋彦等,清华大学基础生物信息学及应用,蒋彦等,清华大学 出版社出版社 2.2.生物信息学方法与实践,张成岗、贺福初,生物信息学方法与实践,张成岗、贺福初, 科学出版社科学出版社 3.3.生物信息学,赵国屏等,科学出版社生物信息学,赵国屏等,科学出版社 4.4.生物信息学生物信息学基因和蛋白质分析的使用指南基因和蛋白质分析的使用指南 ,李衍达,清华大学出版社,李衍达,清华大学出版社 5.5.生物信息学与功能基因组学,孙之荣主译,生物信息学与功能基因组学,孙之荣主译, 化学工业出版社化学工业出版社 6. 6. Bioinformatics :sequence and Bioinformatics :sequence and genome analysis, David W. Mountgenome analysis, David W. Mount, , 科学出版社科学出版社 7. 7. Instant Notes in Bioinformatics (Instant Notes in Bioinformatics (影影 印版印版), ), 科学出版社科学出版社 1.1 生物信息学产生背景 数据和知识的矛盾产生了生物信息学数据和知识的矛盾产生了生物信息学 1. 绪论 GenBank Data YearBase PairsSequences 1982680,338606 19832,274,0292,427 . 200336,553,368,48530,968,418 200444,575,745,17640,604,319 200556,037,734,46252,016,762 生物信息学(Bioinformatics): 是一门交叉科学,它包含了生物信息的获 取、处理、存储、分发、分析和解释等在 内的所有方面,它综合运用数学、计算机 科学等工具,来阐明和理解大量生物数据 所包含的生物学意义。 1.2 生物信息学定义 数学计算机 生物 生物信息学 收集和管理生物分子数据 数据分析和挖掘 开发分析工具和实用软件 生物分子序列比较工具 基因识别工具 生物分子结构预测工具 基因表达数据分析工具 1.3 生物信息学目标任务 1.4 生物信息学研究内容 序列比对 (Sequence Alignment) 蛋白质结构预测 计算机辅助基因识别 非编码区分析和语言研究 分子进化和比较基因组学 序列重叠群装配 遗传密码的起源 基于结构的药物设计 基因表达谱分析 ,代谢网络分析 ,基因 芯片设计和蛋白质组学数据分析等 1.5 国内外生物信息网址 l国外 l美国国家生物技术与信息中心(NCBI) l欧洲分子生物学网络组织(EMBnet) p 专业节点: u欧洲生物信息研究所(英国,EBI) uSanger研究所(英国,Sanger) p 国家节点: u瑞士 (SIB) u澳大利亚 (ANGIS) l日本国立遗传学研究所(NIG) NCBI 网址: / 包含了公共数据库、生物信 息工具及应用等多种资源。 与很多生物信息软件相关的 站点及资源有链接。 NCBI站点图 http:/www.ebi.ac.uk/ 包含了生物数据库、 软件等多种资源,很 多都有相当优秀的使 用指导帮助 EBI Sanger 网址: http:/www.sanger.ac.uk 主要提供基因组研究相关的数 据与分析工具 SIB 网址: http:/www.isb-sib.ch/ 网址: .au/ ANGIS 网址: http:/www.nig.ac.jp/index-e.html NIG l国内 l北京大学生物信息中心(CBI) l中国科学院上海生命科学研究院生物信息中心 (BioSino) l香港中文大学生物信息中心(HKBIC) l台湾分子生物信息中心(MBC) l天津大学生物信息中心(TUBIC) l国家人类基因组南方研究中心(CHGC) 网址: 是EMBnet的中国节点。 CBI BioSino 网址: / 网址: .hk/ HKBIC 网址: .tw/index.php MBC 网址: / TUBIC CHGC 网址: / 2. 分子数据库及NCBI序列检索 2.1 分子数据类型 生 物 分 子 信 息 核酸序列数据 蛋白质序列数据 生物分子结构数据 生物分子功能数据 最基本 直观 复杂 2.2 分子数据库 l核酸数据库 EMBL ( European Molecular Biology Laboratory欧洲分子生 物学实验室数据库 ,EBI维护) GenBank ( NCBI , National Center for Biotechnology Information美国国家生物技术信息中心维护) DDBJ ( NIG, National Institute of Genetics日本国立遗传学 研究所维护) NCBINCBI EBIEBI NIHNIH EMBL GenBank DDBJ GenBank数据库 基因组DNA数据库 对应于表达基因的cDNA数据库 表达序列标签(ESTs) 序列标签位点(STS) 基因组测序序列(GSSs) 高通量基因组序列(HTGS) 其它核酸数据库 HIV Database(HIV序列数据库) /content/index IMGT(ImMunoGeneTics数据库含有与免疫系统 有关的核酸序列数据 ) http:/www.ebi.ac.uk/imgt/ dbEST (序列表达标记数据库) /dbEST/index.html EPD(真核启动子数据库) http:/www.epd.isb-sib.ch/ l蛋白数据库 lSWISS-PROT(蛋白序列数据库) http:/www.ebi.ac.uk/swissprot/ lPIR(蛋白序列鉴定数据库) / lPDB(蛋白序列三维立体结构数据库) /pdb/home/home.do lPROSITE(蛋白特征序列字典) http:/www.expasy.ch/prosite/ lENZYME(蛋白酶数据库) http:/www.expasy.ch/enzyme/ lREBASE(限制酶数据库) /rebase/rebase.html lHSSP(同源二级结构蛋白数据库) http:/www.sander.ebi.ac.uk/hssp/ lBLOCKS(蛋白序列块数据库) / l基因组数据库 lGDB(人类基因组数据库) / lHGP(人类基因组数据库) http:/www.sanger.ac.uk/HGP/ lDICTYDB(盘基网柄菌基因组数据库) /others/dsmith/dictydb.html lEcoGene(大肠杆菌K12基因组数据库) / lFLYBASE(果蝇基因组数据库) / lMAIZEDB(玉米基因组数据库) / lSGD(酵母菌基因组数据库) / lWORDMPED(蠕虫基因组计划数据库) http:/www.sanger.ac.uk/Projects/C_elegans/ lTIGR(基因组分析研究中心) l其它数据库 lOMIM(人类孟德尔遗传学数据库) /sites/entrez?db=O MIM lSRPDB(信号识别位点数据库) /rnp/SRPDB/SRPDB.html lEMP(酶和代谢途径数据库) /EMP/ 2.3 NCBI序列检索 网址:/ lNCBI资源包括: lPubMed lAll Databases lBLAST lOMIM lBooks lTaxBrowser lStructure PubMed PubMed是美国国家医学图书馆提供的搜索服 务,提供了来自MEDLINE和其它相关数据库的 文献记录,同时提供了许多在线期刊的链接. All Databases Entrez检索系统,将科学文献、核酸和蛋白质序列数据 库、蛋白质三维结构数据库、种群研究数据以及全基 因组数据等整合成一个高度集成的系统. BLAST 是为了分析核酸和蛋白质数据而设计的序列相似性搜 索工具 OMIM 在线人类孟德尔遗传性状数据库,是一个人类基因和遗 传异常的索引 Books 提供在线的参考书籍 Structure 提供了分子建模数据库,是一个记录了大分子三维结构, 以及使这些结构可视化和进行比较分析的工具 TaxBrowser 是一个以组织进行分类的分类信息浏览器 lNCBI序列检索方法 l以索引号进行检索 索引号是由约4-10个数字和字符组成的编码,每个索引号 与一个分子的序列记录相对应 记录类 型索引号格式 GenBank/EMBL/DDBJ Nucleotide Sequence Records One letter followed by five digits, e.g.: U12345 Two letters followed by six digits, e.g.: AY123456, AF123456 Protein Sequence Records from SWISS-PROT and PIR All are six characters: Character/Format 1 O,P,Q 2 0-9 3 A-Z,0-9 4 A-Z,0-9 5 A-Z,0-9 6 0-9 e.g.: P12345 and Q9JJS7 记录类 型索引号格式 RefSeq Nucleotide Sequence Records Two letters, an underscore bar, and six digits, e.g.: mRNA records (NM_*): NM_000492 genomic DNA contigs (NT_*): NT_000347 complete genome or chromosome (NC_*): NC_000907 genomic region (NG_*): NG_000019 RefSeq Protein Sequence Records Two letters (NP), an underscore bar, and six digits, e.g.: NP_000483 以序列索引号进行搜索 文本检索 文本可以是作者名字、杂志名字、基因、 物种等。如:输入RBP4 检索结果选项 Limits 用来在检索中对检索做出各种附加的限制 Previes/Index 允许检索者浏览最后三次检索的结果 History 记录使用者做了几次检索,检索了哪些内容 Clipbord 是一个临时存放检索结果的地方 Details 显示查询的条件表达式,或者直接用条件表达式进行检 索 如果文本检索词为:16S RNA 检索逻辑词 AND OR NOT 数据库记录格式说明 EMBLGenBank含义 ID DE AC SV KW OS OC RN RA RT RL RX RC RP CC DR FH FT SQ 空格 LOCUS DEFINITION ACCESSION VERSION KEYWORDS SOURCE ORGANISM REFERENCE AUTHORS TITLE JOURNAL MEDLINE RAMARK COMMENT FEATURES BASE COUNT ORIGIN 序列名称 序列简单说 明 序列编号 序列版本号 与序列相关的关键词 序列来源的物种名 序列来源的物种学名和分类学位置 相关文献编号,或递交序列的注册信息 相关文献作者,或递交序列的作者 相关文献题目 相关文献刊物杂志名,或递交序列的作者单位 相关文献Medline引号代码 相关文献注释 相关文献其他注释 关于序列的注释信息 相关数据库交叉引用号 序列特征表起始 序列特征表子项 碱基种类统计 数 序列 序列格式FASTA格式 1971年由美国布鲁克海文国家实验室建立 数据库管理者是RCSB,收集了通过X射线衍射和 核磁共振(NMR)实验测得的蛋白质结构的精 确坐标数据3D Macromolecular /pdb/home/home.do As of Tuesday Sep 30, 2008 , there are 53384 Structures 2.4 蛋白质结构数据库(PDB)结构介绍 /pdb/home/home.do e.g.1AE5 Example output: 1AE5 PDB文件格式 PDB蛋白质结构文件格式: 第一部分:标题部分 第一部分:标题部分 HEADER(分子类,公布日期、ID号) OBSLTE (注明此ID号已改为新号) TITLE(说明实验方法类型) CAVEAT(可能的错误提示) COMPND(化合物分子组成) SOURCE(化合物来源) KEYWDS(关键词) EXPDTA(测定结构所用的实验方法) AUTHOR(结构测定者) REVDAT(修订日期及相关内容) SPRSDE(已撤销或更改的相关记录) JRNL(发表坐标集的文献) REMARK REMARK 1(有关文献) REMARK 2(最大分辨率) REMARK 3(用到的程序和统计方法) REMARK 4-999 第二部分:一级结构 第二部分:一
相关知识
课件:《园艺植物病毒病害》PPT课件.ppt
植物组织培养技术ppt
花发育分子生物学课件.ppt
植物的组织培养[PPT课件]
医学PPT课件大全荧光化学发光在植物分子生物学的应用.ppt
药用植物学:菌类植物真菌特征PPT课件
第四章 植物病毒ppt课件
《病毒》PPT课件5
《室内插花布置》课件.ppt
园林常用绿化花卉ppt课件课件下载.ppt
网址: 《植物分子生物学》PPT课件.ppt https://www.huajiangbk.com/newsview782111.html
上一篇: 南京大学生科院孙博团队揭示生长素 |
下一篇: Plant Cell | 南京大 |
推荐分享

- 1君子兰什么品种最名贵 十大名 4012
- 2世界上最名贵的10种兰花图片 3364
- 3花圈挽联怎么写? 3286
- 4迷信说家里不能放假花 家里摆 1878
- 5香山红叶什么时候红 1493
- 6花的意思,花的解释,花的拼音 1210
- 7教师节送什么花最合适 1167
- 8勿忘我花图片 1103
- 9橄榄枝的象征意义 1093
- 10洛阳的市花 1039