# 生物信息学概述
生物信息学可以理解为 "生物学 + 信息学"。研究对象:生物数据;探索生命过程的每个环节,宏观(从大的角度研究生命过程),微观(从单个分子的结构和运动规律)。探索 “序列 -> 结构 -> 功能 -> 应用” 的功能以及应用部分。
# 研究领域
分子生物学与细胞生物学
生物物理学
脑和神经科学
医药学
农林牧渔学
分子和生态化
# 主要应用
- 生物信息学数据库:生物信息学数据库储存生物信息学研究的原始数据,是生物信息学存在和发展的基础。生物信息学数据库主要探讨生物数据的收集、存储与管理。包括建立国际基本生物信息库和生物信息传输的国际互联网系统;建立生物信息数据质量的评估与检测系统;生物信息工具开发和在线服务;生物信息可视化和专家系统。
- 序列比对:生物信息学最基本的操作对象是核酸序列和氨基酸序列。序列比对是符号序列按一定的标准对齐。它是生物信息学的基本操作,应用于生物信息学的大部分内容中。序列比对既比较序列形式的差异,又给不同的序列找联系。
- 比较基因组和系统发育分析:人类基因组计划及各种模式生物基因组测序任务的陆续完成,为从整个基因组的角度来研究分子进化提供了条件。比较基因组学的核心课题是识别和建立不同生物体的基因和其他基因组特征的联系。其研究的内容包括:序列的保守与差异、基因组的结构、非编码 DNA 的数量和种类差异等。不同物种间的差异可以最终理解为核酸序列和蛋白质序列的差异。根据各种生物在分子水平上的进化关系,可以建立分子进化的系统发育树,估测物种间的亲缘关系,直观地阐明物种间的进化历程。
- 蛋白质结构预测:蛋白质结构预测指从蛋白质的氨基酸序列预测出其三维空间结构。由于蛋白质的生物学功能在很大程度上依赖于其空间结构,因而进行蛋白质的结构预测对于理解蛋白质结构与功能的关系,并在此基础上进行蛋白质复性、突变体设计以及基于结构的药物设计具有重要意义。目前测定蛋白质结构的实验手段主要依靠 X 射线品体衍射与核磁共振方法。
- 生物芯片:生物芯片技术是近年来物理学、微电子学与分子生物学综合交叉形成的高新技术。20 世纪 90 年代初开始实施的人类基因组计划取得了巨大的进展。基因序列数据正在以前所未有的速度膨胀。2000 年基因组研究包括三个突出方面:干细胞作为基因组研究的重要选材;SNP 研究的国际大协作:DNA 芯片的广泛应用。随着人类基因组计划的完成和对治病机制研究的深入,传统的基因诊断方法越来越难适应大量的基因序列信息,而 HGP 的研究成果将在疾病诊断、基因治疗、药物筛选等领域发挥重要的作用。于是可对大量基因信息进行平行分析的基因芯片技术诞生了。基因芯片技术是生物信息学研究领域的重要应用之一。生物芯片技术将为上述研究提供最基本和必要的信息,将成为基因组信息学研究的主要支撑技术。
- 分子设计及药物设计:用计算机对核酸特别是蛋白质的空间三维结构进行预测;根据人们意愿设计蛋白质分子,包括 RNA (核糖核酸) 结构模拟和反义 RNA 分子设计;蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质以及连接肽的设计;生物活性分子的电子结构计算和设计;纳米生物材料的结构模拟与设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物设计,基于 DNA 结构的药物设计等,都依赖生物信息学的发展。
# 代谢网络建模分析
代谢网络又称 "网络生物学" 研究。
代谢网络建模包括:
预测调控网络 —— 网络普遍性分析 —— 建模分析
各个部分的介绍
- 预测调控网络:包括手工和自动检索文献、开发预测工具补充数据。为了提升局限性和标准性问题,利用基因组预测网络。例如:“基因组到代谢网路”。
- 网络普遍性分析:利用 “图论”,例如分析最小单元代谢途径等。
- 建立模型分析:建模工具包括但不限于:Copasi、E-cell。代谢模型典型示例 “Virtual Cell (虚拟细胞)”。
# 总结
生物信息学提倡全球范围内的资源共享,生物信息学发展将对分子生物学、药物方面、医疗成像等多个跨学科领域产生巨大影响。
# 生物学数据库
数据库通俗来说是存储和管理数据的计算机文档。而生物学数据库使用了 4 种不同的数据库结构类型:平面文件、关系型数据库、面向对象数据库和基于 Internet 平台的 XML。
生物数据库需要掌握数据的存储格式,以及数据库的检索。
基于生物数据库有以下思考问题:
- 一级数据库与二级数据库的区别:
一级数据库与二级数据库的区别主要体现在以下几个方面:
- 数据存储结构:一级数据库直接存储和管理数据,而二级数据库则是在一级数据库之上,通过某种方式对数据进行进一步组织和管理。
- 数据访问方式:一级数据库通常提供基本的数据访问接口,而二级数据库则提供更高级别的数据访问接口,如 SQL 查询语言等。
- 数据管理功能:一级数据库主要负责数据的存储和基本管理,而二级数据库则提供更高级别的数据管理功能,如数据查询、数据更新和数据访问控制等。
- 数据库的 Flat File 和 XML 格式各有何特点?
- Flat file(平面文件):简单、易于读取和处理,但缺乏结构化,难以表达复杂的数据关系。
- XML(可扩展标记语言):具有良好的可读性和可扩展性,能够表达复杂的数据关系和层次结构。
- Entrez 的检索途径有哪些?
高级检索、基本检索、主题检索、视觉搜索、出版物检索、作者检索。