-- 作者:jwkai
-- 发布时间:10/31/2005 11:25:00 PM
-- 生物信息学的发展现状和展望zz
[本篇全文] [回复本文] [本篇作者: Re ] [本篇人气: 118] 发信人: Re (芽-细胞分裂中...遇上了冬天...), 信区: Bioinfo 标 题: 生物信息学的发展现状和展望 发信站: 生命玄机 BBS (2003年01月19日00:21:15 星期天), 站内信件 生物信息学的发展现状和展望 一、 什么是生物信息学: 1. 人类基因组计划与生物信息学 人类基因组计划(Human Genome Project,简称HGP)是美国科学家在1985年率先提 出的,其目的在于阐明人类基因组DNA3×109核苷酸序列,破译人类全部遗传信息,HGP 于1990年正式启动。随着HGP产生的数据爆炸,一门新兴学科----生物信息学应运而生。 生物信息学以计算机为主要工具,开发各种软件,对日益增长的DNA和蛋白质的序列和 结构等相关信息行收集、储存、发行、提取、加工、分析和研究,同时建立理论模型, 指导实验研究,它由数据库、计算机网络和应用软件三大部分构成,在基因组计划中发 挥不可替代的作用。 2. 什么是生物信息学 美国人类基因组计划中给基因组信息学的定义:它是一个学科领域,包含着基因组 信息的获取、处理、存储、分配、分析和解释的所有方面。该定义包含两方面的内容, 一方面是发展强大有效的信息分析工具,构建适合于基因组研究的数据库,用于搜索、 管理、使用人类基因组和模式生物基因组的巨量信息;另一方面是配合实验研究,确定 约30亿个碱基对的人类基因组完整核苷酸顺序,找出人类全部约10万个基因在染色体上 的位置以及包括基因在内的各种DNA片段的功能,即"读懂"人类基因。 随着后基因组时代的到来,基因组学的研究从结构基因组学过渡到功能基因组学, 即从"是什么"过渡到"为什么"的研究。 生物信息学(bioinformatics)是生物学与计算机科学以及应用数学等学科相互交 叉而形成的一门新兴学科。它通过对生物学实验数据的获取、加工、存储、检索与分析 ,进而达到揭示数据所蕴含的生物学意义的目的。由于当前生物信息学发展的主要推动 力来自分子生物学,生物信息学的研究主要集中于核苷酸和氨基酸序列的存储、分类、 检索和分析等方面,所以目前生物信息学可以狭义地定义为:将计算机科学和数学应用 于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分 子信息的生物学意义的交叉学科。 二、 生物信息学的重要研究课题 1. 大规模基因组测序中的信息分析 2. 新基因和新SNP的发现与鉴定 3.非编码区信息结构分析 4.遗传密码的起源和生物进化 5.完整基因组的比较研究 6.大规模基因功能表达谱的分析 7.生物大分子的结构模拟与药物设计 8.生物信息学分析方法的研究 9.建立国家生物医学数据库与服务系统 10.应用与发展研究 三、生物信息学的产生与发展 生物信息学(bioinformatics)是80年代未随着人类基因组计划(Human genome project)的启动而兴起的一门新的交叉学科。它涉及生物学、数学、计算机科学和 工程学,依赖于计算机科学、工程学和应用数学的基础,依赖于生物实验和衍生数 据的大量储存。生物信息学不只是一门为了建立、更新生物数据库及获取生物数据 而联合使用多项计算机科学技术的应用性学科,也不仅仅是只限于生物信息学这一 概念的理论性学科。事实上,它是一门理论概念与实践应用并重的学科。 生物信息学的产生发展仅有10年左右的时间---bioinformatics这一名词在1991 年左右在文献中出现,还只是出现在电子出版物的文本中。事实上,生物信息学的存 在已有30多年,只不过最初常被称为基因组信息学。 基因组信息是生物信息中最基本的表达形式,并且基因组信息量在生物信息量中 占有极大的比重,但是,生物信息并不仅限于基因组信息,生物信息学也不等于是基 因组信息学。 广义的说,生物信息不仅包括基因组信息,如基因的DNA序列、染色体定位,也包括 基因产(蛋白质或RNA)的结构和功能及各生物种间的进化关系等其他信息资源。生 物信息学既涉基因组信息的获取、处理、贮存、传递、分析和解释,又涉及蛋白质组 信息学如蛋白质的序列、结构、功能及定位分类、蛋白质连锁图、蛋白质数据库的建 立、相关分析软件的开发和应用等方面,还涉及基因与蛋白质的关系如蛋白质编码基 因的识别及算法研究、蛋白质结构、功能预测等,另外,新药研制、生物进化也是生 物信息学研究的热点。1995年,在美国人类基因组计划(HGP)第一个五年总结报告 中给出了一个较为完整的生物信息学的定义:生信息学是包含生物信息的获取、处理、 贮存、分发、分析和解释的所有方面的一门学科,它综合运用数学、计算机科学和生 物学的各种工具进行研究,目的在于了解大量的生物学意义。 四、生物信息学发展的必要条件----人才和资金 生物信息学的发展离不开资金和人才培养,而人才培养是当前首要的任务。斯坦 福大学的基因学教授大维.波特指出"我们需要既懂计算机又懂生物学的人才,就象以 前我们需要既懂化学又懂生物学的人才一样"。目前,制药工业、农业、生物科技公司 等均需求这种跨学人才。现在关键在于有关学科间协作和加速培养这批在数学、物理、 信息科学、计算机科学及生物学方面均有造诣的生物信息学人才。 另外,资金也是一个重要因素。事实上,对生物信息学软件、硬件的投资并非小 数目,不是有几台上网的电脑就可以了,建立一套初具规模的生物信息学服务系统, 至少需要投资50万美金。 五、生物信息学研究可能面临的困难: ⒈政府投资不足 虽然国际上生物信息学研究在各发达国家中比较受重视,但仍有不少研究机构抱 怨政府资金投入不够。最近美国许多研究院纷纷申请要求政府加大生物信息学工具与 数据库方面的投入,而且欧洲、日本、澳大利亚在这些领域也存在着资金困扰问题, 欧洲生物信息学研究所(EBI)和欧洲基金会生命科学中心去年都遇到了麻烦。目前 虽然危机已经暂时渡过,但来几年EBI数据库和其它基础结构仍将受到资金短缺的困 扰,一致有人发出了"免费数据服务还能维持多久"的疑问。 2.来自商业机构的竞争 基因组研究潜在的巨大商业利润使得国际上一批大型制 药公司化学公司向该领域大规模的进军。世界最大制药集团之一的Giba Geigy和 Sandoz合资建立的Novartis公司投资2.5亿美元建立基因组研究所;Glaxo-Wellcome 在基因组研究领域投入4700万美元,将研究人员增加一倍;Smith Kline公司花125亿 美元扩展人基因组的顺序,将生物信息学的研究人员从2人增加至70人,并将该公司 药物开发项目中的25%建立在基因组学之上。这一方面给生物信息学发展注入了生机 ,另一方面对那些政府支持的不以赢利为目的的研究机构造成了巨大的压力,学术 部门的资金投入远远不及工业部门,其负面冲击力不可忽视。毕竟经济利益的盲目 追求会导致基因组研究的片面性,生物信息学长路漫漫,保护这些学术部门的良好 发展非常有必要。 3.专业人才匮乏 目前该领域缺乏懂得如何利用计算机技术处理大量生物数据的 生物学,不少生物学家只是将计算机用来打字或作为图纸的替代品。甚至出现了这 样有趣的现象:制药业、工业、农业、生物技术研究团体经常在学术机构大肆搜查 那些"可疑人",更有甚者他们彼此间互挖"墙角"。虽然对于人才的渴求与日俱增, 但全世界也仅有20多个专业人才培训中心,而且这些中心本身也处在恶性循环中, 那些经培训后的人才往往由于高薪诱惑而投身应用工业部门,导致 嘌 教育人员越 来越少,出现"断层"现象。 六、生物信息学的发展展望 《第三次技术革命》写到:"一场与工业革命和以计算机为基础的革命有相同 影响力的化正在开始。下一个伟大时代将是基因组革命时代,它现在处于初期阶段。 "可见基因组研乃至整个生物信息学的发展对今后人类社会将产生的深远影响。 信息学的商业价值十分显著。国外很多大学,研究机构,软件公司甚至政府机 构纷纷成立各种生物信息机构,建立自立的生物信息集成系统,研制这方面的软件, 重金招聘人才,期望从中获取更多的生物信息和数据加以研究和利用,缩短药物开 发周期,抢注基因专利,获取更大利润。我国如不加大资金投入力度,将来可能会 花更多的钱去购买别人的软件,使用专利基因或购买新的药物。所幸,我国也开始 重视这一学科:南、北方人类基因组中心的相继建成,北大生物城的破土动工等, 标志着我国对生物信息学的重视。我们有理由相信,我国的生物信息学在21世纪会 有巨大的飞跃。 作为计算机科学和数学应用于分子生物学而形成的交叉学科,生物信息学已经 成为基因组研究中强有力的必不可少的研究手段。在我国,生物信息学随着人类基 因组研究的展开才刚刚起步,但已显露出蓬勃发展的势头。许多科研单位已经开始 或准备开始从事这方面的研究工作。北京大学研究建立起一个EMBL的镜像数据库, 并提供数据检索服务。在复旦大学遗传学研究所,为克隆新基因而建立的一整套生 物信息系统也已初具规模。中科院上海生化所生物物理等在结构生物学和基因预测 研究方面也有相当的基础,中科院计算所作为我国计算机科学的顶尖机构,利用自 身优势,也开始在生物信息方面投入大量的人力物力,从事相关的研究。
|