欢迎来到专业的新思文库网平台! 工作计划 工作总结 心得体会 事迹材料 述职报告 疫情防控 思想汇报 党课下载
当前位置:首页 > 范文大全 > 公文范文 > 正文

浅谈计算机交叉学科

时间:2022-11-05 16:50:10 来源:网友投稿

摘 要:针对在生物信息学教学中碰到的一些实际情况,首先分析了生物信息学的现状,提出了相应的看法,对生物信息学教学的理论与实践教学相结合进行了初步的探索。同时采用案例教学引导学生关注领域前沿。

关键词:生物信息学 教研改革 案例教学

一、 引言

随着后基因组时代的来临,高通量生物技术的发展,生物医学的实验手段和研究方法均发生了巨大的变革,生命科学研究中不断涌现出海量的生物数据,包括基因组数据、蛋白质组数据、功能基因组数据等。这些生命组学的数据使得生物医学研究者以系统生物学的角度来研究生命现象[1-6],同时它们的迅速增长,带来了数据的存储与传输、数据处理、数据获取及数据的理解与应用等等一系列的问题,这些问题促进了生物信息学的产生和快速发展[7-13],也吸引了来自数学、生物学、化学、药学、信息学等各个领域的研究人员广泛关注并取得了大量成果[43-49]。生物信息学定义为应用信息科学技术来理解、组织及管理生物分子数据,旨在为生物研究人员提供一些工具及资源,方便他们获取生物数据,分析数据,从而发现生物世界的新知识[14]。它是一门新兴前沿交叉学科,吸引着各种有影响力国际组织的重大的关注,ORACLE、MICROSOFT、Google等公司也先后加大力度投入生物信息学领域的开发和研究[15-17]。由于这一领域有着极大的潜力,美国国家标准技术协会(NIST)和美国国防部高级研究计划局(DARPA)及美国计算机协会也相继投入这一领域的研究。为了强应这一潮流,抢占学科发展的制高点,同时培养生物信息学人才,很多学校新增设了生物信息学这门课程。接下来我们将结合实际中的教学谈几点体会及相应的一些尝试探索。

二、生物信息学的特点

生物信息学在我国是一门新兴前沿学科,它是信息学、生物学、数理统计等多学科的交叉、结合的产物。它需要多个领域的专家通力合作。传统的生物学研究实质是一门实验科学,需要对实验数据进行处理与分析,从而新现象、新的生物学规律,从而分析、归纳和总结,提炼出新的生物学知识。然而随着生物科学与信息技术的高速发展,生物数据的积累速度不断加快,特别是人类基因组计划顺利实施,使得生物分子数据量以超过摩尔定律的速度迅速发展。利用这些丰富数据,通过分析、处理揭示数据背后的生物学意义,是生物学家、数学家和信息处理人员面临的一个严峻的挑战。生物信息学就是为迎接这一挑战而发展起来的一门新交叉学科。下面结合几方面谈谈生物信息学的特点。

生物信息学研究对象

生物体是一个复杂的系统,同时也可看作是一个信息系统控制着生物的遗传、生长、和发育。生物分子是生信信息的载体,对于生物信息学而言,主要研究两种载体,即DNA分子和蛋白质分子。携带着三种信息,遗传信息、结构信息及进化信息。

DNA分子作为遗传信息的载体,它的核苷酸序列上存储着蛋白质的氨基酸序列编码信息,存储着基因表达调控信息,携带着遗传信息,主要存储在DNA四种字符组成的碱基序列中,控制生物体性状的基因是一系列DNA片段。这些遗传信息的传递与表达促使生物体不断生长与发育。DNA通过自我复制,不断传递着遗传信息使生物体得以繁衍,基因通过转录和翻译,使得遗传信息得以在生物体中表达,从而后代表现出与亲代相似的生物性状。基因表达中,遗传信息从DNA传到RNA,这一过程称之为转录,然后从RNA传递到蛋白质,这一过程称之为翻译,在表达中,基因控制着蛋白质的合成。

蛋白质是机体各种生理活动的物质基础,蛋白质分子是大分子化合物,其基本单位是小分子的氨基酸,组成蛋白质的氨基酸有20种, DNA序列中三个连续的碱基为一个蛋白质的氨基酸编码。碱基字符序列与氨基酸字符序列组成了基本的生物信息,分析这些生物信息有助于认识生命活动的规律及生命本质。

总而言之,生物分子信息具体表现为DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功勇数据,生物信息学则综合利用信息科学、生物学与数理科学的研究方法来收集、存储、处理、分析与解释海量生物信息。生物信息学把基因组DNA序列信息分析作为源头,破译遗传语言,认识遗传信息的组织规律,识别隐藏在DNA序列中的基因,掌握基因的调控与表达功能,获得蛋白质的编码信息后进行蛋白质空间结构模拟和预测。

生物信息学研究的主要内容

生物分子信息的收集与管理。生物分子数据量巨大,如核酸序列的数据以千兆计。因而有组织搜集和管理这些数据是各项工作的前提,便于一些研究人员共享这些数据,及时得到最新的实验结果,需要把这些数据整理成生物信息数据库,同时要不断更新与管理这些收集的信息从而使这些数据的一致性、可靠性和完整性得以保证。

数据库搜索及序列比对。搜索同源序列在某种程度上就是通过序列比较寻找相似序列,这可使研究人员通过搜索序列数据库找到与新序列同源的已知序列,并根据同源性推测该新序列的生物功能。而序列比对则是为了判断两个序列之间是否具有足够的相似性。从而判定二者之间是否具有同源性。

基因表达数据的分析与处理。基因表达数据反映基因转录产物在细胞中的丰度,通过这些数据可以用来分析哪些基因的表达发生了改变,基因之间有何相关性,基因的活动的受限,基因的功能,提供疾病发病机理等等,是生物信息学研究中的热点与重点。

蛋白质结构预测。一切生命活动都与蛋白质息息相关,它是组成生物体的基本物质,遗传信息的携带者是核酸,但遗传信息的传递和表达需要在各种蛋白质的调节控制下进行。通常蛋白质的生物功能由蛋白质的结构所决定,而蛋白质的结构由蛋白质序列所决定。因而蛋白质结构预测也成为生物信息学的研究重点。

生物信息数据库

随着生物分子数据的高速增长,这些数据被收集在各个生物分子数据库中,国际上权威的核酸序列数据库有美国生物技术信息中心(NCBI)的GenBank、欧洲分子生物学实验室的EMBL-Bank,日本遗传研究所的DDBJ。基因组数据库有美国霍普金斯大学GDB 是一部关于人类基因组的数据库,EMBL-EBI和Sanger研究所共同开发的Ensembl是一个综合基因组数据库。其它一些数据库还有表达序列标记数据库dbEST,面向基因聚类数据库UniGene,蛋白质序列数据库SWISS-PROT及TrEMBL等等,这些数据库对生物医学领域人员在从事研究中取得了巨大的帮助。

三、理论与实践教学结合

针对小节2中的生物信息学这门课的特点,由于生物信息学在国内是一门新兴的学科,各大高校都在尝试与摸索教学,因而以往没有多少我们拟采取理论与实践相结合的教学方式。我们让学生掌握分子生物学的基本知识,同时了解使用分子生物学的实用工具。学习如何操作与访问各大生物分子数据库,了解各大生物分子数据库所存有的各类生物分子信息,学习掌握各种数据库搜索技巧,掌握数据库相似性搜索程序FastA的应用,用于相似序列的数据库搜索。上机操作BLAST局部序列对比搜索工具。上机操作VAST结构搜索数据库。练习操作Entrez、SRS、ExPASy等查询和搜索系统,学习构建系统发生树,学习掌握各种统计方法,掌握机器学习与模式识别技术、人工神经网络技术等等,从而使学生更好地了解与掌握生物信息的各种研究重点与热点。

四、 关注领域内的前沿

生物信息学这门课是国内各大高校属于一门新兴的课,当前正在蓬勃发展,由于这门学科是一门交叉学课,因而这门课在各大高校的多个系院中均有开展,诸如计算机工程学院、生物医学工程学院、数理学院等等。针对学生的学习背景,我们为使其对这门课能够深入地进行研究,引导学生关注这门课的前沿,例如,对于有计算机技术背景的学生,由于他们已经学习了数据挖掘、人工智能等课程,通过学习一些分子生物学基本知识,可以继续从事生物信息学的前沿课题生物医学文本挖掘的研究。因而可以从学生的背景出发,引导他们从其学习基础出发,在生物信息学这一领域中以其从事专业的特有视角进行深入研究。生物信息学在国外得到迅速发展,我们将尝试采用借鉴国外成功的案例,对学生进行案例教学,使他们从国外先进的经验中吸取营养,从而更好的掌握这门知识。这些做法一方面可以培养生物信息学人才,一方面也可拓展生物信息学的研究范围,从而使生物信息学这门课在国内蓬勃发展。

五、总结

本文首先介绍了生物信息学这门课的特点,描述了这门课的主要内容,阐述了这门课需要理论与实践相结合的教学方式,同时引导学生关注生物信息学的领域前沿,通过这样的教学方式,一方面加速培养生物信息学人才,另一方面拓展生物信息学的研究范围,使这一前沿得以在国内高校得以迅速发展。

参考文献

[1]Ideker T, Galitski T, Hood L.A new approach to decoding life: systems biology. Annu Rev Genomics Hum Genet. 2001;2:343-72. Review.

[2]Liu ET. Systems biology, integrative biology[J].Predictive biology. Cell. 2005,121(4):505-6.

[3]Nicholson JK, Holmes E, Lindon JC, Wilson ID. The challenges of modeling mammalian biocomplexity[J]. Nat Biotechnol. 2004, 22(10):1268-74.

[4]Kitano H. Systems biology: a brief overview[J]. Science. 2002, 295(5560):1662-4.

[5]Nurse P, Hayles J.The cell in an era of systems biology[J]. Cell. 2011 ,144(6):850-4.

[6]Nurse P. Systems biology: understanding cells[J]. Nature. 2003,424(6951):883.

[7]Wei L, Yu J. Bioinformatics in China: a personal perspective[J].PLoS Comput Biol. 2008,4(4):e1000020.

[8]Hagen JB. The origins of bioinformatics[J].Nat Rev Genet. 2000,1(3):231-6.

[9]Pop M, Salzberg SL. Bioinformatics challenges of new sequencing technology[J].Trends Genet. 2008,24(3):142-9.

[10]Miller CJ, Attwood TK. Bioinformatics goes back to the future[J].Nat Rev Mol Cell Biol. 2003,4(2):157-62.

[11]Chicurel M. Bioinformatics: bringing it all together[J]. Nature. 2002,419(6908):751-2.

[12]Kanehisa M, Bork P.Bioinformatics in the post-sequence era[J].Nat Genet. 2003,33 Suppl:305-10.

[13]Akil H, Martone ME, Van Essen DC. Challenges and opportunities in mining neuroscience data[J].Science. 2011,331(6018):708-12.

[14]Luscombe NM, Greenbaum D, Gerstein M.What is bioinformatics? A proposed definition and overview of the field[J].Methods Inf Med. 2001,40(4):346-58.

[15]Blackwell B, Ravada S. Oracle"s Technology for Bioinformatics and Future Directions[C]. In Proc. First Asia-Pacific Bioinformatics Conference (APBC2003), Adelaide, Australia. CRPIT, 19. Chen, Y.-P.P., Ed. ACS. 35-42.

[16]Stephens SM, Chen JY, Davidson MG, et al. Oracle Database 10g: a platform for BLAST search and Regular Expression pattern matching in life sciences[J].Nucleic Acids Res. 2005,33(Database issue):D675-9.

[17]Nguyen TP, Liu WC, Jordán F. Inferring pleiotropy by network analysis: linked diseases in the human PPI network[J]. BMC Syst Biol. 2011,5:179.

作者简介:

龚乐君,女,博士,南京邮电大学计算机学院、软件学院教师,研究兴趣涉及模式识别、数据与文本挖掘、生物信息学等领域,在相关领域发表SCI/EI学术论文近20篇。

杨荣根,男,博士,金陵科技学院智控学院教师,研究方向模式识别、信号处理,在相关领域发表SCI/EI学术论文10篇左右。

推荐访问:浅谈 交叉 学科 计算机