生物信息学实验教学中如何巧用数据库
作者:文可佳
  新一轮课程改革强调全面推进素质教育,这就要求我们在教学中应该把学科素养培养置于课程目标核心。新的高中生物学课程标准对包括生命观念、理性思维、科学探究和社会责任在内的生物学科核心素养做了充分阐释。在生物学科核心素养导向以及高考生物选考背景下,学生逐渐了解生物学科的本质并密切关注学科发展。

  近几十年,生命科学与计算机科学迅猛发展,自20世纪80年代末人类基因组计划启动以来,大量序列数据被快速积累,至2004年被誉为生命科学“阿波罗计划”的人类基因组计划宣告完成,从此生命科学研究进入“后基因组学”时代。以生物信息学为代表的生物学与计算机科学的交叉学科在生命科学未来发展中起着越发重要的作用[1]。目前,国内外著名大学大多开设有介绍信息技术在生命科学中重要应用的经典课程[2],这些课程旨在启发学生思维,让学生感受、领会当今信息技术在生命科学中的重要地位。但是,针对中学生的认知水平和接受能力,将生物信息学与中学生物教学进行整合的系统性研究尚不多见。笔者尝试将生物信息学相关的网络数据库应用于日常教学,以期使学生具有将生物学科与计算机科学、数理科学等进行综合的能力,并以生物学科核心素养培养为导向,满足学生个性化发展的需要。

  一、让数据库在日常教学中动起来

  (一)利用PDB数据库帮助学生理解蛋白质结构与功能之间的关系

  结构与功能适应观是生物学科核心素养“生命观念”中的核心思想之一,然而学生初次接触蛋白质结构的概念时,对于蛋白质抽象的由一级到四级的结构特征,以及蛋白质结构如何与功能相适应,很难有准确的理解。蛋白质(Protein Data Bank,PDB)数据库于1971年建立,截至2018年2月,共收录137 478种蛋白质等生物大分子的3D结构信息[3]。在授课过程中,教师访问PDB数据库,将数据库中多种多样具有特殊功能以及精确三维立体结构的蛋白质引入课堂,可提高学生对于抽象知识的整体认知。比如,在开展人教版高中教材必修1第2章第2节“生命活动的主要承担者——蛋白质”课程教学时,教师可带领学生在PDB数据库中下载人源血红蛋白α链与β链的氨基酸序列,如图1所示。

图 1 人源血红蛋白α与β链的氨基酸序列(界面截图)

  教师以此为例介绍蛋白质一级结构的概念,可促进学生对抽象知识的理解。在血红蛋白一级结构的基础上,学生可利用PDB数据库中的信息,将具体的氨基酸序列与蛋白质的二级结构相对应,如图1中血红蛋白β链中的5-15位氨基酸序列对应蛋白质二级结构中的α螺旋,由此建构蛋白质一、二级结构的概念。

  在利用PDB数据库分析血红蛋白一、二级结构后,学生可进一步在PDB数据库中查看血红蛋白未与氧结合(图2左)以及血红蛋白与氧结合之后(图2右)的空间结构。学生通过在PDB数据库中对血红蛋白的三维立体结构进行操作,可系统观察蛋白质大分子的内部结构。之后,学生可在数据库中,对比血红蛋白与氧结合前后空间结构的变化,并进一步分析血红蛋白结构变化如何导致蛋白功能发生变化。笔者就是这样利用PDB数据库中多种多样的蛋白质数据信息帮助学生建立蛋白质结构决定功能的生命观念。

图 2 脱氧血红蛋白(左)与载氧血红蛋白(右)的空间结构

  (二)利用Primerbank数据库帮助学生理解引物设计与PCR技术

  人教版高中教材选修3专题一第2节“基因工程的基本操作程序”中“利用PCR技术扩增目的基因”部分向来是教学的重点和难点。PCR技术在当今生命科学领域的应用非常广泛,而基因、引物、PCR等概念过于抽象,使学生较难理解透彻。Primerbank是由哈佛大学创立的引物设计网站[4]。在开展PCR部分的教学时,笔者尝试带领学生站在科研人员角度,针对学生感兴趣的基因,利用Primerbank数据库完成PCR引物设计,以加深学生对PCR的理解。以人的血红蛋白基因的PCR为例,教师可带领学生在Primerbank数据库的“种属”中选择“人”,并在“基因名称”中输入“血红蛋白”,得到如图3所示的结果。可以看到,在针对血红蛋白基因的编码区序列设计出的引物中,正向引物为人血红蛋白基因编码区开始的19个核苷酸序列,反向引物为人血红蛋白基因编码区最后21个核苷酸序列的反向互补序列。学生通过分组画出血红蛋白基因的双链序列并进行引物匹配,同时从核苷酸序列的角度分析图3中正向引物和反向引物的退火温度(Tm值)为何有差异,这样可透彻理解PCR的引物设计和PCR技术的原理。

图 3 人源血红蛋白基因 PCR 引物设计(界面截图)

  (三)利用MapViewer数据库帮助学生理解基因与染色体的关系

  Map Viewer是美国国立生物信息中心NCBI网站上提供的寻找基因的工具,用户通过Map Viewer可搜索到目标基因在不同种属生物的染色体上所处位置、基因序列以及内含子外显子排序等实用信息[5]。在开展人教版高中教材必修2第2章“基因和染色体的关系”的新课教学时,笔者发现学生刚接触基因、染色体、染色质等概念,很容易混淆。为此,笔者带领学生利用NCBI Map Viewer数据库搜索其熟悉的基因在不同物种染色体上的位置,例如搜索血红蛋白基因在人与鼠染色体上位置,结果如图4所示。学生可利用数据库平台对比不同物种染色体核型信息、同一基因在不同物种染色体上的位置等,进一步获取不同物种基因信息。借此,学生对基因与染色体的抽象概念以及基因和染色体之间的关系会更易理解。

图 4 人(上图)与鼠(下图)血红蛋白基因在染色体上的位置

  二、让专业资源在疑难解析中用起来

  (一)利用Weblab进行高考真题基因同源性相关问题讲解

  Weblab是北京大学生物信息中心开发的整合了多种实用工具的生物信息学功能平台[6]。Weblab提供的生物信息学工具易于操作、可视化强,在高中生物教学中具有广泛应用潜力。举一个例子,北京市2013年高考31题(4)问如下:“为证实其他哺乳动物的蛋白C也有相似作用,可行的做法是从该种动物的基因文库中获得蛋白C基因序列,然后以去除蛋白C基因的小鼠作为受体,导入该基因序列,检测发育出的小鼠相关指标的恢复程度。”在教师讲解该题过程中,学生提出疑问:“哺乳动物种类繁多,形态千差万别,其他哺乳动物和小鼠为什么都有蛋白C且功能仍类似?”为解答该问题,笔者带领学生利用网络资源下载人和小鼠血红蛋白的α亚基序列,进入Weblab网站后,运用Needleman-Wunsch算法做两条序列的全局比对,结果如图5所示。

图 5 小鼠与人血红蛋白 α 亚基序列比对(界面截图)

  由图5可知,人和小鼠不仅都具有血红蛋白基因,而且二者血红蛋白α亚基相同氨基酸比例达85.9%,蛋白序列相似度达92.3%。此时教师可组织学生讨论,做序列比。蛋白质序列经比对后,若两个氨基酸残基间具有相似的理化性质(如侧链基团大小、电荷性、亲疏水性等),则称它们为相似氨基酸。即使两条蛋白质序列的氨基酸不完全匹配,我们也可以依据相似氨基酸的概念(定义)认为它们的结构与功能有很高的相似度,而不是单纯地考虑氨基酸绝对相同的匹配。由此,利用Weblab数据库,教师可帮助学生理解不同物种基因同源性,从而逐渐接近生物学科核心素养中对于理性思维和科学探究能力的高要求。

  (二)利用FlyBase数据库解析基因可变剪接相关问题

  FlyBase是一个提供果蝇遗传学与分子生物信息的综合数据库[7],在教学中具有多方面用途。比如学生在做模拟题时,遇到如下表述:“真核生物界蛋白质的种类远远多于基因的种类,人们认为原因之一是基因的转录产物会在体内进行可变剪接,造成不同外显子的组合。”由于基因的可变剪接问题较为抽象,属于扩展内容,学生对此较为困惑。为此,笔者带领学生登录并访问FlyBase数据库,输入学生熟悉或感兴趣的基因名称,如血红蛋白基因glob1或控制果蝇眼睛发育的基因ey,结果如图6所示。可见,对于真核生物的绝大多数基因,同一段DNA会转录出不同的转录本,如glob1基因具有glob1-RA至glob1-RF 6个不同的转录本,ey基因具有4个不同的转录本。学生通过亲自利用FlyBase数据库直观感受真核生物基因选择性剪接的概率,可较好理解真核生物基因进化出内含子的原因,以及真核生物利用少量基因能够表达出大量具有不同功能蛋白质的高效性特点。

图 6 果蝇 glob1 基因(上)与 ey 基因(下)的可变剪接

  三、让生物信息学实验在探究交流中活起来

  生物学科的本质是实验科学。实验探究教学是促使学生形成生物学核心素养的必要手段。因此,将兼具有科学性和趣味性的基于生物信息学的高端实验引入高中生物教学,可令学生切实感受交叉学科思想在当今生物学研究中的重要地位,并使其洞悉生物学科本质。跳跃基因Alu的扩增与鉴定大实验最初由美国冷泉港实验室开发[8],后被北京大学附属中学引进。笔者将该实验在北京市十一学校加以实践与改良。该实验原理为,Alu基因属于跳跃基因,可通过转座随机插入基因组。它是高等动物特有的短重复序列。Alu基因跳跃频率很低,我们可根据Alu基因的频率,判断不同人种间亲缘关系的远近[9]。根据此原理,在实践过程中,学生先从自己的口腔上皮细胞中提取DNA,并以该DNA为模板通过聚合酶链式反应(PCR)将Alu基因扩增出来,之后可通过琼脂糖凝胶电泳鉴定出每个学生的Alu基因型。

  在汇总全年级学生Alu基因型数据后,教师指导学生将其各自的基因型数据上传至国际Alu基因型数据库BioServer。北京市十一学校学生数据被存储于yinqiaoshengwu文件目录下。BioServers数据库存储了世界上不同国家人种的Alu基因型统计数据。学生可在该数据库中自行操作,将北京市十一学校的Alu基因频率数据与世界上不同人种的数据进行对比,从而计算得到不同人种之间的遗传漂变及遗传距离等数值。比如学生可将本校Alu基因频率数据与法国人的做对比,计算得到自己与法国人之间的遗传距离。通过基于生物信息学的高端实验开发,学生可像科研人员一样结合网络资源进行实验探究,这是落实生物学科素养中对学生科学探究能力的培养的有效办法。

  此外,通过生物信息学教学可有效促进学生对知识的再生成。为调动学生运用信息资源进行自主学习的积极性,在日常教学中,教师可辅助并引导学生利用网络资源如NCBI、中国知网等,让他们自行查阅感兴趣的科技文献,之后教师组织学生围绕该科技文献进行讨论,启发他们对后续工作展开设想,以达到训练学生思维,形成生物学科核心素养的目的。

  为实践该想法,笔者在日常教学中开发了学生演讲模块。学生自主决定演讲内容,针对自己感兴趣的生物学问题,利用关键词在NCBI、中国知网等数据库进行搜索并查阅文献。之后,结合文献中数据进行实验结果分析并在班级内分享交流。

  学生在演讲环节中的表现超出预期:部分学生很好地掌握了关键词搜索技巧,从国际顶级专业期刊下载文献后,针对文中数据进行了解读与分析;部分学生针对自己感兴趣的问题,如DNA如何在不同物种中迁徙,利用网上各大数据库及网站,搜集了大量材料与文献进行了该问题的相关论证。实践证明,该环节的实施极大激发了学生的学习热情。通过学生与学生、学生与教师的相互促进,学生利用信息技术进行生物学习的能力得到较大提升。

  总之,在高度信息化的今天,生物学与其他多种学科进行交叉已成为生命科学未来发展的必然趋势。为此,笔者对基于生物信息学的大量网络数据库资源做了筛选,并将其融入日常理论与实验教学,同时开发了基于生物信息技术的可充分激发学生学习主动性的评价体系,以期学生在形成生物学科核心素养的同时,理解和体悟生物学科的本质,进而在今后漫长的学习和生活中,逐步具备并不断提升基于困惑与好奇而理解世界的感知力以及利用信息技术获得生物学相关知识的学习力。

  参考文献:

  [1]陈润生.生物信息学[J].生物物理学报,1999,15(1):5-12.

  [2]Luo J.Teaching the ABCs of bioinformatics:a brief introduction to the Applied Bioinformatics Course[J].

Briefings in Bioinformatics,2014,15(6):1004.

  [3]Sussman J L,Lin D,Jiang J,et al.Protein Data Bank(PDB):Database of Three-Dimensional Structural Information of Biological Macromolecules[J].Acta Crystallographica,2010,54(6-1):1078-1084.

  [4]Spandidos A,Wang X,Wang H,et al.PrimerBank:a resource of human and mouse PCR primer pairs for gene expression detection and quantification[J].Nucleic Acids Research,2010,38:792.

  [5]Wolfsberg T G.Using the NCBI map viewer to browse genomic sequence data[J].Curr Protoc Bioinformatics,2010,Chapter 1(Chapter 18):Unit 1.5.1.

  [6]Liu X,Wu J,Wan J,et al.WebLab:a data-centric,knowledgesharing bioinformatic platform[J]. Nucleic Acids Research,2009,37:33.

  [7]Consortium F B.The FlyBase database of the Drosophila genome projects  andcommunity literature[J].Nucleic Acids Research,2003,31(1):172.

  [8]Dolan DNA Learning Center.Using an Alu Insertion Polymorphism to Study Human Populations[R].Cold Spring Harbor Laboratory,2006.

  [9]Perna N T,Batzer M A,Deininger P L,et al.Alu insertion polymorphism:a new type of marker for human population studies[J].Human Biology,1992,64(5):641.

  (作者系北京市十一学校教师,博士)

  责任编辑:祝元志

欢迎投稿
投稿平台

https://bkstg.pep.com.cn

联系信箱

mouyn@pep.com.cn

sunjh@pep.com.cn

zhuyz@pep.com.cn

欢迎加入QQ群
与编辑互动
合作伙伴