Science and TechnOlOgy Innovation Herald Q Q: § T技术 D N A计算方法与应用 叶子’ 孙飞一 (1.中国矿业大学(北京)机电与信息学院 北京 1 00083;2.江西农业大学生物工程学院 江西南昌 330045) 摘要:简要介8gDNA计算产生的历史背景,结合囤论例子(邮递员路线图)叙述DNA计算的基本概念与计算模型等方面内容。 关键词:DNA计算 邮递员问题D N A算法设计DNA计算机 中图分类号:TN91 8 文献标识码:A 文章编号:1 674--098X(201 o)o2(c)一0037--01 1 DNA计算产生的背景 步骤3:解决的方案,例如找出那些经 (2)选择操作表示计算内容模式,如粘 1946年,世界上第一台数字电子计算 过图G的所有边至少一次的闭途径,也就是 贴与剪切方式不同,对于序列切割与分离 机ENIAC在美国的宾夕法尼亚大学诞生。 说,保留G的所有广义Euler闭迹。 的酶的选择不同[21。 从此,电子计算机经历了从电子管(1946— 步骤4:求解答案,例如找出最短的广 (3)结果识别与分离,分子信标,荧光 1956)、晶体管(1957—1964)、集成电路(1965 l970)到超大规模集成电路(197l 至今) 四个发足 段。但是,量子理论已经揭示出 计算机芯片制造的物理极限尺寸一0.08微 米。然而,1994年在美国加利福尼亚大学的 Adleman博士利用DNA分子序列计算NP完 全问题方法带给发展新型计算机的曙光…, 美国、加拿大、英国、波兰、德国、以色列等 国家的著名研究机构和大学都相继开展了 这一领域的研究工作,我国在此方面的研 究工作也已经展开,主要研究基地之一,华 中科技大学许进教授领导的DNA计算和分 子计算机研究所。进行DNA计算系统的探 索和研究,基于DNA芯片的DNA计算研究 探索和分子生物计算中的膜计算研究。此 外,国内还有东华大学和其他一些研究人 员从事这方面的研究,但是大部分的结果 都是综述性的。 2 DNA计算的生物学基础 DNA计算的本质是对其分子序列的各 种操作完成问题的编码描述与算法设计和 实际生物技术模型来完成。因此每一个问 题解决,都是小小DNA计算机模型的一次 运行 一1。具体生物操作包括下列几方面: DNA分子序列双链分离与结合复性, 经设定温度加热与冷却完成,通常在聚合 酶链式反应(PCR)检测中进行。 DNA序列链的切割与连接;分别由于 内、外切酶与连接酶完成。 DNA序列长度与序列组成测量;聚合 酶序列延长与Sanger末端终止方法测序及 凝胶电泳技术确定序列长短。 DNA序列复制与重组标志,由PcR完 成及荧光探针标志等。 3基本数学计算 为了便于利用DNA计算,首先将求解 问题的数学计算进行算法分解,计算过程 逐步可求,以便D N A算法设计[61。求解G问 题的算法设计如下的(例如邮递员路线图): 步骤1:问题条件的描述,搜索出所有 关于G所有组合途径。 步骤2:找出符合问题条件的那些组合 途径;例如开始是G,结束也是G的固定顶点 的闭途径,也就是说,保留那些经过G的固 定顶点的途径。 义Euler闭迹(即所有广义Euler闭迹中权和 探针序列的选择 。 最小者),这就是我们所需要的解。 (4)结果解或者答案的提取技术组件。 步骤5:确定解出例如邮递员路线。 其中PCR与凝胶电泳技术是必要的手段。 4 DNA算法设计 6前景 D N A算法设计在于将问题编码为 国际上,DNA计算机的研究持续的“热 DNA分子序列链,而将问题解以另一条链 点”_8】。例 ̄112001年l1月,以色列的Weizmann 编码;利 研究所的Shapiro研制出由DNA分子和酶分 用DNA分子序列双链互补,通过对 子构成的生物计算机,它实质上是一种半 DNA序列双链的生物操作完成数学计算过 自动化的可编程的有穷自动机。2002年2 程。 月,Suyama等研制出一台用于基因表达分 下面简单介绍一下上述步骤的D N A 析的DNA计算机。同样在其他方面有广泛 算法 。 应用。未来主要在三方向发展与突破。一是 步骤1:对给定图G的顶点和边进行编 DNA计算的通用语言设计,能够提供方法 码,将编码好的顶点所对应的D N A片段 性_4, 】;二所谓软计算,结合其他计算模型方 和边所对应的D N A片段混合在一起,加 法,例如与神经网络模型的结合。三与分子 入缓冲液经D N A连接酶的连接反应,生 生物学发展密切结合,解决自身实际能力 成图G的所有闭途径。 问题 1,例如D N A算法的实际准确性与 步骤2:在第一步连接反应后的产物中 误差的限制,以及对生物学的反馈应用。 加入底物D N A分子、适量的引物、DNA聚 合酶及缓冲液进行PCR扩增,使那些以固 参考文献 定点开始和结束的DNA链呈指数增而保 【1】Adleman L.Molecular Computation of 留。 Solution t6 Combinatorial problems. 步骤3:将第2步的产物进行纯化与分 Science.1994,66(1 1):1021—1024. 离。在分离的过程中我们先以表示边权的 [2]许进,王淑栋,潘强林(译).DNA计算 D N A片段的补链为模板构造探针,再用 [M】,北京:清华大学出版社. 构造的探针对纯化后的产物进行分离,凡 [3】殷志祥.图与组合优化中的DNA计算. 与该探针杂交的DNA链中一定含有该D N 科学出版社,2004. A片段,再将之加热解链分离后保留了目 [4】王翼飞.计算分子生物学[M】.北京:化 标DNA链即包含图G的所有边,也就是说 学工业出版社,2004. 我们找到了图G的所有广义Euler闭迹。 [5]孟大志,曹海萍.DNA计算与生物数学. 步骤4:对第3步的产物进行琼脂糖浆 生物物理学报,2002,1 8(2):l63—174. 凝胶电泳,跑在最前段的就是最短的DNA [6李源,方辰,欧阳颀.最大集团问题的 6】链。 DNA计算机进化算法.科学通报,2004, 步骤5:将上述步骤的产物进行测序, 49(5):439-443. 找到中国邮递员问题的结果解。 【7】张永有,程金平,朱艳冰.分子信标及其 应用研究进展,生命的化学,2002,2 5 DNA算法的生物模型 【8]Suyama A.et a1.DNA Chips— 任何算法设计最终是依靠生物分子操 Intergrated Chemical Circuits for DNA 作的执行并由实际的生物技术与方法完 Diagnosis and DNA computers.Proc. 成。不同的 3rd International Micromachine Symp, 操作技术与方法决定其计算的体系模 1997:7—12. 型的不同。因此根据问题选择需要的构造 体系是关键。一般生物模型由下列分子计 算组件构成: (1)描述方式与结构,选择双链或者三 链DNA分子序列; 科技创新导报Science and Technology Innovation Herald 37