MapGene2Chrom 基于Perl和SVG语言绘制基因物理图谱
晁江涛,孔英珍,王倩,孙玉合,龚达平,吕婧,刘贯山
【摘 要】摘要:遗传图谱表现形式简洁明了,为分析遗传规律、克隆基因提供了便利。Gbrowse、MapViewer等工具虽然能够协助研究人员绘制相似形式的物理图谱,但有很大的局限性:(1)数据需提前布置好;(2)输出结果无法灵活修改。鉴于此,文章基于Perl和SVG语言,开发了一款生物辅助作图软件MapGene2Chrom的本地版与网页版,该软件能够依据输入数据快速绘制相应的物理图谱。该软件输入数据格式简单,输出结果易于修改,图片格式为SVG矢量图,具有很好的移植性,以期为研究人员绘制物理图谱提供便利。
【期刊名称】遗传
【年(卷),期】2015(000)001
【总页数】7
【关键词】物理图谱;基因分布图;SVG矢量图;作图;生物软件
依据分子标记之间的遗传距离绘制一张简洁、美观、大方的遗传图谱,为研究人员分析某一性状的遗传规律及图位克隆基因提供了便利。目前能够绘制遗传图谱的软件有 4种:MAPMAKER[1],JoinMap[2~4],Mapplotter[5]和MapDraw[6]。前两种软件均具备计算遗传距离和绘制连锁图谱的功能,其中MAPMAKER侧重于Mac OS平台;JoinMap更侧重于Windows平台。后两种软件具备输出遗传图谱的功能,是
MAPMAKER在Windows平台图形化功能的补充。
当研究人员绘制一张物理图谱时,虽然可以借助于现有公共数据库,如 NCBI(www.ncbi.nlm.nih.
gov)
、
JGI(www.phytozome.net)
、
TAIR(www.arabidopsis.org)中的GBrowse[7]、MapViewer(www.ncbi.nlm.
nih.gov/mapview)等工具来实现,但这些工具存在较大的局限性:(1)数据需事先布置在这些工具中;(2)输出结果样式无法灵活定制。这大大了这些工具在绘制美观物理图谱方面的应用。鉴于此,本文基于Perl(Practical Extraction and Report Language)和SVG(Scalable Vector Graphics)矢量图语言,开发了一款生物辅助软件 MapGene2Chrom的本地版及网页版。输入指定格式的数据,并做简单的参数设置,即可快速绘制一张简洁、美观、大方的基因物理图谱,如果输出效果不够美观,只需修改参数重新运行软件即可。网页版软件访问地址:http://www. tobaccomdb.com/tools/index_mapGene2Chrom.html,源码可从该网页下载,或直接与作者联系索取。
1 MapGene2Chrom的原理与特点
MapGene2Chrom基于Perl和SVG语言,根据染色体上基因的相对物理距离,可快速画出不同染色体上基因的分布矢量图。基因的位置信息通过常用的记事本、写字板或Microsoft Excel办公软件进行简单处理即可作为输入文件;之后,运行软件,用户将得到一张基因分布SVG矢量图,该文件可通过谷歌 chrome、FireFox、IE9+或者其他支持 SVG的浏览器查看。由于用 MapGene2Chrom软件画图时,采用直接输出SVG标记语句,所以用户只要有Perl语言基本环境即可使用。下文将分别介绍本地版与网页版软件的使用方法。
2 MapGene2Chrom本地版的使用方法
从 JGI(phytozome v9.0)数据库下载二穗短柄草(Brochypodium distachyon, Bdistachyon )的基因注释数据 (ftp://ftp.jgi-psf.org/pub/compgen/phytozome/v9.0/ Bdistachyon/),随机选取基因数据。以 Windows操作系统为例,分别从运行环境、数据准备、运行软件、相关参数等方面介绍其使用方法。
2.1 运行环境
第一步:打开DOS命令窗口。点击桌面左下角的“开始”—>“运行” 输入“cmd”即可打开DOS命令窗口。
第二步:在DOS命令窗口,输入命令“perl-v”,如果能看到Perl软件的版本号,表示电脑可以使用本软件。如果看到反馈信息为:不是内部或外部命令,也不是可运行的程序或批处理文件,则说明电脑需要安装Perl程序,下载页面为:http://www.perl.org/get.html。
2.2 数据准备
绘制染色体上的基因分布图,需要收集基因相关信息:(1)基因名称;(2)基因开始位置;(3)基因结束位置;(4)基因所在染色体名称;(5)基因所在染色体的长度。之后将(1)~(4)信息依次汇总至文本文件input_gene_info.txt中;将(4)、(5)信息汇总至文本input_chrom_info.txt中。
本文通过自编写的 Perl程序 randomSelect-Info.pl(其源码可软件包中找到)分别从
每条染色体中选取 60、80、100个基因数据样本,依次存入文本文件 60_bd_origin_gene_info.txt
、
80_bd_origin_
gene_info.txt
、
100_bd_origin_gene_info.txt中。
2.3 运行软件
如需了解软件用法,打开DOS窗口输入“perl mapGene2Chrom.pl”即可获得相关信息。其输入参数有:(1)-i 输入文件1:包含基因及染色体的信息;(2)-chrom 输入文件2:包含染色体名称及长度信息;(3)-o