启动子的重要性
启动子是RNA 聚合酶识别、结合和开始转录的一段DNA 序列,它含有RNA 聚合酶特异性结合和转录起始所需的保守序列,多数位于结构基因转录起始点的上游,启动子本身不被转录。但有一些启动子(如tRNA启动子)位于转录起始点的下游,这些DNA序列可以被转录。启动子的特性最初是通过能增加或降低基因转录速率的突变而鉴定的。启动子一般位于转录起始位点的上游。启动子位于结构基因5'端上游的DNA序列,能活化RNA聚合酶,使之与模板DNA准确的结合并具有转录起始的特异性。启动子本身并不控制基因活动,而是通过与称为转录(transcription)因子的这种蛋白质(proteins)结合而控制基因活动的。转录因子就像一面"旗子",指挥着酶(enzymes)(RNA聚合酶polymerases) 的活动。
启动子序列的提取
一般要进行启动子进化分析,都是在已知某一大类的基因是在CDS区比较保守 的,因此想查看在启动子区是否有同样的情况,因此首先需要对物种进行选取,以wrky家族为例,可以现在ensemble plant网站上进行预测,查看不同的物种之间的进化关系。
在搜索后,可以点击左边的基因树,查看基本的进化关系。
可以选取wrky基因进化比较近的物种进行启动子序列的提取。
在网页上点击每个node可以导出启动子序列,已知基因号和物种信息后,提取主要还是在ensembel网站上进行。
主要是在biomart上进行提取,先选择物种信息后,在filters里面gene选择自己要的几个基因,在attributes里选择sequence,然后点击sequence,选择flank(gene),点击upstrean 1000,然后点击count,查看result的结果,如果需要下载,点击go。
上面的这些提取内容在phytozome上也可以,也是在biomart下面进行一样的操作。
启动子motif分析
前面已经得到了多个物种的启动子序列,然后我们选用tbtools的fasta merge进行序列的合并,得到全部的fa文件。
进行motif分析,主要是选用MEME网站上的meme分析,我选用的是10个motif,然后在advance中将每个motif的序列最短设置为15个碱基。
做启动子motif分析的主要目的查看这些启动子的序列中是不是有些位点是与我们研究的某些特殊的信号转导的基因有关,为前面的实验结果进行佐证。
启动子顺式作用元件分析
对顺式作用元件分析的时候,主要选用的是plantcare网站,由于我这次做分析的时候没有关注这个问题,但是如果需要做的话,网页上有很多相关的教程,可以按照教程走,然后得到很多的顺式作用元件,后面就是根绝自己关注的重点,进行挑选。
启动子进化树构建
进化分析也是选用的常用的MEGA软件进行分析。
首先是进行碱基序列的比对,我选用的的muscle的模型进行比对,比对后截去5'端和3'端与其他序列差异较长的碱基,然后输出mega序列。
随后进行进化树的构建,先用模型进行最优搜索,然后进行ML进化树构建,一般是选用的500bootstrap。
得到后,输出netwrik文件,可以在figtree或者itol上进行美化。
总结
进行启动子进化分析的时候,一个重点是需要知道自己研究的这一类基因在进化上的保守性,因为后面的内容基本都是依托于同源性进行分析的,如果同源性太低,后面的结果也是不太准确的。基于以上的结果,还可以做一些基因的演化、物种内/间的共线性分析/WGD情况,这些主要是根据自己的研究内容往下挖,由于我们目前只关注这些,所以我只做了这一部分内容。