引芳樽 的个人资料redmoonhongyueliang照片日志列表 工具 帮助

日志


3月21日

M15菌株

  M15菌株里含有一种低拷贝的辅助质粒pREP4。它constitutively表达lac阻遏蛋白,抑制T5强启动子的泄露表达。同时,pREP4还赋予宿主菌株卡那霉素抗性。pREP4是从pACYC改造而来的,含有p15A复制子。它能够与所有带ColE1复制起点的质粒共存
3月6日

启动子分析

启动子是DNA分子可以与RNA聚合酶特异结合的部位,也就是使转录开始的部位。在基因表达的调控中,转录的起始是个关键。常常某个基因是否应当表达决定于在特定的启动子起始过程。
启动子一般可分为两类:  
 
(1)一类是RNA聚合酶可以直接识别的启动子。这类启动子应当总是能被转录。但实际上也不都如此,外来蛋白质可对其有影响,即该蛋白质可直接阻断启动子,也可间接作用于邻近的DNA结构,使聚合酶不能和启动子结合。
 
(2)另一类启动子在和聚合酶结和时需要有蛋白质辅助因子的存在。这种蛋白质因子能够识别与该启动子顺序相邻或甚至重叠的DNA顺序。  因此,RNA聚合酶能否与启动子相互作用是起始转录的关键问题,似乎是蛋白质分子如何能识别DNA链上特异序列。例如,RNA聚合酶分子上是否有一个活性中心能够识别出DNA双螺旋上某特异序列的化学结构?不同启动子对RNA聚合酶的亲和力各不同。这就可能对调控转录起始的频率,亦即对基因表达的程度有重要不同。DNA链上从启动子直到终止子为止的长度称为一个转录单位。一个转录单位可以包括一个基因,也可以包括几个基因。
启动子预测软件大体分为三类,第一类是启发式的方法,它利用模型描述几种转录因子结合部位定向及其侧翼结构特点,它具有挺高的特异性,但未提供通用的启动子预测方法;第二类是根据启动子与转录因子结合的特性,从转录因子结合部位的密度推测出启动子区域,这方法存在较高的假阳性;另一类是根据启动子区自身的特征来进行测定,这种方法的准确性比较高。同时,还可以结合是否存在CpG岛,而对启动子预测的准确性做出辅助性的推测。
 

启动子预测软件有:PromoterScan ;

 Promoter 2.0 ;

NNPP ;

EMBOSS Cpgplot ;

CpG Prediction

 
3月5日

进化树

进化树也称种系树,英文名叫“Phyligenetic tree”。

对于一个完整的进化树分析需要以下几个步骤:

⑴ 要对所分析的多序列目标进行排列(To align sequences)。做ALIGNMENT的软件很多,最经常使用的有CLUSTALX和CLUSTALW,前者是在WINDOW下的而后者是在DOS下的。

⑵ 要构建一个进化树(To reconstrut phyligenetic tree)。构建进化树的算法主要分为两类:独立元素法(discrete character methods)和距离依靠法(distance methods)。所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。

⑶ 对进化树进行评估。主要采用Bootstraping法。进化树的构建是一个统计学问题。我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。模拟的进化树需要一种数学方法来对其进行评估。不同的算法有不同的适用目标。

一般来说,最大简约性法适用于符合以下条件的多序列:i 所要比较的序列的碱基差别小,ii 对于序列上的每一个碱基有近似相等的变异率,iii 没有过多的颠换/转换的倾向,iv 所检验的序列的碱基数目较多(大于几千个碱基);

用最大可能性法分析序列则不需以上的诸多条件,但是此种方法计算极其耗时。如果分析的序列较多,有可能要花上几天的时间才能计算完毕。UPGMAM(Unweighted pair group method with arithmetic mean)假设在进化过程中所有核苷酸/氨基酸都有相同的变异率,也就是存在着一个分子钟。这种算法得到的进化树相对来说不是很准确,现在已经很少使用。

 

邻位相连法是一个经常被使用的算法,它构建的进化树相对准确,而且计算快捷。其缺点是序列上的所有位点都被同等对待,而且,所分析的序列的进化距离不能太大。另外,需要特别指出的是对于一些特定多序列对象来说可能没有任何一个现存算法非常适合它。最好是我们来发展一个更好的算法来解决它。但无疑这是非常难的。我想如果有人能建立这样一个算法的话,那他(她)完全可以在Proc.Natl.Acad.Sci.USA.上发一篇高质量的文章。