解读生命的密码—DNA

DNA:脱氧核糖核酸(英语:DeoxyriboNucleicAcid,缩写为DNA)由含氮的碱基+脱氧核糖+磷酸组成。因为脱氧核糖核糖和磷酸都一样,但碱基可以分为四种(腺嘌呤A,鸟嘌呤G,胸腺嘧啶T,胞嘧啶C),所以脱氧核糖核苷酸就可以分为四种(按照碱基的不同区分),同时在书写过程中可以用碱基的简写(AGTC)代替。

人类DNA序列片段

简单来说,DNA就是由A、T、G、C四种碱基无规则排序组成的一长串序列编码,是大多数生物的遗传信息的载体。DNA编码上的信息可以组成遗传指令,用来引导生物发育与生命机能运作。

DNA双螺旋结构

影视剧中经常出现被我们大家熟知的亲子鉴定,就是利用到了DNA。生物学、遗传学上使用DNA做亲子鉴定时,否定亲子关系的准确率几近100%,肯定亲子关系的准确率可达到99.99%。

在我们开发的应用程序中,通过对某禽流感病毒DNA碱基序列片段的比对,找到同源性比较高的DNA序列片段,这些序列代表的是与原序列相近的病毒,或者说与原序列代表的病毒属于“近亲”。

DNA比对结果

再对列表内的序列进行同源性比较,就能看到所选择的序列两两之间的同源性为多少,用以判断两种病毒的“亲缘”关系,如下图:

DNA比对矩阵

由这些DNA序列构建而成的进化树更能说明序列所代表的病毒的“亲缘”关系,如下图。图中,进化树中的橙色字体代表查询序列的序列号,蓝色字体代表比对序列的序列号。其中,在一个外群的分支“亲缘”关系更为紧密,而同一外群中,一个节点下的两个病毒的DNA序列支长越短,“亲缘”关系越近,反之,“亲缘”关系越远。而对于支长,我们可以通过标尺来观测其长短。

进化树

而DNA又是如何成为蛋白质的呢?

DNA不是直接就变成了蛋白质,而是通过一系列过程,最终转化为蛋白质。

首先是DNA的转录:DNA在细胞核内,根据碱基互补配对原则,和基因的选择性表达等,转录出mRNA(信使RNA),信使RNA上携带的就是特定的DNA序列,叫做密码子,密码子对应不同的氨基酸。

其次是mRNA的翻译:mRNA通过核孔来到细胞质中的核糖体上,根据密码子的不同,tRNA(转运RNA)上有反密码子和携带的特定氨基酸。根据碱基互补配对的方式,tRNA和mRNA结合,那么就会有不同的氨基酸,通过脱水缩合的方式形成肽键,多个氨基酸通过肽链结合形成肽链。

最后肽链:多个肽链通过高尔基体,内质网等加工,在空间上通过折叠,反转,螺旋等方式形成空间结构,从而形成具有生物活性的蛋白质。

DNA—RNA—蛋白质

总结下来就是:DNA序列是遗传信息的贮存者,它通过自主复制得到永存,并通过转录生成mRNA,再翻译生成蛋白质的过程。该过程完全自主完成,且该过程控制所有生命现象。通俗点讲就是我干自己的活,谁也管不了我,但我能弄你。伟不伟大先不说,牛X不牛X就完了!

不由感叹:敬畏宇宙,敬畏自然!

工作中,我们通常操作的只是类似ATGC这样的DNA碱基的序列编码,通过对DNA碱基序列的转录、翻译,最终成为的氨基酸序列就可以了。在我们应用程序里更是直接利用密码子表将DNA序列转换为氨基酸序列:

DNA序列翻译为氨基酸序列

上图就是在一长串DNA原始序列找到开放阅读框,将该阅读框内的DNA序列翻译为氨基酸序列的操作。通过程序计算,该原始序列内共找到13条开放阅读框序列。也就是说,我们可以将该原始序列翻译成13条氨基酸序列。

提到开放阅读框,就不得不提密码子,它就像摩斯电码一样,不同的点横组合,可以翻译为不同的代码。

摩斯电码表

所谓密码子,就是三个连续DNA碱基为一组,这一组碱基序列就可以翻译为一个氨基酸编码,而所有的三个连续DNA碱基的排列组合构成了密码子表。有了密码子表(下图),我们就能更便捷的将DNA翻译为氨基酸。但密码子表中有两个特殊存在:起始密码子ATG和终止密码子TAA/TAG/TGA,它们是定义一段DNA序列是否能翻译为氨基酸序列的标准。

DNA-氨基酸密码子表

氨基酸中文对照表

在正向DNA序列中,从第一个起始密码子开始到最后任意一个终止密码子结束,且中间碱基数量是3的倍数的DNA序列,才是正常的可翻译氨基酸的DNA序列,也被称为开放阅读框;否则称为残缺序列。残缺序列是无法被翻译为氨基酸序列的。需要提到的一点就是,当我们翻译时,默认将终止密码子翻译为星号(*)。

到这里,我们就已经成功将DNA翻译成了氨基酸。而氨基酸最终会构成蛋白质。至于蛋白质的功效,就不必多讲了。生活中各种高蛋白之类的产品宣传估计已经将蛋白的功效普及的差不多了。

那么问题来了,给你一串人类DNA序列片段:ATGGCACATGCAGCGCAATAG,你能将其翻译成氨基酸序列嘛?

中科北纬软件研发团队,长期从事林草病虫害监测预报防治、野生动物保护和疫源疫病监测预警等方面业务梳理和软件开发工作,以网络和信息化助力您的基因探索之路。

THE END
1.三个终止密码子TAA,TAG,TGA那个终止作用强?有没有真核原核偏好...三个终止密码子TAA, TAG, TGA 那个终止作用强?有没有真核原核偏好性?https://muchong.com/t-8806985-1-authorid-1177520
2.起始密码子和终止密码子的问题课本上说:起始密码子为AUG(甲硫氨酸...课本上说:起始密码子为AUG(甲硫氨酸) GUG(缬氨酸),终止密码子为UAA、UAG、UGA可有的人说是:起始:ATG,终止:TGA,TAA,TAG好像是不同的情况不同?还是有其他的说法,求详解 扫码下载作业帮搜索答疑一搜即得 答案解析 查看更多优质解析 解答一 举报 只含U的密码子对应的是RNA上的三联密码子,但是人们往往不是讨论...https://www.zybang.com/question/cd82872417f17290c0805f7e8bc5905e.html
3.噬菌体展示文库中的终止密码子因此Marcus等人将琥珀终止密码子突变为谷氨酰胺密码子(CAG),Barderas等人将琥珀终止密码子突变成赭石终止密码子(TAA),使其仅表达可溶性的目标抗体而不表达噬菌体的衣壳蛋白pIII,这提供了一个解决方案。目前Perween等人已将TAA突变应用于SARS CoV 2,成功产生了抗SARS CoV 2 RBD的人源重组scfv抗体。 https://www.jianshu.com/p/d6011025dfcc
4.优化基因表达的关键因素之:基因的重新设计和合成[心得点评]绝大多数生物都有偏爱的围绕终止密码子的序列框架[7]。酵母和哺乳动物偏爱的终止密码子分别是UAA和UGA。单子叶植物最常利用UGA,而昆虫和大肠杆菌倾向于用UAA。翻译终止效率可能受紧接着终止密码子的下游碱基和紧靠终止密码子的上游序列影响。在酵母中通过改变围绕终止密码子的局部序列框架,翻译终止效率可能被减低几个...https://www.ebiotrade.com/newsf/2002-7/B20027816518.htm
1.以下哪些是终止密码子?判断行政执法机关在查办案件过程中,对符合刑事追诉标准、涉嫌犯罪的案件,应当制作《涉嫌犯罪案件移送书》,及时将案件向同级公安机关移送,并抄送同级人民检察院。对未能及时移送并已作出行政处罚的涉嫌犯罪案件,行政执法机关应当于五日以内作出行政处罚向同级公安机关、人民检察院抄送《行政处罚决定书》副本,并书面告知相关...https://www.shuashuati.com/ti/d60b1becc9ac4865b3ab8563a5ab5c70.html?fm=bd41984561df2dfc9a410dce2423566659
2.原创原核表达的奇怪现象关于终止密码子的效率我用的载体是PET32a,BL21表达宿主。目的片段5KD左右,后面设计了TGATGA两个终止密码子,但是事实证明,这两个密码子都被通读了,蛋白翻译在载体的终止子上结束。我查过大肠杆菌偏爱性方面的资料https://3g.dxy.cn/bbs/topic/11332356
3.含有多段rna的.fasta文件读取,并打印最长的阅读框阅读框指基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白,包含起始密码子(ATG)和终止密码子(TAA,TAG或TGA),如ATGAAATAG 是长度为9的一个阅读框。 如序列ATGTATGTTTAGTTATGTTTAG的三个可能的正向阅读框是: ATG TAT GTT TAG TTA TGT TTA G [1] ...https://blog.csdn.net/weixin_46169777/article/details/127957598
4.中国常见溞属动物线粒体基因组的测定与序列分析在终止密码子使用方面,这两种溞的ND2、ATPase8、ATPase6、COⅢ、ND3、ND4L、ND6、Cytb和ND1基因均使用TAG或者TAA作为终止密码子;其余的四个蛋白质编码基因(COⅠ、COⅡ、ND5和ND4)均使用不完整的终止密码子T。(5)分别预测了大型溞和蚤状溞的22个t RNA基因二级结构,除t RNASer(GCU)缺失二氢尿嘧啶臂(DHU臂)...https://wap.cnki.net/lunwen-1016118023.html
5.编辑基因组:重写生命密码的新工具研究小组利用的是一个称为多元自动基因组工程平台(或MAGE平台),用另外一种终止密码子——TAA终止密码子替代活体大肠杆菌中TAG密码子(研究小组于2009年首次披露MAGE运作过程。因其具备在活体细胞中加速目标遗传变化而获得“进化机”称号) Isaacs 解释说,MAGE过程是一个小规模的工程过程,TAA密码子替代一部分(不是全部)...https://pro.biomart.cn/lab-web/news/article/31m2154go4dtg.html
6.拟密码子适应指数方法的设计及应用组合成 64 个密码子, 其中 tag,tga 和 taa 为终止密码子, 剩余 61 个密 码子编码 20 种氨基酸.而朱平等[6]运用代数知识 提出的拟氨基酸编码法中, 将 taa,tag,tac 和 tat 标记为终止子, 所有 64 个密码子编码成 16 种氨 基酸.值得注意的是, 氨基酸编码法和拟氨基酸 编码法都采用 atg 为起始密码子...http://smkx.hunnu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2132
7.从文件中删除终止密码子并将其替换为NNNperlNNN 替换终止密码子。 我的输入序列如下: >header ATGGACCAGCAGCAGCAGCAGCAGTAA 我期待着类似的事情: >header ATGGACCAGCAGCAGCAGCAGCAGNNN 它也没有处理文件中的最后一个序列,我得到的输出为: >header ATG GAC CAG CAG CAG CAG CAG CAG TAA 除了第一个序列的标头和最后一个标头的序列丢失。perl...https://www.soinside.com/question/UEfTvPwhYSEdiZnqDkNgU5