回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p><strong>跳转到编辑以获得更好的解释!</strong></p>
<p>我已经试着解决这个问题好几个小时了,我的头都痛了(特别是因为我之前已经解决了,但不记得是怎么解决的,我用我的解决方案的脚本存储在学校的一台计算机上)。在</p>
<p>好吧,这就是我的问题。在给定的a、T、G和C序列中(是的,这就是DNA),我必须找到所有的氨基酸并计算出它们有多少。通俗地说,归根结底就是这样。在</p>
<p>我必须搜索特定模式的序列(也称为密码子),这些是三个字母长的A和/或T和/或G和/或C。每个氨基酸至少有一个密码子与之相关。我的工作是计算每种氨基酸的出现量。在</p>
<p>在第二个<a href="http://en.wikipedia.org/wiki/DNA_codon_table" rel="nofollow">table</a>中,您将看到左侧的氨基酸和右侧的相关密码子。在</p>
<p>我有一本字典是这样设置的:</p>
<pre><code> aaDic = {'ttt': 'F', 'tct': 'S', 'tat': 'Y', 'tgt': 'C',
'ttc': 'F', 'tcc': 'S', 'tac': 'Y', 'tgc': 'C',
'tta': 'L', 'tca': 'S', 'taa': '*', 'tga': '*',
'ttg': 'L', 'tcg': 'S', 'tag': '*', 'tgg': 'W',
'ctt': 'L', 'cct': 'P', 'cat': 'H', 'cgt': 'R',
'ctc': 'L', 'ccc': 'P', 'cac': 'H', 'cgc': 'R',
'cta': 'L', 'cca': 'P', 'caa': 'Q', 'cga': 'R',
'ctg': 'L', 'ccg': 'P', 'cag': 'Q', 'cgg': 'R',
'att': 'I', 'act': 'T', 'aat': 'N', 'agt': 'S',
'atc': 'I', 'acc': 'T', 'aac': 'N', 'agc': 'S',
'ata': 'I', 'aca': 'T', 'aaa': 'K', 'aga': 'R',
'atg': 'M', 'acg': 'T', 'aag': 'K', 'agg': 'R',
'gtt': 'V', 'gct': 'A', 'gat': 'D', 'ggt': 'G',
'gtc': 'V', 'gcc': 'A', 'gac': 'D', 'ggc': 'G',
'gta': 'V', 'gca': 'A', 'gaa': 'E', 'gga': 'G',
'gtg': 'V', 'gcg': 'A', 'gag': 'E', 'ggg': 'G'
}
</code></pre>
<p>我当然可以计算出每个密码子出现的数量,但由于每个氨基酸都有不止一个密码子,所以我真的需要特定密码子的总和。在</p>
^{pr2}$
<p>(s是上述代码中a、t、c、g的序列)。例如:</p>
<p>tta、ttg、ctt、ctc、cta、ctg都与氨基酸“L”有关,所以我需要将所有出现的tta、ttg、ctt、ctc、cta、ctg相加,得到氨基酸“L”出现的总量。在</p>
<p>我希望我足够清楚,这有点难以解释,尤其是在你自己尝试了这么久却失败之后(这通常意味着你对自己在做什么几乎一无所知,至少我就是这样:D)</p>
<p><strong>编辑:</strong></p>
<p>让我试着让自己更清楚一点:</p>
<p/><ol>
<li>我们得到了一个由字母a、T、C和G组成的序列</li>
<li>我们必须把这个序列三个一个地解析。
<blockquote>
<p>suppose the sequence is "TTCTTACTC"
we get "TTC", "TTA", "CTC"</p></blockquote></li>
<li>我们现在在字典中查找这些键,然后找到相关的氨基酸:
TTC是F
TTA是我
CTC是L</li>
<li>我们需要计算并在一个列表中存储F、L和字典中的任何其他值(flimvspy*HQNKDECWRSG)。在</li>
</ol>
期望的输出是这样的字典:
<pre><code>{L:total no. of the amino acid 'L' in the sequence, S:total no. of the amino acid 'S' in the sequence, ...}
</code></pre>