擅长:python、mysql、java
<p>假设您所做的实际上是解析/格式化csv文件,那么韦恩·沃纳的<code>csv</code>模块方法可能是解决这个问题最有效的方法。你知道吗</p>
<p>或者,您可以考虑使用re模块中的<code>re.sub</code>。要使用的确切正则表达式将取决于数据。例如,如果该列始终是3个核苷酸,<code>-</code>和3个核苷酸,则类似的操作可能有效:</p>
<pre><code>re.sub(r'(?<=[ACTG]{3})-(?=[ACTG]{3})', '\t', line))
</code></pre>
<p>regex使用lookbehind和lookahead来替换两组3个核苷酸之间的<code>-</code>,因此假设这种模式不会出现在文件的其他地方,应该可以很好地工作。你知道吗</p>
<p>编辑:由于某种原因更改为<code>re.sub</code>,原来的代码让我陷入了<code>split</code>的思维模式!你知道吗</p>