擅长:python、mysql、java
<p>只要制表符仅用作文件中的分隔符,您就可以执行以下操作:</p>
<pre><code>import re
# connect to MySQLdb
with open(file_name) as f:
for line in f:
id, title, genre = re.split(r'\t+', line)
# execute INSERT statement
</code></pre>
<p>其思想是始终有两组选项卡,一组在ID和title之间,另一组在title和genre之间。通过在<code>\t+</code>(一个或多个选项卡)上使用<code>re.split()</code>,您将得到一个长度为3的列表,其中包含您感兴趣的字段。在</p>
<p>如果文件中有任何行与此格式不匹配,则应在元组解包之前添加一些额外的检查,可能是<code>data = re.split(r'\t+', line)</code>和{<cd4>}行的内容。在</p>
<p><strong>编辑:</strong>此解决方案假设您没有空白字段,因此,如果一行只有一个ID和一个流派但没有标题是合法的,那么这将不起作用。如果你可以有一个标题,但没有ID或genre,只要在ID丢失时有前导标签,而在genre缺失时有尾随标签,它仍然可以工作。在</p>