我的TeX中的分隔符是什么?

2024-04-25 09:47:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个很长很乱的文件,我的朋友告诉我他用制表符分隔了那个文件。。 但当我这么做的时候:

  tokens = line.split("\t")

它不会分裂。。。你知道吗

但我不知道也许我错过了什么。。我的朋友似乎很确定文件是用制表符分隔的。看起来它的制表符也是分隔的

示例文件 你知道吗

10      AccessibleComputing     0       381202555       2010-08-26T22:38:36Z    OlEnglish       7181920 #F3#    [[Help:Reverting|Reverted]] edits by [[Special:Contributions/76.28.186.133|76.28.186.133]] ([[User talk:76.28.186.133|talk]]) to last version by Gurch  #REDIRECT#F0#[[Computer#F0#accessibility]]#F0#{{R#F0#from#F0#CamelCase}}        lo15ponaybcg2sf49sstw9gdjmdetnk ,Computer_accessibility

有没有办法知道python中隐藏的分隔符?你知道吗

也许用另一种格式来编码这个字符串。。。。?你知道吗


Tags: 文件示例byline朋友制表符computersplit
2条回答

你能把标签和空格弄乱或转换吗?也许在标签和空格上分开会有帮助

import re
re.split('\t|    ', line)

只是在空格上分开:

line.split()

没有参数的^{}将在可变宽度的空格上拆分,并根据需要删除前导空格和尾随空格。空白是任何制表符、空格、换行符或回车符:

>>> '10      AccessibleComputing     0       381202555       2010-08-26T22:38:36Z    OlEnglish       7181920 #F3#    [[Help:Reverting|Reverted]] edits by [[Special:Contributions/76.28.186.133|76.28.186.133]] ([[User talk:76.28.186.133|talk]]) to last version by Gurch  #REDIRECT#F0#[[Computer#F0#accessibility]]#F0#{{R#F0#from#F0#CamelCase}}        lo15ponaybcg2sf49sstw9gdjmdetnk ,Computer_accessibility'.split()
['10', 'AccessibleComputing', '0', '381202555', '2010-08-26T22:38:36Z', 'OlEnglish', '7181920', '#F3#', '[[Help:Reverting|Reverted]]', 'edits', 'by', '[[Special:Contributions/76.28.186.133|76.28.186.133]]', '([[User', 'talk:76.28.186.133|talk]])', 'to', 'last', 'version', 'by', 'Gurch', '#REDIRECT#F0#[[Computer#F0#accessibility]]#F0#{{R#F0#from#F0#CamelCase}}', 'lo15ponaybcg2sf49sstw9gdjmdetnk', ',Computer_accessibility']

相关问题 更多 >