Python中文
首页
教程
问答
标签
搜索
登录
注册
从字符串列表中提取第一个选项卡之前的所有文本
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有来自<a href="http://www.manythings.org/anki/" rel="nofollow noreferrer">http://www.manythings.org/anki/</a>的文本数据 看起来像这样</p> <pre><code>['Hi.\tHallo!\tCC-BY 2.0 (France) Attribution: tatoeba.org #538123 (CM) & #380701 (cburgmer)\n', 'Hi.\tGrüß Gott!\tCC-BY 2.0 (France) Attribution: tatoeba.org #538123 (CM) & #659813 (Esperantostern)\n', 'Run!\tLauf!\tCC-BY 2.0 (France) Attribution: tatoeba.org #906328 (papabear) & #941078 (Fingerhut)\n', 'Wow!\tPotzdonner!\tCC-BY 2.0 (France) Attribution: tatoeba.org #52027 (Zifre) & #2122382 (Pfirsichbaeumchen)\n', 'Wow!\tDonnerwetter!\tCC-BY 2.0 (France) Attribution: tatoeba.org #52027 (Zifre) & #2122391 (Pfirsichbaeumchen)\n', 'Fire!\tFeuer!\tCC-BY 2.0 (France) Attribution: tatoeba.org #1829639 (Spamster) & #1958697 (Tamy)\n', 'Help!\tHilfe!\tCC-BY 2.0 (France) Attribution: tatoeba.org #435084 (lukaszpp) & #575889 (MUIRIEL)\n', ... ] </code></pre> <p>是我干的</p> <pre><code>English = [] for sent in data_examples: pattern = re.compile(r'.+?\t') matches = pattern.finditer(sent) for match in matches: English.append(match) </code></pre> <p>如何在课文中捕捉英语?我的不太管用</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您的英语部分位于第一列</p> <p>你需要做的就是</p> <pre><code>English = [sent.split('\t')[0] for sent in data_examples] </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
VirtualEnvRapper错误:路径python2(来自python=python2)不存在
8 回答
virtualenvs上的pyinstaller,没有名为导入错误的模块
6 回答
virtualenvs是否可以退回到用户包而不是系统包?
4 回答
virtualenvwrapper CentOS7
5 回答
virtualenvwrapper IOError:[Errno 13]权限被拒绝
7 回答
virtualenvwrapper mkproject和shell在windows中的启动问题?
3 回答
virtualenvwrapper mkvirtualenv不工作但没有错误
3 回答
Virtualenvwrapper python bash
10 回答
virtualenvwrapper:“workon”何时更改到项目目录?
8 回答
virtualenvwrapper:mkvirtualenv可以工作,但是rmvirtualenv返回bash:没有这样的文件或目录
6 回答
virtualenvwrapper:virtualenv信息存储在哪里?
9 回答
virtualenvwrapper:命令“python设置.pyegg_info“失败,错误代码为1
8 回答
virtualenvwrapper:如何将mkvirtualenv的默认Python版本/路径更改为ins
7 回答
Virtualenvwrapper:模块“pkg_resources”没有属性“iter_entry_points”
10 回答
Virtualenvwrapper:没有名为virtualenvwrapp的模块
4 回答
Virtualenvwrapper.bash_profi的正确设置
3 回答
Virtualenvwrapper.hook:权限被拒绝
3 回答
virtualenvwrapper.sh:fork:资源暂时不可用Python/Djang
2 回答
Virtualenvwrapper.shlssitepackages命令不工作
7 回答
Virtualenvwrapper.sh函数在bash sh中不可用
2 回答