如何将翻译语料库放入不同的文件中

1条回答

网友
1楼 · 发布于 2024-05-12 18:35:44

首先，处理线条并用空格分隔
# -*- coding: utf-8 -*- import sys reload(sys) sys.setdefaultencoding('utf-8') infile=open('dev.txt','r') outfile1 =open('dev-mid.txt','w') lines = infile.read() i = lines.split() for e in i: outfile1.write(e+'\n')
然后，使用WORD删除dev-mid.txt中的空格和相同前缀字符串
最后,
import os infile=open('dev-mid.txt','r') outfile1 =open('dev-in.txt','w') outfile2 =open('dev-out.txt','w') i=1 for line in infile.readlines(): if i%2==1: ## print(line) outfile1.write(line) i+=1 else: i+=1 ## print(line) outfile2.write(line) infile.close() outfile1.close() outfile2.close()
处理偶数行和奇数行。 dev-in.txt是日语，dev-out.txt是中文：-D

编程相关推荐

Java Double。将长位加倍到C#位转换器。ToDouble
java如何使用正则表达式从固定的Y位数中提取最后的X位数？
java如何显示ChatMessage类列表中的字符串消息属性？
java从JSON或XML提要导入数据，并在Android中创建列表
在整数之间使用按位AND运算符的java好处？
java从Android中的Bean类获取空值？
java会话id对另一台服务器意味着什么？
java未选择案例时开关的工作方式
java组织。openqa。硒。SessionNotCreatedException:无法创建新的远程会话。在emulator中初始化安卓驱动程序时
JavaSWT父和子对话框通信

相关问题更多 >

编程相关推荐

热门问题

热门文章