将Edit字典格式转换为CSV。

edict-to-csv的Python项目详细描述


Edit to CSV是一组用于转换Edit的小型命令行实用程序 将词典转换为分隔文本(CSV)。与许多unix命令一样,这些命令 程序只需读取标准输入并写入标准输出。 提供两个程序:

  • CEDICT到CSV(1)
  • edict1到csv(1)

edict1到csv将字典条目从使用的原始edict1格式转换为 通过jmdict/edict项目。它不处理edict2格式或随后的 基于XML的格式。

cedict to csv将词典条目从cedict项目转换为 CC-CEDICT公司。要使用此程序,必须安装“拼音DEC”软件。 这将重新格式化拼音条目以使用适当的变音符号。

csv条目采用以下格式:

FORM1|FORM2|TRANSLITERATION|DEFINITION

就法令而言,第二个字段总是空的。对于CEDICT,第二个 字段包含简体中文形式。

所包含的程序是作为unix风格的命令行实用程序编写的。这个 程序模块也可以通过python完全访问,所以所有的程序 其他程序可以很容易地调用函数。程序是用 python 3和将在mit许可下提供。

示例用法

您可以这样转换日语法令词典:

$ cat edict.utf8 | edict1-to-csv > edict.csv

如果它是压缩的并且是euc-jp编码,您可能需要将其转换:

$ zcat edict.gz | iconv -f EUC-JP -t UTF-8 | edict1-to-csv > edict.csv

您可以这样转换cc-cedict:

$ cat cedict.txt | cedict-to-csv > cedict.csv

如果您尝试在不安装拼音DEC的情况下使用此程序,您将看到:

$ cat cedict.txt | cedict-to-csv > cedict.csv
cedict-to-csv: pinyin_dec not available!

安装

您可以使用setup.py以旧方式安装此软件:

# python3 setup.py install

或者如果你安装了pip,那是更好的方法。

文档

此软件包括Unix手册页,这些手册页与程序一起安装 文件夹。通过键入“man cedict to csv”或“man edict1 to csv”,您可以查看 这里包括每个程序的文档。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java组织。冬眠hql。内部的阿斯特。QuerySyntaxException:<table\u name>未映射[来自<table\u name>]   异常无法有效使用来自Java的多捕获   java Hibernate Search是Lucene的干净抽象吗?   组织。xml。萨克斯。SAXException:没有针对的反序列化程序{http://www.w3.org/2001/XMLSchema}Java中使用Axis的anyType   java是独立于Eclipse平台的吗?   java PigLatin语句转换器方法给出了“indexoutofboundsexception”错误等   java Spring+Jackson+反序列化泛型对象列表   java获取firefox配置文件的配置文件当配置文件计数超过3(包括默认值)时,我没有选择给定的配置文件   java XPages应用程序无法运行   java为什么字符连接返回“int”和?   java如何以正确的方式从静态助手类中的异步方法返回值?   java如何将字符串值转换为整数数组列表   javajackcess表限制?   java如何使用SMACK API和GTALK发送消息?   java按钮显示在左上角,具有不同的外观和感觉