用于将富文本标记文件转换为xliff格式的实用程序
py-xliff-converter的Python项目详细描述
此包提供了一组用于转换富文本标记文件的实用程序 到OASIS XLIFF可翻译格式。当前只有HTML<;=>;XLIFF 1.2转换 支持。
安装
python xliff转换器可以使用pip安装:
pip install py-xliff-converter
用法
html=>;xliff
命令行:
html2xliff <myfile>.html
此命令将创建<myfile>.xlf文件,该文件可以使用 常见的在线和离线cat工具:trados、memoq、transifex等。
API:
fromxliff_converter.html_parserimportconvert_html...withopen(html_filename,'r',encoding='utf-8')asfo:html=fo.read()xliff=convert_html(html,html_filename)...
函数convert_html(...)将可翻译的xliff文档返回为bytes 用utf-8编码的字符串。
xliff=>;html
命令行:
xliff2html <myfile>.xlf
此命令将创建<myfile>_<lang>.html文件,其中包含 源HTML文件的内容。<lang>是目标的语言代码 语言。
API:
fromxliff_converter.html_rebuilderimportrebuild_html...withopen(xliff_filename,'r',encoding='utf-8')asfo:xliff=fo.read()filename,html=rebuild_html(xliff)
rebuild_html(...)函数返回一个包含 翻译的HTML文件的名称及其内容为^{TT7}$。
注释
- 目前python xliff转换器只支持英语作为源语言。
- 可翻译文本由使用NLTK句子标记器的句子分割。
- html转换器接受部分html标记,例如<body>标记 内容,甚至是纯文本。
- <br>标记被视为转换段分隔符。
- <pre><code>...</code></pre>块被忽略。
待办事项
- 更多文件格式。
- XLIFF 2.0支持。