用于将富文本标记文件转换为xliff格式的实用程序

py-xliff-converter的Python项目详细描述


此包提供了一组用于转换富文本标记文件的实用程序 到OASIS XLIFF可翻译格式。当前只有HTML<;=>;XLIFF 1.2转换 支持。

安装

python xliff转换器可以使用pip安装:

pip install py-xliff-converter

用法

html=>;xliff

命令行:

html2xliff <myfile>.html

此命令将创建<myfile>.xlf文件,该文件可以使用 常见的在线和离线cat工具:trados、memoq、transifex等。

API:

fromxliff_converter.html_parserimportconvert_html...withopen(html_filename,'r',encoding='utf-8')asfo:html=fo.read()xliff=convert_html(html,html_filename)...

函数convert_html(...)将可翻译的xliff文档返回为bytes 用utf-8编码的字符串。

xliff=>;html

命令行:

xliff2html <myfile>.xlf

此命令将创建<myfile>_<lang>.html文件,其中包含 源HTML文件的内容。<lang>是目标的语言代码 语言。

API:

fromxliff_converter.html_rebuilderimportrebuild_html...withopen(xliff_filename,'r',encoding='utf-8')asfo:xliff=fo.read()filename,html=rebuild_html(xliff)

rebuild_html(...)函数返回一个包含 翻译的HTML文件的名称及其内容为^{TT7}$。

注释

  • 目前python xliff转换器只支持英语作为源语言。
  • 可翻译文本由使用NLTK句子标记器的句子分割。
  • html转换器接受部分html标记,例如<body>标记 内容,甚至是纯文本。
  • <br>标记被视为转换段分隔符。
  • <pre><code>...</code></pre>块被忽略。

待办事项

  • 更多文件格式。
  • XLIFF 2.0支持。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java JavaFX触控事件未触发Ubuntu 20.04触控笔记本电脑   java如何在AWT中关闭窗口?   java Dagger 2:注入具有构造函数参数的成员   创建对象的Java调用类   对象我想在A.java中添加两个数字,并在B.java中打印结果(如何?)   java如何使用AWS SDK for Android从数字海洋空间下载图像?   java Facebook sdk 4.0.1无法使用Android studio获取某些字段   4分钟后web应用程序(Angular 8和Rest API)中的java自动会话超时   在Eclipse for Java EE developers edition中禁用HTML警告   java按字母顺序排列字符串我错过了什么明显的东西吗?   java在Jshell中println和printf有什么不同