支持域适应和外部资源的部分语音标记器。

SoMeWeTa的Python项目详细描述


Someweta(Social Media and Web Tagger的缩写)是演讲的一部分 支持域适配并可以合并 外部信息来源,如棕色集群和LoCICA。它 基于平均结构感知器并使用波束搜索 以及早期更新策略。可以培训和评估 部分注释数据上的标记。

Someweta在德国网络上取得了最新的成果 来自EmpiriST 2015 shared task的社交媒体文本 计算机交际/社交的语言诠释 媒体。因此,someweta特别适合标记所有 各种德语书面语,如聊天、论坛、维基 聊天页面、推特、博客评论、社交网络、短信和WhatsApp 对话。

此外,我们还提供德语、英语和 法国报纸文本。对于所有三种语言,someweta都达到了 高度竞争的结果接近目前的技术水平。

有更详细的文档here

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
image Java:设置iconimage而不使用完整路径   javaant和Eclipse构建   Java标签检查图像   java为什么我的glassfish服务器会重定向到另一台服务器?   java MySQL简单查询错误   java你能告诉我如何在图像视图中显示图像吗   Java驱动程序4.0:是否支持对象映射?   java在通过SourceDataLine播放音频时发出一致的爆裂声   java组织。金特罗普。dcom。常见的JIException:未找到错误代码0xC0000070的消息   运行Dijkstra算法实现时的java IndexOutOfBoundsException   java swing gui闪烁白色错误   java单元测试:我应该使用null还是可选的。返回()中的空()?   javajaxb创建空对象   如何拒绝Java构造函数中的非限定参数?   单元测试的java分类