用于自然语言口语处理的基本python模块集合
py-nltools的Python项目详细描述
这是一个抽象层和支持函数集合,它们构成了“人工智能”项目的自然语言处理基础:“<拼音>:各种音标之间的翻译功能(IPA,t,b,……)”,marytts、svox pico tts或远程tts服务器和sequitur g2p
*`asr`:使用kaldi asr的抽象层,模型可以在这里找到:http://www.zamia-speech.org
*`sequiturclient`:g2p using sequitur
*`pulseplayer`:audio playback through pulseaudio
*`pulserecorder`:audio recording through pulseaudio
*`tokenizer`:english、french和german word tokenizer瞄准口语应用程序
*`thread pool`:simple thread pool实现
*`vad`:基于webrtc vad的语音活动检测有限状态机
*`macro_engine`:简单的宏引擎,旨在生成自然语言扩展
我计划在zamia ai项目中根据需要添加模块。一些模块,如“拼音”和“标记器”
与大型项目(如nltk或spacy)有一些重叠-我的模块往往比这些模块更易于操作和简单
,因此决不能取代它们。
ifndef::imagesdir[:imagesdir:images]
[ditaa,“高级别”]
……
+—————————————————————————————————————————————————————————————————————————————————————————————————————————————————————||语音线程池宏引擎
+——+——+——+——+——+——+——+——+——+————+————+—————————————————————————————————————————————————————————---++———————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————|||||||
+——————————————————————————————————————————————————————————————————————————————————|||||||
v v v v v v
+——+——+——+——+——+——+——+——+——+——+——+——+——+——+—————————————————————————————————————————————————————————————————————————————————————————————————————————|
++++-++-++-++-++-++-++-++-++-++-++-++-++---++---++---++---++-
..
endif::env github[]
ifdef::env github[]
image::highlevel.png[highlevel图]
endif::env github[]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*注意:可能不完整。
TTS一或更多:
-marytts,py marytts
-espeak ng,py espeak ng
-svox pico tts,py picotts
*对于asr
-kaldi asr 5.4.248,py kaldi asr
*sequitur
*pulseaudio
*webrtc
许可证
~~~~
我自己的代码是apache-2.0许可证,除非脚本的版权
头中另有说明。
有些脚本和文件基于其他人的作品,在这种情况下,我的意图是保持原始许可证的完整性。请务必检查有关详细信息,请参阅内部的右标题。
作者
~~~~~~~
paul guyot<;pguyot@kallisys.net>;
*`asr`:使用kaldi asr的抽象层,模型可以在这里找到:http://www.zamia-speech.org
*`sequiturclient`:g2p using sequitur
*`pulseplayer`:audio playback through pulseaudio
*`pulserecorder`:audio recording through pulseaudio
*`tokenizer`:english、french和german word tokenizer瞄准口语应用程序
*`thread pool`:simple thread pool实现
*`vad`:基于webrtc vad的语音活动检测有限状态机
*`macro_engine`:简单的宏引擎,旨在生成自然语言扩展
我计划在zamia ai项目中根据需要添加模块。一些模块,如“拼音”和“标记器”
与大型项目(如nltk或spacy)有一些重叠-我的模块往往比这些模块更易于操作和简单
,因此决不能取代它们。
ifndef::imagesdir[:imagesdir:images]
……
+—————————————————————————————————————————————————————————————————————————————————————————————————————————————————————||语音线程池宏引擎
+——+——+——+——+——+——+——+——+——+————+————+—————————————————————————————————————————————————————————---++———————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————|||||||
+——————————————————————————————————————————————————————————————————————————————————|||||||
v v v v v v
+——+——+——+——+——+——+——+——+——+——+——+——+——+——+—————————————————————————————————————————————————————————————————————————————————————————————————————————|
++++-++-++-++-++-++-++-++-++-++-++-++-++---++---++---++---++-
..
endif::env github[]
ifdef::env github[]
image::highlevel.png[highlevel图]
endif::env github[]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*注意:可能不完整。
TTS一或更多:
-marytts,py marytts
-espeak ng,py espeak ng
-svox pico tts,py picotts
*对于asr
-kaldi asr 5.4.248,py kaldi asr
*sequitur
*pulseaudio
*webrtc
许可证
~~~~
我自己的代码是apache-2.0许可证,除非脚本的版权
头中另有说明。
有些脚本和文件基于其他人的作品,在这种情况下,我的意图是保持原始许可证的完整性。请务必检查有关详细信息,请参阅内部的右标题。
作者
~~~~~~~