Python gluonar包_程序模块 - PyPI

胶子音频工具包

gluonar的Python项目详细描述

Gluon Audio是一个提供基于深度学习的音频识别的工具包算法。这个项目还在开发中，只有中国人将提供介绍。

胶子简介：

Gluonar基于MXnet Gluon，如果您是新手，请查看 dmlc 60-minute crash course。

内容独立于文本说话人识别内容。

其特点是： av 前进，前进，端到端。堎阻塞率12%。- MelSpectrogram，DCT1D，MFCC，PowerToDB- 1808.00158中。$ -口香糖- 中华人民共和国

示例：

importnumpyasnpimportmxnetasmximportlibrosaasrosafromgluonar.utils.vizimportview_specfromgluonar.nn.basic_blocksimportSTFTBlockdata=rosa.load(r"resources/speaker_recognition/speaker0_0.m4a",sr=16000)[0][:35840]nd_data=mx.nd.array([data],ctx=mx.gpu())stft=STFTBlock(35840,hop_length=160,win_length=400)stft.initialize(ctx=mx.gpu())# stft block forwardret=stft(nd_data).asnumpy()[0][0]spec=np.transpose(ret,(1,0))**2view_spec(spec)# stft in librosaspec=rosa.stft(data,hop_length=160,win_length=400,window="hamming")spec=np.abs(spec)**2view_spec(spec)

输：

STFTBlock	STFT in librosa

更

要求

MXnet-1.5.0+，GluOnFr，AV，librosa，…

接线盒，中新网投资方

利布罗莎 pip install librosa

ffmpeg

# 下载ffmpeg源码, 进入根目录
./configure --extra-cflags=-fPIC --enable-shared
make -j
sudo make install

皮亚夫 pip install av
gluonfr
pip install git+https://github.com/THUFutureLab/gluon-face.git@master

数据集

胆小

darpa-timit语音连续语音语料库（timit）培训和测试数据。在使用此数据集之前，请遵循关于link的说明。

此文件的副本已上载到Google Drive 作者@philipperemyhere。

voxceleb

voxceleb是一个视听数据集，由人类的短片组成演讲稿，摘自上传到YouTube的采访视频。

有关详细信息，请签出此 page。

预训练模型

说话人识别

resnet18 voxceleb

下载：Baidu， Google Drive

我遵循了论文voxceleb2中的思想 1806.05622为了训练这个模型，它们之间的区别：

	Res18 in this repo	Res34 in paper
Train ed on	VoxCel eb2	VoxCel eb2
Input spec size	224x22 4	512x30 0
Eval on	Random 9500+ pair sample s from VoxCel eb1 train and test set	Origin al VoxCel eb1 test set
Metri c	Accura cy:0.9 32656+ -0.005 187	EER: 0.0504
Frame work	Mxnet Gluon	Matcon vnet
ROC

待办事项

联合体

文档

Gluonar文档现在不可用。

作者

{haoxintong}

讨论

如有任何建议，请发表意见。

贡献

这个项目的最终目标是提供一个易于使用的深入学习基于音频算法库 pytorch-kaldi。

欢迎捐款。

参考文献

MXNET文档和教程 https://zh.diveintodeeplearning.org/

欢迎加入QQ群-->： 979659372

推荐PyPI第三方库

导航栏
项目描述
版本历史
下载文件
项目链接
首页
标签
许可证: BSD许可证（BSD 3条款）
作者信息:: 暂无
维护者
haoxintong
最新PyPI项目
italian_vip_says
UFx
vofs
fake_item_generator
NerEva
django-monologue
fio_product_attribute_strict
climailsystem
pyshape
tbb-devel
npy-append-arra
anthill.tal.macrorenderer
odoo11-addon-stock-a
uuuu
contextil
fyl_nester
appomatic_renderable
teacher
chuletas
slackbot_ce
最新Python常见问题
我是否正确构建了这个递归神经网络
我是否正确理解acquire和realease是如何在python库“线程化”中工作的
我是否正确理解Keras中的批次大小？
我是否正确理解PyTorch的加法和乘法？
我是否正确组织了我的Django应用程序？
我是否正确计算执行时间？如果是这样，那么并行处理将花费更长的时间。这看起来很奇怪
我是否每次创建新项目时都必须在PyCharm中安装numpy？（安装而不是导入）
我是否每次运行jupyter笔记本时都必须重新启动内核？
我是否用python安装了socks模块？
我是否真的需要知道超过一种语言，如果我想要制作网页应用程序？
我是否缺少spaCy柠檬化中的预处理功能？
我是否缺少给定状态下操作的检查？
我是否能够使用函数“count（）”来查找密码中大写字母的数量(（Python）
我是否能够使用用户输入作为colorama模块中的颜色？
我是否能够创建一个能够添加新Django.contrib.auth公司没有登录到管理面板的用户？

gluonar 0.1.0

gluonar的Python项目详细描述

胶子简介：

要求

数据集

胆小

voxceleb

预训练模型

说话人识别

resnet18 voxceleb

待办事项

文档

作者

讨论

贡献

参考文献

推荐PyPI第三方库

dolmen.sqlcontainer

django-polls

certbot-dns-openstack

frankly-python

algos-p

replace_me

atd-args-util

aws-cdk.aws-medialive

sfs

NanopolishComp

smugp

odoo10-addon-account-invoice-triple-discount

pretix-printtool

zeebe-grpc

verhaal

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

gluonar 0.1.0

gluonar的Python项目详细描述

胶子简介：

要求

数据集

胆小

voxceleb

预训练模型

说话人识别

resnet18 voxceleb

待办事项

文档

作者

讨论

贡献

参考文献

推荐PyPI第三方库

dolmen.sqlcontainer

django-polls

certbot-dns-openstack

frankly-python

algos-p

replace_me

atd-args-util

aws-cdk.aws-medialive

sfs

NanopolishComp

smugp

odoo10-addon-account-invoice-triple-discount

pretix-printtool

zeebe-grpc

verhaal

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签