Python中文
首页
教程
问答
标签
搜索
登录
注册
在pytorch中为ASR加载librispeech
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我最近在训练一台使用神经网络和CTC损失的自动语音识别机。但我要做的第一件事是准备数据来训练模型。因为Librispeech包含大量的数据,所以最初我将使用它的一个子集,称为“Mini Librispeech ASR corpus”。(<a href="http://www.openslr.org/31/" rel="nofollow noreferrer">http://www.openslr.org/31/</a>)。另外,我使用SeanNaren Pythorch绑定来处理扭曲ctc(<a href="https://github.com/SeanNaren/warp-ctc" rel="nofollow noreferrer">https://github.com/SeanNaren/warp-ctc</a>)。在</p> <p>在阅读了音频文件和它们对应的转录本之后,我使用Spicy包计算每个音频文件的频谱图。当我要把光谱图输入到卷积层进行特征提取时,问题就出现了。每个谱图的长度不同于其他谱图。在对这个问题进行了更多的搜索之后,我发现我应该向网络传递特定数量的帧,但是为了达到这个目的,我需要用相应的字符(也包含空白符号)标记声音文件的每一帧。在</p> <p>在python中有没有一种方法可以做到这一点?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>将Pythorch神经网络与光谱图结合起来进行动态计算的最简单方法是使用<a href="https://github.com/KinWaiCheuk/nnAudio" rel="nofollow noreferrer">nnAudio</a>。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
使用登录请求.post导致“错误405不允许”
9 回答
使用登录进行Python web抓取
5 回答
使用登录进行抓取
3 回答
使用登录页面从网站抓取数据
2 回答
使用白色圆圈背景使图像更平滑
4 回答
使用百分位数删除Pandas数据帧中的异常值
9 回答
使用百分号进行Python字典操作
6 回答
使用百分比delimi的Python字符串模板
10 回答
使用百分比分割Numpy ndarray最有效的方法是什么?
10 回答
使用百分比分配和修改变量(计算)
2 回答
使用百分比单位绘制数据
5 回答
使用百分比在单个采购订单中组合不同的订单类型
8 回答
使用百分比将数据帧的子集与完整数据帧进行比较
2 回答
使用百分比形式的BBOX选项,而不是绝对像素PyScreenShot Python
6 回答
使用百分比登录列nam更新表
2 回答
使用百分比登录操作系统或者os.popen公司
4 回答
使用百分比计算:十进制还是可读?
5 回答
使用的dataset和dataloader加载数据时出错torch.utils.data公司. TypeError:类型为“type”的对象没有len()
1 回答
使用的Json无效json.dump文件在Python3
10 回答
使用的overwrite方法\r在python 3[PyCharm]中不起作用
4 回答