对不同大小的音频文件进行音素识别？

1条回答

网友

1楼 · 发布于 2024-05-28 23:45:36

我有一个建议，我不认为这一定是一个好的建议，但我确实认为它会起作用。在

如果你想做的是训练音素，不管音素跨越多少帧都能被识别，你可以尝试用一些随机系数来训练你的音素特征。这是在OpenCV中的几个特征提取程序上完成的，以使图像特征具有比例不变性。我想如果你把它应用到音频，它可能会使它速度不变。我意识到这可能会导致你的训练特征爆炸，所以另一种方法是调整你试图识别的输入，而不是训练输入。您可以将所有的训练特征缩放到相同的帧/特征速率，然后将所有输入缩放到相同的速率。可能这是完全不可能的，我不是机器学习专家。祝你好运

编程相关推荐

iOS MDM注册配置文件请求/Profile使用java对证书进行签名
java如何调试GWT项目中的PHP文件
Mac和Windows之间的Java文件getFreeSpace差异
java从ArrayList进入JComboBox
ApacheKafka如何执行zookeeperserverstart。我的java程序中的bat文件？
JAXRS应用程序的java初始化
java如何为double覆盖compareTo方法？
使用进程动态运行java代码
sockets java。网SocketException:权限被拒绝openshift
java PorterduffXfermode：清除位图的一部分

相关问题更多 >

编程相关推荐

热门问题

热门文章

对不同大小的音频文件进行音素识别？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >