我正在寻找一种方法,通过SQL对音频语音文件进行哈希编码以进行比较

2024-04-24 11:59:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在开发一个工具来比较一个在一天内录制的音频文件和另一个在30天后录制的音频文件。我的训练是语言学,这个工具将被用来编目,索引和比较一个独特的声乐记录的数据库。我知道商业级api,如MusicBrainz或EchoNest,但不能在这个项目中使用它们。所有文件必须在本地存储,不能提供给联机数据库。在

目前,我有每个文件的频谱图和一个可以转换成几乎任何声音文件的批处理转换器。我使用频谱分析仪来精确匹配光谱图(比如散列图覆盖),并且能够以96%的准确率匹配我的结果。然而,随着我的项目的增长,我的存储需求对于这种方法来说将变得太高了。在

我的想法是这样的-如果我可以将音频文件调整到类似的帧速度,我应该能够对声学数据进行哈希编码,并将哈希字符串存储在一个简单的SQL表中,而不是整个音频文件或频谱图中。我不想散列整个文件-只是声学,为了匹配。我可以通过一个不确定的计算机解决方案,比如一个不确定的程序

我正在寻找一种方法来创建哈希值(或另一个校验和)在下周或所以,想法从interwebz来的?在


Tags: 文件工具项目方法api数据库记录音频文件