Python tweetynet包_程序模块 - PyPI

分割和标记鸟鸣的神经网络

tweetynet的Python项目详细描述

TweetyNet

tweetynet image

一种混合卷积递归神经网络，用于分割和标记鸟叫声和其他叫声。

示例注释金丝雀之歌被分成几个词组

安装

要安装，请在命令行运行以下命令：
pip安装tweetynet

在安装之前，您需要设置一个虚拟环境（有关原因的解释，请参见 https://www.geeksforgeks.org/python-virtual-environment/）。创建虚拟环境并不像听起来那么困难；这是一本入门书：https://realpython.com/python-virtual-environments-a-primer/
对于许多依赖于
除了python之外的语言，您可能会发现它更易于使用致力于管理这些依赖关系的平台，例如水蟒（免费）。您可以使用anaconda开发的conda命令行工具创建环境并安装此软件包的科学库取决于。此外，使用conda安装依赖项可能会提高性能（参见https://www.anaconda.com/blog/developer blog/tensorflow-in-anaconda/）。
以下是设置conda环境的方法：
/home/you/code/$conda create-n tweetyenv python=3.6 numpy scipy joblib tensorflow gpu ipython jupyter
/home/you/code/$source激活tweetyenv
（您不必在Windows上source：激活TweetYenV）

然后，您可以在conda环境中使用pip（tweetyenv）/home/you/code/$pip安装tweetynet

`用法`

训练TweetyNet分割和标记鸟鸣的模型
您可以使用vak库来训练tweetynet模型。
vak库配置有config.ini文件，使用少数命令行标志之一。
例如，下面是如何从命令行运行vak来训练单个config.ini文件：
（tweetyenv）$vak train./configs/config\u bird0.ini
有关更多详细信息，请参见vak文档vak。
数据和文件夹结构
要训练模型，必须以音频文件或
谱图文件，以及每个谱图的注释。
光谱图和标签
该软件包可以从.wav或.cbin音频文件生成光谱图。
它还可以接受Matlab格式的频谱图。>文件
重要的模型参数
必须在配置.ini文件中正确定义以下参数
n_音节-必须是正确数量的标签，包括音节之间无声时段的标签。
时间单元-从显示到网络的光谱图的每个窗口中的时间单元数。
在训练过程中，网络会看到从数据中随机抓取的一批窗口，这些窗口的宽度等于time\u bin。
直观地说，时间步长越大，网络拥有的时间上下文越多，但所需时间越长
训练。在实践中，对于孟加拉雀歌，我们用88个时间箱和金丝雀歌达到了很好的精度，
我们使用约250个时间箱实现了良好的精度。
如果需要，可以更改以下参数：
num-epochs-网络应该看到所有培训数据的次数。
批大小-每个训练批中的片段数（当前为11个）
学习率-训练步长系数（当前为0.001）
指定网络本身的其他参数可以在代码中更改，但需要了解TensorFlow。
准备培训文件
可以对任何手动标注的数据进行培训，但有一些有用的指南：
尽可能多地使用示例-结果会更好。具体地说，这段代码不会正确地标记训练中没有遇到的音节，而且很可能会泛化到最近的样本或忽略音节。
使用噪声示例-这将使代码在忽略噪声方面非常出色。
有关噪音的音节示例很重要-最好从干净的录音开始。代码不会产生奇迹，如果音频太坏或被噪音掩盖，代码很可能会失败。尽管如此，在笼形噪声背景下使用音节示例进行训练将是有益的。
运行代码的结果
建议在从估计值中提取实际音节标记以及起始和偏移时间时应用后处理。
预测新标签
您可以通过在config.ini文件中添加[predict]部分来预测新标签，并且
然后使用predict命令运行命令行界面，如下所示：
（tweetyenv）$vak预测./configs/config\u bird0.ini
带有[predict]节的config.ini文件的一个例子是
在这里的doc文件夹中
对于有脚本/tensorflow经验的用户，可以
使用
TensorFlow检查点保护程序。下面是一个如何做到这一点的例子
从vak.train\u utils.learn\u curve功能：
meta_file=glob(os.path.join(training_records_dir,'checkpoint*meta*'))[0]data_file=glob(os.path.join(training_records_dir,'checkpoint*data*'))[0]model=TweetyNet(n_syllables=n_syllables,input_vec_size=input_vec_size,batch_size=batch_size)withtf.Session(graph=model.graph)assess:model.restore(sess=sess,meta_file=meta_file,data_file=data_file)
模型架构
这种深层神经网络的结构是基于这些论文：S.Bóck和M.Schedl，"使用递归神经网络的复调钢琴音符转录"，2012年IEEE声学、语音和信号处理国际会议（ICASSP），京都，2012年，第121-124页。
doi:10.1109/icassp.2012.6287832（http://ieeexplore.ieee.org/stamp/stamp.jsp？tp=&arnumber=6287832&isnumber=6287775）
Parascandolo、Huttunen和Virtanen，"现实生活录音中用于多音声音事件检测的递归神经网络。"（https://arxiv.org/abs/1604.00861" rel="nofollow">https://arxiv.org/abs/1604.00861）
深深的网。此代码中使用的结构包含3个元素：
2个卷积和最大池层-卷积层卷积具有一组可调特征的谱图，最大池用于限制参数的数量。这些层允许提取音节和噪声的局部光谱和时间特征。
一个长-短期记忆重现层（LSTM）-这个层允许模型在信号中包含时间依赖性，如金丝雀颤音和不同音节的持续时间。该代码包含一个添加更多LSTM层的选项，但由于不需要，因此不使用这些层。
一个投影层-对于每个时间格，该层将前一层的输出投影到一组可能的音节上。
标签：
文件
代码
标记
模型
时间
神经网络
ini
音节
vak
欢迎加入QQ群-->： 979659372
                                    
推荐PyPI第三方库
pyswitcherv2
通过python控制交换机v2热水器
lumen
没有项目描述
UNL
没有项目描述
yxspkg-data-icon
MyDATA
recommonmark
docutils与commonmark的兼容性桥，使您能够在docutils&sphinx项目中编写commonmark。
easylife
一组有用的脚本和工具，通过为你做事使你的生活更轻松。使你每天都能做的事情自动化。
pydgin
没有项目描述
django-lb-adminlte
Django的可重用管理员模板库
EtzelDriver
用于与etzel服务器交互的python驱动程序
setuptools-test
用python 3测试打包
yatwin
用于Yatwin和Vstarcam IP摄像机的Python 3 API（Windows）
nbodyswissknife
用各种方便的工具进行nbody计算的包
dxl-dxp
复制组件库python库。
linkedin-scraper
从LinkedIn中收集用户数据
tc-as-a-service
支持tc作为服务的api和实现

导 航 栏

                                            项目 描述
                                        

                                            版本历史
                                        

                                                下载文件
                                            
项目 链接
首页
                                    
标 签
许可证: BSD许可证（BSD 3条款）
作者信息:: 暂无
                                
                            
维护者

                                  nicholdav
                                
最新PyPI项目
italian_vip_says
UFx
vofs
fake_item_generator
NerEva
django-monologue
fio_product_attribute_strict
climailsystem
pyshape
tbb-devel
npy-append-arra
anthill.tal.macrorenderer
odoo11-addon-stock-a
uuuu
contextil
fyl_nester
appomatic_renderable
teacher
chuletas
slackbot_ce
最新Python常见问题
如何实现一个类，该类在每次更改其属性时更改其“last_edited”变量？
如何实现一个类？
如何实现一个类的属性设置？
如何实现一个能够存储输入并反复访问输入的存储系统？GPA计算器
如何实现一个自定义的keras层，它只保留前n个值，其余的都归零？
如何实现一个行为类似于Python中序列的最小类？
如何实现一个请求的多线程或多处理
如何实现一个长时间运行的、事件驱动的python程序？
如何实现一个颜色一致的非舔深度地图实时？
如何实现一个默认的SQLAlchemy模型类，它包含用于继承的公共CRUD方法？
如何实现一次热编码的生成函数
如何实现一种在数组中删除对的方法
如何实现一类支持向量机用于图像异常检测
如何实现一维阵列到二维阵列的复制转换
如何实现三维三次样条插值？

tweetynet 0.2.0

tweetynet的Python项目详细描述

TweetyNet

一种混合卷积递归神经网络，用于分割和标记鸟叫声和其他叫声。

安装

`用法`

数据和文件夹结构

`重要的模型参数`

`准备培训文件`

`运行代码的结果`

`预测新标签`

`模型架构`

`推荐PyPI第三方库`

pyswitcherv2

lumen

UNL

yxspkg-data-icon

recommonmark

easylife

pydgin

django-lb-adminlte

EtzelDriver

setuptools-test

yatwin

nbodyswissknife

dxl-dxp

linkedin-scraper

tc-as-a-service

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

tweetynet 0.2.0

tweetynet的Python项目详细描述

TweetyNet

一种混合卷积递归神经网络，用于分割和标记鸟叫声和其他叫声。

安装

用法

数据和文件夹结构

重要的模型参数

准备培训文件

运行代码的结果

预测新标签

模型架构

推荐PyPI第三方库

pyswitcherv2

lumen

UNL

yxspkg-data-icon

recommonmark

easylife

pydgin

django-lb-adminlte

EtzelDriver

setuptools-test

yatwin

nbodyswissknife

dxl-dxp

linkedin-scraper

tc-as-a-service

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

`用法`

`重要的模型参数`

`准备培训文件`

`运行代码的结果`

`预测新标签`

`模型架构`

`推荐PyPI第三方库`

导航栏

项目链接

标签