使用google api将媒体文件转换为文本。
voicetotext的Python项目详细描述
#Voice2Text是将媒体文件转换成txt文件,以使用Google Speach API&;
安装google cloud sdk
```
brew cask安装google cloud sdk
```
2。设置Gcloud Projects
```
Gcloud auth login
Gcloud alpha Projects create voicetotext-123456--name voice2text
```
3转到项目URL并启用Google Speech API。
4.请启用(计费)[https://support.google.com/cloud/answer/6293499?hl=en]。
5.创建服务密钥和download(参考:[服务帐户](https://cloud.google.com/storage/docs/authentication generating-a-private-key)。)
5.设置google应用程序的凭据
````
export google应用程序的凭据='/your/service/account/key/xxx.json'
````
pip install voicetotext
` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` `
pip install voicetotext ` ` ` ` `是转换声音潜水。通过谷歌API在文件夹中存在文本。
(参见帮助命令)< BR/>‘BR/>分裂语音-帮助< BR/> 'BR/> BR/>样本< BR/> B./>分裂音频文件
BR/>来自[这里]的日语语音(http://NurGu.N.JP/Loope.html)
'BR/> $SultSoice VoiToTeX:语音voices/hana_1.mp3——相对
分割/57
分割完成!
文件被分离57个文件输出分离的文件?[Y/N]:Y
已完成分离!祝您有个美好的一天!⏎
```
#### Transript Japanese audio files
```
$ voicetotext results/ -s 22050 -l "ja_JP"
芥川龍之介
花
line
朗読池田秀雄
禅智内供の鼻といえば池で知らないものはない
長澤語録すがって上唇の上から顎の下まで下がっている
```
## 处理错误
“请求中的采样率与flac头不匹配。”
>需要检查采样率。
建议进行ffprove检查。
`````
$ffmprove results/000.flac.flac
“请求中的采样率与flac头不匹配。”
“请求中的采样率与flac头不匹配。”
“请求中的采样率与flac头不匹配。”
“请求中的采样率:lavf57.56.56.101
“请求中的采样率与flac头不匹配。”
“请求中的采样率与flac头01.87分,开始:0.000000,比特率:184 kb/s
流0:0:audio:flac,22050 hz,mono,s16
````
在这种情况下,帧速率是22050。
所以,您的命令是这样的。
````
$voicetotext results-s 22050
````
叉开!
2.创建功能分支:`git checkout-b my new feature`
3提交更改:`git commit-am'添加一些功能'`
4.推到分支:`git Push origin my new feature`
5提交一个请求请求请求:d
>调试
````
>虚拟环境
>python3-m-venv-env-env
>源码./env/bin/activate
>python-python3-m-venv-env-env-env
python包安装
pip-install-r-requirements.txt
````
>历史
>许可证
这个软件是这个软件这个软件是根据MIT许可证发布,请参阅license.txt。
安装google cloud sdk
```
brew cask安装google cloud sdk
```
2。设置Gcloud Projects
```
Gcloud auth login
Gcloud alpha Projects create voicetotext-123456--name voice2text
```
3转到项目URL并启用Google Speech API。
4.请启用(计费)[https://support.google.com/cloud/answer/6293499?hl=en]。
5.创建服务密钥和download(参考:[服务帐户](https://cloud.google.com/storage/docs/authentication generating-a-private-key)。)
5.设置google应用程序的凭据
````
export google应用程序的凭据='/your/service/account/key/xxx.json'
````
pip install voicetotext
` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` `
pip install voicetotext ` ` ` ` `是转换声音潜水。通过谷歌API在文件夹中存在文本。
(参见帮助命令)< BR/>‘BR/>分裂语音-帮助< BR/> 'BR/> BR/>样本< BR/> B./>分裂音频文件
BR/>来自[这里]的日语语音(http://NurGu.N.JP/Loope.html)
'BR/> $SultSoice VoiToTeX:语音voices/hana_1.mp3——相对
分割/57
分割完成!
文件被分离57个文件输出分离的文件?[Y/N]:Y
已完成分离!祝您有个美好的一天!⏎
```
#### Transript Japanese audio files
```
$ voicetotext results/ -s 22050 -l "ja_JP"
芥川龍之介
花
line
朗読池田秀雄
禅智内供の鼻といえば池で知らないものはない
長澤語録すがって上唇の上から顎の下まで下がっている
```
## 处理错误
“请求中的采样率与flac头不匹配。”
>需要检查采样率。
建议进行ffprove检查。
`````
$ffmprove results/000.flac.flac
“请求中的采样率与flac头不匹配。”
“请求中的采样率与flac头不匹配。”
“请求中的采样率与flac头不匹配。”
“请求中的采样率:lavf57.56.56.101
“请求中的采样率与flac头不匹配。”
“请求中的采样率与flac头01.87分,开始:0.000000,比特率:184 kb/s
流0:0:audio:flac,22050 hz,mono,s16
````
在这种情况下,帧速率是22050。
所以,您的命令是这样的。
````
$voicetotext results-s 22050
````
叉开!
2.创建功能分支:`git checkout-b my new feature`
3提交更改:`git commit-am'添加一些功能'`
4.推到分支:`git Push origin my new feature`
5提交一个请求请求请求:d
>调试
````
>虚拟环境
>python3-m-venv-env-env
>源码./env/bin/activate
>python-python3-m-venv-env-env-env
python包安装
pip-install-r-requirements.txt
````
>历史
>许可证
这个软件是这个软件这个软件是根据MIT许可证发布,请参阅license.txt。