用于从字幕文件中创建视频的python实用程序
videogrep的Python项目详细描述
videogrep是一个命令行工具,它可以搜索视频文件中的对话框(使用.srt或.vtt字幕曲目或pocketspinx脚本),并根据找到的内容生成超输出。
videogrep还有一个实验性的图形界面(仅限Mac)。下载到这里:[http://saaam.s3.amazonaws.com/videogrep.app.zip](http://saaam.s3.amazonaws.com/videogrep.app.zip)
如果您使用的是带有自制程序的Mac,则可以使用以下命令安装ffmpeg:
``
brew安装ffmpeg--带有libvpx--带有libvorbis
```
(可选)安装Pocketshinx进行字级转录。在Mac上:
``
brew tap watsonbox/cmu sphinx
brew安装——head watsonbox/cmu sphinx/cmu sphinxbase
brew安装——head watsonbox/cmu sphinx/cmu sphinxtrain;可选
brew安装——head watsonbox/cmu sphinx/cmu pocketshinx
``
最基本的用法是:
``
videogrep--输入路径/to/video_或_文件夹--搜索"搜索短语"
```
您可以在搜索短语中放入任何正则表达式。
如果安装pattern.en(`pip install pattern`),您还可以搜索部分语音标记。请参阅[Pattern Search文档](http://www.clips.ua.ac.be/pages/pattern-search)了解有关如何工作的详细信息,以及[Penn Tree Bank标记集](http://www.clips.ua.ac.be/pages/mbsp-tags)了解可使用的语音标记部分的列表。例如,下面将搜索包含一个形容词(jj)和一个单数名词(nn)的每一行对话框:
````
videogrep--输入路径/to/video或文件夹--搜索"jj nn"--搜索类型pos
```
[hypernym](https://en.wikipedia.org/wiki/hypernym)搜索-基本上是搜索符合特定类别的单词。例如,下面的命令将搜索任何引用液体(如水、咖啡、啤酒等)的对话框行:
````
videogrep--输入路径/to/video或文件夹--搜索"liquid"--搜索类型hyper
`````
**注意:videogrep要求字幕轨道和视频文件具有完全相同的名称,直至扩展名。**例如,my_movie.mp4和my_movie.srt将工作,my_movie.mp4和my_movie_subtitle.srt将不工作。
或包含多个文件的文件夹。默认情况下,这是"supercut.mp4"
有三个选项:
*re:[正则表达式](http://www.pyregex.com/)(这是默认值)。
*pos:部分语音搜索(使用[pattern.search](http://www.clips.ua.ac.be/pages/pattern search))。例如,"jj nn"将返回对话框中包含形容词后跟名词的所有行。
*hyper:hypernym search。例如,"body parts"抓取引用body part的所有对话框行
*word:提取单个单词-对于多个单词,使用""符号(需要pocketshinx)。
*franken:创建"frankenstein"语句(需要pocketshinx)
*fragment:允许的多个单词像"blue \*"(需要Pocketsphenx)这样的通配符(需要Pocketsphenx)
<
要使用的最大剪辑
要使用的最大剪辑数<剪辑的顺序####--padding/-p
以毫秒为单位的padding添加到每个剪辑的开始和结束
如果这是启用的,并且您从youtube的自动字幕服务中获取了.vtte您可以进行字级搜索。
你必须先安装Pocketshinx!
如果启用了此选项,则可以执行
字级搜索。
v=pqmzoueprlk)
*[在"全面召回"中所有一到两秒的沉默](https://www.youtube.com/watch?v=qetebxvbyjq)
*[总统前新闻秘书告诉我们他能告诉我们什么](https://www.youtube.com/watch?v=d7pymdcu5nq)
要查看用法,请查看源代码。
videogrep还有一个实验性的图形界面(仅限Mac)。下载到这里:[http://saaam.s3.amazonaws.com/videogrep.app.zip](http://saaam.s3.amazonaws.com/videogrep.app.zip)
如果您使用的是带有自制程序的Mac,则可以使用以下命令安装ffmpeg:
``
brew安装ffmpeg--带有libvpx--带有libvorbis
```
(可选)安装Pocketshinx进行字级转录。在Mac上:
``
brew tap watsonbox/cmu sphinx
brew安装——head watsonbox/cmu sphinx/cmu sphinxbase
brew安装——head watsonbox/cmu sphinx/cmu sphinxtrain;可选
brew安装——head watsonbox/cmu sphinx/cmu pocketshinx
``
最基本的用法是:
``
videogrep--输入路径/to/video_或_文件夹--搜索"搜索短语"
```
您可以在搜索短语中放入任何正则表达式。
如果安装pattern.en(`pip install pattern`),您还可以搜索部分语音标记。请参阅[Pattern Search文档](http://www.clips.ua.ac.be/pages/pattern-search)了解有关如何工作的详细信息,以及[Penn Tree Bank标记集](http://www.clips.ua.ac.be/pages/mbsp-tags)了解可使用的语音标记部分的列表。例如,下面将搜索包含一个形容词(jj)和一个单数名词(nn)的每一行对话框:
````
videogrep--输入路径/to/video或文件夹--搜索"jj nn"--搜索类型pos
```
[hypernym](https://en.wikipedia.org/wiki/hypernym)搜索-基本上是搜索符合特定类别的单词。例如,下面的命令将搜索任何引用液体(如水、咖啡、啤酒等)的对话框行:
````
videogrep--输入路径/to/video或文件夹--搜索"liquid"--搜索类型hyper
`````
**注意:videogrep要求字幕轨道和视频文件具有完全相同的名称,直至扩展名。**例如,my_movie.mp4和my_movie.srt将工作,my_movie.mp4和my_movie_subtitle.srt将不工作。
或包含多个文件的文件夹。默认情况下,这是"supercut.mp4"
有三个选项:
*re:[正则表达式](http://www.pyregex.com/)(这是默认值)。
*pos:部分语音搜索(使用[pattern.search](http://www.clips.ua.ac.be/pages/pattern search))。例如,"jj nn"将返回对话框中包含形容词后跟名词的所有行。
*hyper:hypernym search。例如,"body parts"抓取引用body part的所有对话框行
*word:提取单个单词-对于多个单词,使用""符号(需要pocketshinx)。
*franken:创建"frankenstein"语句(需要pocketshinx)
*fragment:允许的多个单词像"blue \*"(需要Pocketsphenx)这样的通配符(需要Pocketsphenx)
<
要使用的最大剪辑
要使用的最大剪辑数<剪辑的顺序####--padding/-p
以毫秒为单位的padding添加到每个剪辑的开始和结束
如果这是启用的,并且您从youtube的自动字幕服务中获取了.vtte您可以进行字级搜索。
你必须先安装Pocketshinx!
如果启用了此选项,则可以执行
字级搜索。
v=pqmzoueprlk)
*[在"全面召回"中所有一到两秒的沉默](https://www.youtube.com/watch?v=qetebxvbyjq)
*[总统前新闻秘书告诉我们他能告诉我们什么](https://www.youtube.com/watch?v=d7pymdcu5nq)
要查看用法,请查看源代码。