数据注释做得对:简单,有趣,高效,和诱导洞察力。
hover的Python项目详细描述
Imagine editing a picture layer by layer, not pixel by pixel, nor by splashing paint.
We can apply this idea to datasets.
Hover
是一个机器教学库,可实现直观有效的监督。换句话说,它提供了一个映射,您可以在其中hover并标记数据。。。不一样。例如,您可以:
查看@phurwicz/hover-binder查看演示应用程序的完整列表。在
:flags:最新公告
- dec12常用工作流现在可以在
hover.recipes
中使用。更干净的代码!在 - dec6视频教程即将推出!第一台预计将于12月15日面世。在
:航班起飞:快速启动
Hover
使用^{
# app-annotator.pyfromhover.core.explorerimportBokehCorpusAnnotatorfrombokeh.ioimportcurdoc# df is a pandas dataframe with 2D embedding# which hover can help you computeannotator=BokehCorpusAnnotator({"raw":df})annotator.plot()curdoc().add_root(annotator.view())curdoc().title="Simple-Annotator"^{pr2}$
Hover
最令人兴奋的特性使用了大量Python回调,^{
:包:安装
Python: 3.6+
OS: tested on Mac & Linux
要获取最新版本,可以使用pip
:
pip install hover
无法通过conda
进行安装。如果您希望conda
或{
:火烈鸟:特征
在这里,我们尝试与其他几个进行机器教学的软件包进行快速比较:
Package | ^{ | ^{ | ^{ |
---|---|---|---|
Core idea | supervise like editing a picture | scriptable active learning | programmatic distant supervision |
Annotates per | batch of just the size you find right | piece predicted to be the most valuable | the whole dataset as long as it fits in |
Supports | all classification (text only atm) | text & images, audio, vidio, & more | text classification (for the most part) |
Status | open-source | proprietary | open-source |
Devs | indie | Explosion AI | Stanford / Snorkel AI |
Related | many imports of the awesome ^{ | builds on the ^{ | Variants: ^{ |
Vanilla usage | define a vectorizer and annotate away | choose a base model and annotate away | define labeling functions and apply away |
Advanced usage | combine w/ active learning & snorkel | patterns / transformers / custom models | transforming / slicing functions |
Hardcore usage | exploit ^{ | custom @prodigy.recipe | the upcoming ^{ |
Hover
声称由于
- 除了在“地图”上注释之外,使用或不使用任何技术的灵活性
- 注释的速度或粗糙程度是,在你的指尖上
- 多个“地图”之间的交互作用,每一个“地图”服务于不同但又相互关联的目的。在
:book:资源
Documentation
- 包含最关键组件的API引用。在
- 还有更多的东西在路上呢!(例如视频教程)
依赖性
./requirements-test.txt
列出测试套件的其他依赖项。在./requirements-dev.txt
列出了为开发人员推荐的软件包。在
- 项目
标签: