用于训练深度规则集的命令行工具

fathom-web的Python项目详细描述


这是Fathom的命令行训练器,它本身是一个有监督的学习系统,用于识别网页的某些部分。它还包括用于规则集开发的其他命令行工具,如fathom-unzipfathom-pickfathom-listSee docs for the trainer here

版本历史记录

3.1
  • 添加fathom-list工具。
  • 进一步优化训练器:对于60个样本的语料库,大约快17倍,对于更大的语料库,则有超线性改进。
3.0
  • 转到Fathom Repo。
  • 添加fathom-unzipfathom-pick
  • 切换到adam优化器,这是非常关键的一点,它不需要手动设置学习速率衰减。
  • 允许未收集候选节点的页。
  • 为每页训练精度添加95%置信区间。
  • 添加验证引导的提前停止。
  • 修改每页精度计算和显示。
  • 训练前洗牌训练样本。
  • 将假阳性和假阴性数字添加到每个标记度量中。
3.0a1
  • 首次发布,用于Fathom本身3.0或更高版本

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java为什么stripVersion不能在带有mojo依赖项的mavendependencyplugin上工作   java存储具有不同功能的大量对象   java Spring MockMvc自定义验证器未在Spring容器中注册/调用   javascript程序编辑实体而不是添加   C++如何在java上检索图形卡信息?   java如何在没有方法参数的方法上使用@cacheable注释的键   java如何获取特定用户或学生的JSON   java可序列化AjaxRequestTarget   java Tomcat 8禁用分块编码过滤器   java这个简单的Swingbase类是线程安全的吗?   java调用Gdi32。使用JNA获取对象   如何使用来自其他类Java Android onClick的方法?   json序列化已经有了id(java.lang.String)的POJO   java使用jsp上传多个文件?   java有没有办法为Android项目在EclipseIndigo上设置JVM参数?   Eclipse中的java,为什么它告诉我添加一个已经存在的分号?   Java中的正则表达式拆分行   Java:在单行中赋值