最优渐近序贯重要性抽样
oasis的Python项目详细描述
oasis是一个在地面真值类中评估二元分类器的工具。 标签不是立即可用的,但可以以一定的成本获得(例如 通过询问人类)。该工具以未标记的测试集作为输入,并 智能地选择要标记的项,以便提供精确的 分类器的性能,同时最小化标记量 必修的。选择要标记的项的基本策略基于 一种称为自适应重要性抽样的技术,它针对 感兴趣的分类器性能度量。目前,OASIS支持 加权f-测度的估计,包括f1分数,精度 还有回忆。
示例
请参阅docs/tutorial/tutorial.ipynb:
下的jupyter笔记本>>> import oasis >>> data = oasis.Data() >>> data.read_h5('Amazon-GoogleProducts-test.h5') >>> def oracle(idx): >>> return data.labels[idx] >>> smplr = oasis.OASISSampler(alpha, data.preds, data.scores, oracle) >>> smplr.sample_distinct(5000) #: query labels for 5000 distinct items >>> print("Current estimate is {}.".format(smplr.estimate_[smplr.t_ - 1]))
许可证和免责声明
代码是根据麻省理工学院的许可证发布的。请参阅的许可证文件 细节。