创建具有实际错误的合成数据的框架,用于优化数据科学管道。

noisif的Python项目详细描述


噪声化

noisify是一个简单的轻量级库,用于通过添加真实的噪声来增强和修改数据。

简介

添加一些人为噪音(打字错误、东西放错框等)

>>> from noisify.recipes import human_error
>>> test_data = {'this': 1.0, 'is': 2, 'a': 'test!'}
>>> human_noise = human_error(5)
>>> print(list(human_noise(test_data)))
[{'a': 'tset!', 'this': 2, 'is': 1.0}]
>>> print(list(human_noise(test_data)))
[{'a': 0.0, 'this': 'test!', 'is': 2}]

添加一些机器噪声(高斯噪声、数据采集中断等)

>>> from noisify.recipes import machine_error
>>> machine_noise = machine_error(5)
>>> print(list(machine_noise(test_data)))
[{'this': 1.12786393038729, 'is': 2.1387080616716307, 'a': 'test!'}]

如果两者都需要,只需将它们相加即可

>>> combined_noise = machine_error(5) + human_error(5)
>>> print(list(combined_noise(test_data)))
[{'this': 1.23854334573554, 'is': 20.77848220943227, 'a': 'tst!'}]

向numpy数组添加噪波

>>> import numpy as np
>>> test_array = np.arange(10)
>>> print(test_array)
[0 1 2 3 4 5 6 7 8 9]
>>> print(list(combined_noise(test_array)))
[[0.09172393 2.52539794 1.38823741 2.85571154 2.85571154 6.37596668
                  4.7135771  7.28358719 6.83600156 9.40973018]]

阅读图像

>>> from PIL import Image
>>> test_image = Image.open(noisify.jpg)
>>> test_image.show()

现在有噪音

>>> from noisify.recipes import human_error, machine_error
>>> combined_noise = machine_error(5) + human_error(5)
>>> for out_image in combined_noise(test_image):
...     out_image.show()

^ {EM1}$NOISIGITY 允许您为任意对象构建灵活的数据增强管道。 所有的管道都是由简单的高层物体建造的,像乐高一样连接在一起。 使用noiseify来测试应用程序接口,验证数据清理管道,并使您的ml算法更加 对现实世界的情况很稳健。

安装

先决条件

Nosify依赖于Python3.5+

从pipy安装
$ pip install noisify

其他信息

完整的文档可在todo readthedocs链接处获得。

许可证

DSTL(C)皇家版权所有2019

Nosify是根据麻省理工学院的许可证发布的

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在Microsoft Office Word或Excel文档中查找突出显示的文本   Java反射:获取方法返回参数的类型   java根据从字符串解析的日期对ArrayList<String>进行排序   不带IDE JSONObject的json JAVA   Selenium检查属性是否包含java中字符串的一部分   java Hibernate在使用@PostConstruct时找不到绑定到线程的会话   java频繁访问对象属性会带来成本吗?   java如何使用spring boot从json更新数据   Android Studio中的java适当边距布局   java spring引导无法在spring测试类中注入spring服务   java在插入排序中删除重复项   如何在JAVA中重写异常类方法   java Guava缓存内存泄漏   多线程处理三个必须并行执行的任务completableFuture,如果其中任何一个在java中引发异常,则全部取消