针对在(废水)环境中获得的数据的数据分析包
wwdata的Python项目详细描述
wwdata
针对(废水)环境中获得的数据的数据分析包
- 自由软件:GNU通用公共许可v3
- 文档:https://ugentbiomath.github.io/wwdata-docs/
- 资金来源:Dommel Waterboard
- 背景:根特大学Biomath的博士研究
结构
这个包包含一个类和三个子类,都在单独的.py文件中。子类的划分基于数据类型:
- 全尺寸装置的在线数据(基于在线传感器)
- 来自实验室实验的在线数据(基于LabSensor)
- 从实验室实验获得的离线数据(基于实验室实验)。
jupyter notbeook文件(.ipynb)演示了可用函数的使用。最发达的类别是基于在线传感器的类别。该类的工作流如下图所示,其中osb表示基于在线传感器的对象。主要前提是从不删除数据,而是对其进行标记,并且能够在填补数据集中的空白时检查可靠性。
示例
有关包含代码和更具体示例的工作流,请查看作为包文档包含的Showcase Jupyter笔记本。
学分
这个包是在Cookiecutter和audreyr/cookiecutter-pypackage项目模板以及GitHub page的支持下创建的,由Daler提供,并解释了如何将sphinx文档生成与github页面结合使用。
历史记录
0.1.0(2017-10-23)
pypi上的第一个版本。
wwdata(废水数据)包旨在使数据分析、验证和填补数据空白更为精简。它包含执行所有这些操作的代码,同时还提供整个过程的简单可视化。
该软件包是在博士研究的框架下开发的,涉及对一个全尺寸污水处理厂(WWTP)的建模。工厂的在线测量是可用的,但与所有数据一样,并不完美,因此需要验证。间隙填充源于运行污水处理厂模型所需的高频进水数据。
0.2.0(2018-06-12)
PYPI的第二个版本。
wwdata(废水数据)包旨在使数据分析、验证和填补数据空白更为精简。它包含执行所有这些操作的代码,同时还提供整个过程的简单可视化。
该软件包是在博士研究的框架下开发的,涉及对一个全尺寸污水处理厂(WWTP)的建模。工厂的在线测量是可用的,但与所有数据一样,并不完美,因此需要验证。间隙填充源于运行污水处理厂模型所需的高频进水数据。
0.2.0版中的新功能:
- 错误修复
- 向多个函数添加only_checked参数,以便仅将函数应用于已验证的数据点(self.meta_valid中的“original”)。
- 扩展、改进和定制文档网站(使用Sphinx生成)。
- 扩展和改进的jupyter笔记本文档。
- 改进的get_correlation可视化:基于获得的相关性的预测带现在包含在生成的散点图中。
已知错误:
- 请参阅(github上的开放问题)[https://github.com/UGentBiomath/wwdata/issues])