从凌乱的电子表格中读取表格。

fuzzytable的Python项目详细描述


Logo

Travis (.com)CodecovRead the DocsPyPIPyPI - Python VersionPyPI - WheelGitHub last commitPyPI - Downloads

fuzzytable是一组从混乱的电子表格中提取表格数据的工具。在

这个库满足了依赖于许多人处理过的电子表格数据的项目的需要。 标题经常丢失或拼写错误。 数据格式不正确。 表格在错误的工作表上,或者您不知道正确的电子表格名称。等。。。在

fuzzytable允许您快速提取数据,而不是提前费力地对数据进行质量控制。 提取后,您可以检查FuzzyTable属性,例如确定 找到了哪些字段,以及所需标头与实际标头的匹配程度。在

安装

pip install fuzzytable

示例用法

这是一个轻松愉快的演示。要使用csv模块读取这个凌乱的文件,我们必须首先:

  • 删除第1行和第2行。在
  • 删除A列和B列
  • 重命名标题。在
ABCDE
Thesearenotthedroids
youarelookingfor.He
cangoc o l o rfirst nameGivenName
abouthisGoldC3PO
business.BlueR2D2

让我们转而利用FuzzyTable类。在

^{pr2}$

现在让我们来看看我们提取的数据。在

>>> droids['color']['Gold', 'Blue']

>>> for droid in droids.records:
...     print(f"{droid['first_name']}-{droid['last_name']} is {droid['color']}.")
C-3PO is Gold.
R2-D2 is Blue.

>>> droids.fields['first_name'].col_num
3

>>> droids.sheet.header_row
2

链接

支持的格式

  • Excel(.xlsx、.xlsm、.xltx、.xltm)
  • csv(.csv)

基本上,任何可以被openpyxl或csv模块读取的内容。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
SimpleDataFormat如何在Java中使用DateFormat解析月份完整格式字符串?   java如何使用JBPM引导规则创建规则流组?   java将SQL和应用程序服务器从Windows 2003迁移到Windows server 2012 R2   java游戏!Intellij IDEA中的2.0控制台无法工作   java如何获取线程内分配的变量值?   java Android翻译动画导致Clicklistener问题   当前平台不支持java桌面API   java删除hashmap条目的方法是什么   用Spring MVC提供Java模型的RDF表示?   JAVA未安装Java的计算机上的lang.UnsupportedClassVersionError   java SQLite从3个表中获取使用组合的对象列表   来自的TLS握手错误的java云数据流BQ输出挂起作业   java如何使用SPARQL进行排名?   java如何在Netbeans 7.1.2中设置${user}的值?   java如何删除括号内的字符串?