一个简化excel文件海量数据提取的包

xlscrap的Python项目详细描述


警告:在此阶段不要期望此工具提供有用的信息!!

xl废料

xlscrap是一个MIT-licensed包,用于简化excel文件的海量数据提取

请参阅documentation

基本原理

你有没有感受过从很多excel文件中提取数据的痛苦?

  • 当你有成百上千看起来相似的文件 但在一些烦人的细节上有所不同。
  • 当数据单元格坐标因更改而无法使用时
  • 当你不得不用不同的策略发现几十个或几百个字段时。
  • 当同一字段在不同的工作表位置或名称中移动时
  • 当同一字段标签更改时
  • 当数据单元格位于标签右侧或标签下方时
  • 当您需要检查收集的数据是否正确时。

xlscrap帮助您从excel文件中删除数据。

快速启动

>>>importxlscrap>>>s=xlscrap.Scrapper()>>>s.field('name')>>>s.field('age')>>>s.field('address')>>>s.table('pets',fields=['name','breed','age'])>>>s.scrap('excel-files/*.xls*')lookingfor4fieldsin5filesinexcel-files/*.xls*,file1/5,found4/4fieldsindiana.xlsxfile2/5,found4/4fieldsinbob.xlsfile3/5,found3/4fieldsinrichard.odsfile4/5,found0/4fieldsinalien.xlsfile5/5,found4/4fieldsinmaria.xlsm>>>s.result[{'name':'Diana','age':47,'address':'44 rue du Louvre\n75000 Paris\nFrance''pets':[]},...]

待办事项

  • 在setup.py中设置gitlab url
  • 克隆gitlab/github
  • 在自述文件中完成快速启动

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java数据未插入SQLite数据库   Java中内存有效的对象创建   java在方法内部使用“this”(不用于调用方法、构造函数或变量)   java为什么这里会出现NullPointerException?   在REST中使用HATEOAS导致的java循环依赖   java如何定制spring boot横幅?   Java数字基数计算器(即基数10到基数5)   如果在Kotlin vs Java中声明,用作全局上下文的安卓 MainApplication类将崩溃   用于过滤对象的Java lambda函数   java从字符串数组中获取整数列表   java为什么Maven找不到org。json JPMS自动模块?   java将字符串数组转换为int   仅当与阈值字节匹配时,java才会在映射中填充字符串值