一个简化excel文件海量数据提取的包
xlscrap的Python项目详细描述
警告:在此阶段不要期望此工具提供有用的信息!!
xl废料
xlscrap是一个MIT-licensed包,用于简化excel文件的海量数据提取
请参阅documentation。
基本原理
你有没有感受过从很多excel文件中提取数据的痛苦?
- 当你有成百上千看起来相似的文件 但在一些烦人的细节上有所不同。
- 当数据单元格坐标因更改而无法使用时
- 当你不得不用不同的策略发现几十个或几百个字段时。
- 当同一字段在不同的工作表位置或名称中移动时
- 当同一字段标签更改时
- 当数据单元格位于标签右侧或标签下方时
- 当您需要检查收集的数据是否正确时。
xlscrap帮助您从excel文件中删除数据。
快速启动
>>>importxlscrap>>>s=xlscrap.Scrapper()>>>s.field('name')>>>s.field('age')>>>s.field('address')>>>s.table('pets',fields=['name','breed','age'])>>>s.scrap('excel-files/*.xls*')lookingfor4fieldsin5filesinexcel-files/*.xls*,file1/5,found4/4fieldsindiana.xlsxfile2/5,found4/4fieldsinbob.xlsfile3/5,found3/4fieldsinrichard.odsfile4/5,found0/4fieldsinalien.xlsfile5/5,found4/4fieldsinmaria.xlsm>>>s.result[{'name':'Diana','age':47,'address':'44 rue du Louvre\n75000 Paris\nFrance''pets':[]},...]
待办事项
- 在setup.py中设置gitlab url
- 克隆gitlab/github
- 在自述文件中完成快速启动