hiereskopia包是一个库,用于推断对象或字符串类型熊猫系列中的日期格式或数字分隔符等属性。

hieroskopia的Python项目详细描述


海罗斯科皮亚

codecov

hiereskopia包是一个库,用于推断对象或字符串类型熊猫系列中的日期格式或数字分隔符等属性。在

支持

日期时间:

  • 支持日期和日期时间格式
  • 此库接收序列作为输入并尝试返回 一个字典,其格式在基于1989 C(Default)的系列中找到, 雪花标准或Java简单日期时间格式代码。在

数字:

  • 此库接收序列作为输入并尝试返回 有三位数和十进制字符分隔符的词典

使用

推断日期时间

>>>fromhieroskopiaimportInferDatetime>>>InferDatetime.infer(pd.Series(["2019-11-27","2019/11/28","2018-11-08"]))>>>{'formats':['%Y-%m-%d','%Y/%m/%d'],'type':'datetime'}

使用return_format参数

^{pr2}$
>>>fromhieroskopiaimportInferDatetime>>>InferDatetime.infer(pd.Series(["2019-11-27","2019/11/28","2018-11-08"]),return_format='java')>>>{'formats':['yyyy-MM-dd','yyyy/MM/dd'],'type':'datetime'}

上面的方法使用最佳猜测方法来检测对象类型系列中的格式并尝试 返回一个datetime.strftime/strptimeSnowflake Date formatJava Simple Date Format格式,该格式将覆盖或解析大多数 样品的数量。在

推断数字

>>>fromhieroskopiaimportInferNumeric>>>InferNumeric.infer(pd.Series(['767313628196.2','76731362819.546','767313628196']))>>>{'three_digit_separator':'','decimal_separator':'.','type':'float'}

上面的方法将尝试检测并返回对象类型系列中的某些属性 像datatypethree_digit_separatordecimal_separator字符,它将覆盖 大多数样本。在

待办事项:

  • 提供更多正则表达式
  • 添加时间格式
  • 开发多种算法以获得更好的精度。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在java代码中实现两个侦听器时发生swing错误   Lambda是否完全取消了Java8中匿名内部类的使用?   swing OpenSuse 12.3+Java双显示   POM中的java错误。xml文件,即使在清理{users}/之后。m2/用于*上次更新文件的存储库   JavaEDT特定的方法和其他东西   java如何使用GridLayout设置组件大小?有更好的办法吗?   java在itext7中生成二维码时,如何调整点的大小?   java如何在多行上显示文本并右对齐?   java在WebSphereCluString环境中分离Log4j日志   JAVA从文件读取,返回BigInteger值   当使用rxjava2进行排列时,使用javamockito。重试()   在java fasterxml中创建Xml   使用64位整数进行模运算的64位整数的java快速乘法,无溢出   java静态变量保留以前发布的值   datastax enterprise SSTable loader流式处理无法提供java。木卫一。IOException:对等方重置连接   java匹配的通配符是严格的,但找不到元素“mvc:annotationdriven”的声明。标准包装。可抛出   java无法在浏览器上下载文件文档?