用于取证和大数据的正则表达式模块

jsre的Python项目详细描述


这是一个通用正则表达式匹配引擎,具有 例如,在搜索大字节缓冲区时具有特别好的性能 使用多个编码的大文件或原始磁盘映像。它是写给 解决大数据提取任务中的性能问题,包括人工制品发现 用于数字取证

jsre是:

  • Fast:匹配复杂模式或大量关键字时 输入缓冲区它比当前正则表达式快得多 引擎。JSRE被设计成在复杂的情况下很好地扩展规模: 相对性能随着模式复杂度的提高而提高。
  • unicode中性编码:正则表达式作为字符串写入, 用户单独指定在 表达式已编译。支持所有python编解码器,并且 提供了符合Unicode正则表达式级别1要求的编译器。
  • deployable:编译的匹配引擎内存较小 占用空间限制在10兆字节以下,便于处理 分布在多个CPU上。
  • portable:软件使用单个python类型扩展,并且仅 标准c和python库。在Windows或Linux上与pip一起安装

jsre包含特定于其预期的 应用程序,包括可选的表达式索引,重叠的处理 搜索锚的缓冲器、跨距和偏移量规范 (例如,用于在磁盘扇区的固定位置进行搜索)。

版本1.1基于用于管理字符类和相关 设置操作这大大提高了编译速度,允许 在更通用的应用程序中使用此模块。

jsre尽可能提供与标准python相似的接口 重新模块。请参阅文档示例以了解该模块的介绍 以及它的应用特点。本文档假设读者 熟悉正则表达式及其用法;新手可能会发现 更容易首先阅读python的re文档和教程。

联系人:howard.chivers@york.ac.uk

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java未从Facebook OAuth接收名字、姓氏和姓氏   我自己代码中的java ConcurrentModificationException   java在Android上获得单像素TIFF图像   java图形输出中的swing集成弹出窗口“通知”   将数据库表中的所有数据集插入jTable Java   java如何使用Hibernate获取不完整的集合?   打印无法从java连接到打印机   java使用分隔符拆分带引号的字符串   java Axis2禁用严格验证(wsdl2java中的Eosv)允许什么,如何使其更加严格?   java有人能帮我处理循环代码吗   java将JsonObject数组转换为整数   JavaXWiki扩展:检测事件空间创建   java如何设置图表的文本方向以使用poi旋转所有文本?   eche RecyclerView项的java Set自定义字体   java单元测试带有私有构造函数的spring组件,无需注入   用户界面如何在java中动态显示一组多个元素?   如何从java应用程序调用IDL(交互式数据语言)?   Java的内置库实现