专利解析工具是一个库,提供从谷歌的uspto数据生成训练和测试集的工具,有助于测试机器学习算法

patent-parsing-tools的Python项目详细描述


##系统要求:

`Bash sudo yum install python-devellibxslt-devellibxml2-devel `

##python要求:

`Bash pip install -r requirements.txt `

##跑步:

收集和序列化数据: `Bash python -m patent_parsing_tools.supervisor [working_directory] [train_destination] [test_destination] [year_from] [year_to] `

例如。 `Bash python -m patent_parsing_tools.supervisor patents/working_directory patents/train_destination patents/test_destination 2014 2015 `

用列车组生成字典: `Bash python -m patent_parsing_tools.bow.dictionary_maker [train_directory] [max_parsed_patents] [dict_max_size] [dictionary_name] `

例如。 `Bash python -m patent_parsing_tools.bow.dictionary_maker patents/train_destination 1000000000 4096 dictionary.txt `

使用列车组和测试集生成单词包: `Bash python -m patent_parsing_tools.bow.bag_of_words [directory_with_serialized_patents] [destination_directory] [dictionary.txt] [package_size > 1024] `

例如。 `Bash python -m patent_parsing_tools.bow.bag_of_words patents/train_destination patents/final_dataset_train dictionary.txt 1048576 python -m patent_parsing_tools.bow.bag_of_words patents/test_destination patents/final_dataset_test dictionary.txt 1048576 `

##运行测试

`Bash python -m unittest discover . `

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javajaxb在嵌套节点中生成xmlns:xsi声明   java重定向到youtube以上传jsp上可用的视频   java提高了JVM和ANT的性能   java如何将返回的JSON数据放在HTML表单中   java如何发送XWWWFORMURLENCODE在重新授权   java为什么jvm XX:+EliminateAllocations失败   堆移除和重建方法?(爪哇)   Stanford NPL in Spark(Scala)应用程序运行到Java堆空间(Java.lang.OutOfMemoryError)   调试java中打开/关闭println的任何方式(详细模式)   java IntelliJ在鼠标悬停时显示JavaDocs工具提示   Olingo Odata Java中的自动扩展选项   json将postgres文本arry转换为java列表?   oop需要帮助推断Java代码   复选框的java添加操作侦听器AbstractTableModel   java如何从公共静态void main(String[]args)传递值   java从数据库中获取大值   java Processing 2.0电影从jar运行时无法打开电影文件   java如何在不使用应用程序的情况下刷新活动?   尝试将JSON解析为ListView时的Android:JSON parse:null对象引用