专利解析工具是一个库,提供从谷歌的uspto数据生成训练和测试集的工具,有助于测试机器学习算法

patent-parsing-tools的Python项目详细描述


##系统要求:

`Bash sudo yum install python-devellibxslt-devellibxml2-devel `

##python要求:

`Bash pip install -r requirements.txt `

##跑步:

收集和序列化数据: `Bash python -m patent_parsing_tools.supervisor [working_directory] [train_destination] [test_destination] [year_from] [year_to] `

例如。 `Bash python -m patent_parsing_tools.supervisor patents/working_directory patents/train_destination patents/test_destination 2014 2015 `

用列车组生成字典: `Bash python -m patent_parsing_tools.bow.dictionary_maker [train_directory] [max_parsed_patents] [dict_max_size] [dictionary_name] `

例如。 `Bash python -m patent_parsing_tools.bow.dictionary_maker patents/train_destination 1000000000 4096 dictionary.txt `

使用列车组和测试集生成单词包: `Bash python -m patent_parsing_tools.bow.bag_of_words [directory_with_serialized_patents] [destination_directory] [dictionary.txt] [package_size > 1024] `

例如。 `Bash python -m patent_parsing_tools.bow.bag_of_words patents/train_destination patents/final_dataset_train dictionary.txt 1048576 python -m patent_parsing_tools.bow.bag_of_words patents/test_destination patents/final_dataset_test dictionary.txt 1048576 `

##运行测试

`Bash python -m unittest discover . `

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在构造函数外部添加鼠标侦听器   java如何使用比较器对列表进行排序以正确排序空值?   javajavax。由于javax,邮件“535.7.3身份验证失败”。邮件升级(v1.3.1至v1.5.2)   java将arraylist流到固定的二维数组中并打印?   RecyclerView适配器上的java上下文   java如何为此Twitter API为KafkaProducer建立连接   java Spring安全性重写WebSecurity配置适配器的配置(AuthenticationManagerBuilder)是否会影响全局应用程序?   线程“awteventque0”NullPointerException中的java异常   if条件中的null值和null指针异常java   java树集<Object>允许相同类型的多个对象   java定义类;我认不出   字符串java replaceAll()   JAVAutil。scanner(Java)读取文件时如何跳过空格?   java在swing中关闭flash屏幕   java在Wildfly 16中的应用程序中加载pk12文件   有没有工具可以自动生成屏幕抓取的Java代码   创建意图时,java方法getParcelableExtra()返回null   将数据从java传递到jsp   java Android Studio |永久保存布局