使用nltk基于其他图书生成图书

bookgen的Python项目详细描述


BookGen

使用nltk分析两本书并生成一本新书的python库。

安装

pip install bookgen

用法

frombookgenimportBookGenbook=BookGen("word_base_book.txt","sentence_base_book.txt")# book.download() will download the nltk extras required, only needed onceprint(book.run())

说明

bookgen将解析第一本指定书籍中的单词类,如下所示:

{"NOUN": ["Mountain", "Valley"], "VERB": ["take", "went"]}

这些是由nltk通用标记集排序的。

第二本书是句子的基础。它将被解析成代表整本书的单词类型列表。

["NOUN", "VERB", "PREP", "NOUN", "CONJ", "VERB", "."]

然后,它基于第二本书从第一本书的单词中生成一个单词列表。

["Nathan", "went", "to", "Valley", "and", "peed", "."]

这与一些大写修复程序合并并返回。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
反射Java反射:高负载下的NoSuchMethodException   java RxJava:one request>list of Integer>sequence of requests for each int>result to list   java为什么循环之前索引会增加   JavaSpring远程处理和RESTfulURL   java Hibernate搜索仅对我的实体的一部分进行索引   使用DPAD快速滚动时,java RecyclerView onCreateViewHolder调用过多   java将JSON解析到一个表中   java导航抽屉标题textview nullpointerexception   基于接口的Java链接队列   java Guice运行时依赖项参数重新注入   java展平/压缩ZSH中的深度嵌套目录   JavaSpring:Http406此请求标识的资源只能   java如何制作Android启动器图标   Java代码在windows上显示不正确(包含希腊语句子)   使用yourkit进行内存分析所用的java时间   java为什么可以序列化属性而不能序列化对象本身?