- 当前热门话题:
Python gutenberg
-
本站为您提供最新、最全的gutenberg的Python教程、文档、代码、资源等相关内容,Python中文网技术交流社区同时还提供学习资源下载,
如:电子书、IDE编辑器软件、编程视频、代码规范标准、WEB开发、GUI、科学计算与人工智能等相关内容。
本文网址:https://www.cnpython.com/tags/280560
欢迎加入QQ群-->: 979659372
关于gutenberg 相关联的Python项目和问题:
最新问答
使用Python,如何在特定字符串出现的位置拆分文本文件?
我试图使用.split(),但它给出了一个错误:AttributeError: 'file' object has no attribute ...
已阅读: n次
我是Python和NLTK的初学者。我试图从教程中运行以下代码:
from nltk.corpus import gutenberg
from nltk import FreqDist
fd = F ...
已阅读: n次
运行此代码时出现此警告
model.save('raw_gutenberg_model.w2v')
model = gensim.models.Word2Vec.load('raw_gutenberg ...
已阅读: n次
我还比较新,不知道从哪里开始。我不希望有详细的一步一步的回应(当然,这些都是非常受欢迎的),但是任何朝着正确的方向前进的举动都会非常感激。你知道吗
我想使用gutenbergpython库根据用户的输 ...
已阅读: n次
问题:我有一个集合列表,如何找到每个集合的唯一项
======
我在玩nltk,很好奇每个语料库中哪些单词是唯一的,所以我编写了一个快速脚本来检查每个语料库中单词集的对称性差异。回想起来,这并没有起 ...
已阅读: n次
我是Python新手
我正在尝试编写一个函数,将输入文件分成n个块,没有截断的行。
所以每个分割文件的大小不一定相同。我只是尽量把它分开
我解决这个问题的方法是读取输入文件的字节大小(在本例中为长字符 ...
已阅读: n次
这是我的数据集:
emma=gutenberg.sents('austen-emma.txt')
它给了我句子
^{pr2}$
但这就是我想要的:
['she was happy','It was ...
已阅读: n次
当我用python2.7(Anaconda,Windows)运行nltk.corpus.gutenberg.fileids()时,我得到以下错误:
File "C:\Anaconda\lib\ntpa ...
已阅读: n次
伙计们,如果我们在程序中输入了“Gutenberg频率表”,我们如何用NLTK删除所有非英语字符和单词?
Plzz帮助--
卡里姆 ...
已阅读: n次
我试图删除标点符号,下面是codeimport字符串
strtext = "Professor Michael S. Hart is @ the originator of the Project G ...
已阅读: n次
我需要帮助从Google Colab上的文本文件(https://www.gutenberg.org/files/768/768.txt)中删除段落。我需要文本文件在“ccx074@pglaf.org ...
已阅读: n次
我有一张有单词的单子。我想数一数最常用的单词
['project',
'gutenberg',
'ebook',
'oliver',
'twist',
'may',......]
我 ...
已阅读: n次
最新项目
#电子书转换器
为古腾堡项目编排电子书转换的代码
ebookconverter为gutenberg项目管理电子书资产的创建和更新。它使用postgres数据库来跟踪电子书元数据和电子书文件。Postg ...
已阅读: n次
啊![](https://i.ibb.co/sCJXhmz/header-sp.png)
啊![](https://img.shields.io/apm/l/vim-mode.svg)
#古腾堡清洁剂 ...
已阅读: n次
概述
此包包含各种脚本,使使用公共域文本的Project
Gutenberg主体更容易。
此软件包提供的功能包括:
从古登堡计划下载文本。
清理文本:移除所有积垢,只留下文本。
使有关文 ...
已阅读: n次
从书中收集大量的单词。
用法
创建名为books/的目录
把.txt个文件放进去。大概是大的,比如书,很容易从Gutenberg上买到。
运行words.py并等待片刻。
接收dictionary ...
已阅读: n次
*********gutenbergpy*****图片::https://github.com/raduangelescu/gutenbergpy/blob/master/dblogos.png:al ...
已阅读: n次
我正在试验马尔可夫链,所以这段代码优先考虑可读性而不是性能。也许它对你有用。
它使用nltk进行标记化和去标记,因为重点是马尔可夫链本身,而不是牦牛剃须。
回购协议包括一个样本语料库:夏洛特·勃朗特的 ...
已阅读: n次
简单的端到端rest api测试框架
此包Python名称:gutenberg-framework
目前版本: gutenberg-framewor ...
已阅读: n次