又是一套粉丝小说网的刮擦工具

ffscraper的Python项目详细描述


粉丝小说网络中的协作过滤

PyPI - Python VersionPyPIlicense

“ffscraper”又是一套FanFiction.net的刮削工具

alexander l.hayes@batflyer

安装

pip install ffscraper

需要:bs4requests

背景

《网络》成立于1998,是世界上最大的用户提交的粉丝小说集(由小说、书籍或电视节目的粉丝们创作的小说作品)。大量容易获得的用户内容吸引了那些有兴趣分析原创作品和其粉丝小说衍生物之间的内容和创造性差异的人的兴趣[1]。最近,[2]创建了一个匿名的数据集,其中的元数据来自FanFaction源。

这个存储库的目的有两个:创建强大的开源工具来抓取内容,并使用这些内容来构建可供fanfinition.net社区使用的开源系统。

参考文献

  • [1]milli,smitha和david bamman,“超越经典文本:粉丝小说的计算分析”,《2016年自然语言处理经验方法会议论文集》。
  • [2]Yin,K.,Aragon,C.,Evans,S.和Katie Davis。世界上最大的科幻小说资料库的元数据集。”2017中国计算机学会计算机系统中人的因素会议记录。ACM,2017年。

归因

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何通过jamod读取控制器的输入状态?   java Back bean方法在使用两个h的单一表单时未调用:selectonemenus和command button   mockitojava中的单元测试Mock继承方法   java在不传递到构造函数的情况下,将一个类的实例使用到另一个类中的最佳方法是什么   java Spring MVC:如何通过API在Dozer的toplevel字段中允许空值?   java hibernate到MSSQL服务器的连接被拒绝:连接   java动态调用现有变量   在java中扩展多个类的泛型   java使用JNA Ptrace获取linux中外部进程的信息?   eclipse获取Java项目中所有构建错误的最快方法是什么?   java将动态数组拆分为多个数组   java安卓:将json保存到sqlite   java获取最近时间Android   java如何为多对多关联编写HQL查询?   java Docker compose for mysql和spring应用程序拒绝访问   java查找数组(如果它是另一个数组的子集)   java如何在另一个具有相同数据类型参数的泛型类(或接口)中使用泛型类(或接口),而无需强制转换   Apache POI java。lang.NoClassDefFoundError:org/apache/commons/compress/utils/InputStreamStatistics   java使用Jackson将JSON反序列化为异构元素列表   使用MapReduce实现java规范化