用于从hackernews检索评论和故事的python库

hackernews_scraper的Python项目详细描述


哈克内斯刮刀
==================

抓取[黑客新闻](https://news.ycombinator.com)评论和帖子
使用[Algolia API](http://hn.algolia.com/api/)。


用法
=====

``Python
来自hackernews scraper import commentscraper

commentscraper.getcomments(自=1394039447起)
```

以上命令将返回一个生成器,该生成器将一次生成一条评论。
它将继续运行,直到没有更多的评论可供获取,或者直到
它达到了Hacker News设置的50页限制。在后一种情况下,a
将引发“Toomanyitemsexception”。

如果hacker news api响应缺少任何必需字段,则scraper
将引发“keyerror”。


响应格式
===============

评论:
```
{
“作者”:u'dhmholley',
“注释ID”:u'7531026',
“评论文”:你还在吹哨吗?…',
“创建位置”:U'2014-04-04T12:57:38.000Z',
“父ID”:7530853,
“点”:1,
“故事ID”:无,
“故事标题”:无,
“故事URL”:无,
“时间戳”:1396616258,
“标题”:无,
“url”:无
}
```

故事:
```
{
“作者”:u“sethco”,
“创建位置”:U'2014-04-04T12:56:23.000Z',
“objectid”:无,
“点”:1,
“故事文本”:1,
“时间戳”:1396616183,
“标题”:今日美国电力公司IPO,
“url”:u'http://www.businesswire.com/news/home/20140403006541/en.uz4cbq1dvih'
}
```

测试
=======

您需要有[httpretty](https://github.com/gabrielfalcao/httpretty)
和[工厂男孩](https://github.com/rbarrois/factory\u boy)已安装。

在根文件夹或“tests”文件夹中运行“notests”。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javajavax。艾尔。PropertyNotFoundException:   java为什么通过TCP发送的文件比它本身包含的文件包含更多的数据?   java为什么字符开关/案例不起作用?   php到java连接器,在哪里可以找到好的连接器   需要帮助Java简单规则形状面积计算器和if语句吗   macos如何从newstyle Oracle Java OSX捆绑包结构启动帮助页?   java既然所有的类都扩展对象,而对象是一个类,那么对象如何扩展对象呢?   java从JavaPairdd<String,Tuple2<Integer,Integer>>转换为JavaPairdd<String,Integer>   java微调器值未从一个活动传递到另一个活动   参数化类型的java数组   java不提供类。getCanonicalName是否存在性能问题?   java输入键JTextField   为什么我不能在java中调用nextLine()方法两次?   JTextPane中的java JProgressBar   java如何获取Crudepository实例?   用于提取几个<div>标记的java正则表达式   java如何使用JUnit Testrunner生成html图像   Go中Java静态属性的等价性