用于从hackernews检索评论和故事的python库

hackernews_scraper的Python项目详细描述


哈克内斯刮刀
==================

抓取[黑客新闻](https://news.ycombinator.com)评论和帖子
使用[Algolia API](http://hn.algolia.com/api/)。


用法
=====

``Python
来自hackernews scraper import commentscraper

commentscraper.getcomments(自=1394039447起)
```

以上命令将返回一个生成器,该生成器将一次生成一条评论。
它将继续运行,直到没有更多的评论可供获取,或者直到
它达到了Hacker News设置的50页限制。在后一种情况下,a
将引发“Toomanyitemsexception”。

如果hacker news api响应缺少任何必需字段,则scraper
将引发“keyerror”。


响应格式
===============

评论:
```
{
“作者”:u'dhmholley',
“注释ID”:u'7531026',
“评论文”:你还在吹哨吗?…',
“创建位置”:U'2014-04-04T12:57:38.000Z',
“父ID”:7530853,
“点”:1,
“故事ID”:无,
“故事标题”:无,
“故事URL”:无,
“时间戳”:1396616258,
“标题”:无,
“url”:无
}
```

故事:
```
{
“作者”:u“sethco”,
“创建位置”:U'2014-04-04T12:56:23.000Z',
“objectid”:无,
“点”:1,
“故事文本”:1,
“时间戳”:1396616183,
“标题”:今日美国电力公司IPO,
“url”:u'http://www.businesswire.com/news/home/20140403006541/en.uz4cbq1dvih'
}
```

测试
=======

您需要有[httpretty](https://github.com/gabrielfalcao/httpretty)
和[工厂男孩](https://github.com/rbarrois/factory\u boy)已安装。

在根文件夹或“tests”文件夹中运行“notests”。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JavaSpringMVC控制器测试打印结果JSON字符串   若catch语句返回,那个么为什么它最终会阻塞呢?   java Grails中servletContext在哪里可用?   java Jhipster:如何为现有项目启用多种语言   java异常评估SpringEL表达式:“#fields.hasErrors('something')”   java如何验证SeleniumWebDriver中的文本颜色?   java在绘图时使用JPanel坐标   java如何初始化spring启动到project?   java如何通过JDBC的PreparedStatement将UUID数组插入HyperSQL数据库   java修改JVM以跨线程序列化文件访问   Javascript到Java正则表达式   使用Java运行时调用aspell程序时出现字符集问题。getRuntime()。执行官   执行RDP时的java Sukuli按钮识别   java如何使用okhttp更改connect请求的标头   java无法创建Maven Eclipse项目