用情绪分析法抓取雅虎新闻的poc
stocknews的Python项目详细描述
股票新闻
从雅虎搜集财务新闻并分析市场情绪(POC)
摘要
使用stocknews
,您可以从Yahoo Financial RSS提要中收集新闻数据,并将其与标题和摘要的情绪一起存储。
根据初始化,1或2个文件输出为csv。1号是已删除的新闻(可选),2号是摘要,包含给定日期(见选项)和值的新闻摘要情绪。
安装
要安装软件包,请运行pip install stocknews
用法
为了使用stocknews
来收集新闻数据并为您的模型做好准备,您只需要这样做:
from stocknews import StockNews
...
stocks = ['AAPL', 'MSFT', 'NFLX']
sn = StockNews(stocks, wt_key='MY_WORLD_TRADING_DATA_KEY')
df = sn.summarize()
...
这将返回一个pandas数据帧,并在默认情况下将其保存到data/data.csv
(请参见选项)
选项
stocks
:要检查的库存列表。有关可用的所有符号,请参见http://eoddata.com/symbols.aspx。news_file='news.csv'
:保存的新闻的文件名summary_file='data.csv'
:保存的数据集的文件名,包括每天的情绪和价值以及股票save_news=True
:保存新闻文件或动态地对最近的新闻进行清理和分析closing_hour=20
:交易所关闭(本例中是纳斯达克)。收盘后的消息将在下一个交易日公布(周末也将取消)closing_minute=0
:与closing_hour
相同
wt_key=None
:您的WorldTradingData.com API密钥。找一个here。如果直接调用read_rss
,则不需要。
依赖关系
pandas
https://pypi.org/project/pandas/feedparser
https://pypi.org/project/feedparser/nltk
https://pypi.org/project/nltk/requests
https://pypi.org/project/requests/numpy
https://pypi.org/project/numpy/
测试
python setup.py test
待办事项
- 添加更多新闻源
- 添加更多测试
更改
0.9.11
- 修正了另一个路径问题…
0.9.10
- 删除了
exit()
rolleyes
0.9.9
- 路径问题已修复。现在真的…
0.9.8
- 修复了一些路径问题
0.9.7
- 试图修复太多请求,添加了一个计数器以跟踪发出的请求
0.9.6
- 禁止NTLK下载消息
- 重命名为
test.py
0.9.5
- “初始版本”
<;0.9.5:
- 测试