Twitter流媒体和基于图形的分析框架
Twista的Python项目详细描述
扭打
Twista是一个用python3实现的Twitter流和分析命令行工具套件。它提供以下核心功能:
- 以标准化的方式从公共Twitter流媒体API中记录recordTweets(状态、回复、转发、回复)
- to ^{str1}$import将tweet的片段收集到Neo4j图形数据库中进行分析。在
- 图形数据库可用于分析。我们建议使用Jupyter等工具。
Twista为Jupyter提供集成支持。尝试使用
twista lab
命令使用当前配置文件启动Jupyter。在
安装
Twista托管在PyPi。因此,它可以很容易地安装:
pip3 install twista
类型
^{pr2}$获取现有Twista命令的概述。在
Usage: twista [OPTIONS] COMMAND [ARGS]...
Options:
--help Show this message and exit.
Commands:
import Imports Twitter records into a Neo4j graph database
init Initializes a directory to be used with Twista
lab Starts Jupyter lab for analysis
record Records a Twitter stream
stop Stops the Neo4j database
version Reports the version of Twista
我们建议研究如何使用Twista和graph数据库记录和分析公共Twitter流。在
Twista通过了酸性测试
Twista (0.3.0) is been used to record a sample of the complete German Twitter stream since April 2019. This dataset is open access, updated monthly, and available here:
Twista (0.2.0) has been evaluated recording tweets during the German Federal Election Campaigns of 2017. Over four months Twista recorded 10 GB of data without any operator interaction! This dataset is open access and available here:
- 项目
标签: