自我追踪你的在线生活!
nostalgia的Python项目详细描述
怀旧[阿尔法]
跨平台Chrome历史分析
自跟踪
有一个自我跟踪的运动。监测脉搏、心跳等。但最重要的是不要被跟踪:我们的在线行为。
为了确保我们能够自我记录,我们需要以下东西。
chrome只为a max of 90 days保存历史记录,因此我们需要开始保存历史记录。
我们需要从我们访问的页面中收集HTML数据并将其缓存。
(清理)我们需要从html中提取和分析数据,例如代码片段、链接、微数据、图像、事件。什么都可以。
(未启动)例如,允许每个网站使用plugins。例如,从Airbnb页面提取旅行日期以连接到照片。
用法示例
即将到来
安装
现在,转到chrome中的extensions,然后“loadunpacted”。打开此文件夹中的
chromePlugin
。pip install nostalgia
要测试它,请运行
nostalgia serve
。看看boot_as_service
如何在引导时运行nostalgia
作为服务。确保您没有丢失历史记录,每(最多)90天运行一次
nostalgia backup_history
。
数据概述
Chrome历史记录:
- 推荐数据
- 访问计数
HTML(添加Analyzer后)
- dom
- 代码段
- 文本
- 出版日期
- 链接
- 微数据
- 图像
- 事件