library/cli实用程序,用于分析、组织和导出facebook存档中的消息
fbparser的Python项目详细描述
cli工具/库,用于分析、组织和导出您的facebook消息存档。
Facebook数据可以通过下面的链接下载 您的设置页:https://www.facebook.com/settings
这个库使用位于html/中的messages.htm文件。 档案中的目录。
为什么?
facebook将你的消息导出为一个巨大的html文件。消息被分组 尽管和一个人的聊天被打断了 整个文件,从最旧到最新。真烦人。这个 解决了这个问题。
安装
要通过pip安装,只需运行:
$ pip install fbparser
要在本地安装,请从与setup.py相同的目录运行:
$ python setup.py install
示例使用
从包含 messages.htm,运行以下命令:
$ fbparser --csv messages.htm
这将在当前目录中创建名为fbparser_out/的目录 包含CSV导出。也可以用json或纯文本进行导出 格式(使用--json和`--text),或打印到控制台 使用--stdout
要指定您的facebook名称(从文件名中删除),请使用--name 旗帜。如果使用--uid指定facebook uid,则该uid将是 替换为指定的名称。例如:
$ fbparser --csv --name="John Smith" --uid="12345@facebook.com" messages.htm
只要找到12345@facebook.com,它就会被替换为 john smith,为了清楚起见,它也将从导出文件名中删除。
替换名称/uid
facebook的档案里到处都是uid和已经改变的人。 它们的显示名称多次出现。要替换某些名称,请输入 使用--replace=file_name.txt
的文件示例:
J Smith=John Smith 12345@facebook.com=John Smith John H Smith=John Smith
每一行的格式应该像Name to replace=New name
fbparser合并包含相同用户的线程,因此如果您看到许多 同一个人具有不同显示名称(或uid)的线程,此 将在合并线程之前更正这些名称。
示例:
$ fbparser --csv --uid="12345@facebook.com" --name="John Smith" --replace="replace.txt" messages.htm
解析错误
如果在分析存档文件时遇到错误,请使用--sanitize标志。 这将创建备份为messages.htm.bak,并将新版本写入 尝试分析文件之前的原始文件名。