创建具有堆栈溢出数据集>5m节点的networkx二部图,需要建议和建议吗

2024-04-27 00:51:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一个关于数据可视化和sna的项目,我正在使用堆栈溢出时态网络数据集http://snap.stanford.edu/data/sx-stackoverflow.html)。数据集表示堆栈溢出时用户之间的交互,例如用户A在特定时间回答了用户B的问题。我已经做了热图跟踪最突出的用户活动,我的另一个想法是将数据集表示为一个二部图。 我是NetworkX的新手,我想得到一个建议,知道我的想法是否正确,是否有可能解释我的想法,以及最好的方法是什么(大数据集和类似问题的例子将非常有用)。 所以, 我把User A和Useb作为节点,它们之间的边就是时间。我有5百万个节点。由于数据集的结构,我想将连接表示为一个二部图。数据不平衡,>;95%的用户只询问/回答了一次。我对可视化的想法是得到类似的东西:

enter image description here

有可能吗?如果是的话,你能给我一个如何做可视化的例子吗。最好的表达方式是什么?你知道吗

如果有人给我帮助,我将不胜感激。谢谢!你知道吗


Tags: 数据项目用户网络http节点堆栈可视化