多个键上的pycassa timeseries数据

2024-04-28 16:56:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试为twitter克隆制作一个newsfeed,它显示一组用户的最新tweet,而不是所有用户的最新tweet或单个用户的最新tweet。你知道吗

我将UUID密钥存储在各个密钥中,例如:

user1, {UUID01: '', UUID02: '', UUID03: '', UUID04: ''}
user2, {UUID05: '', UUID06: '', UUID07: '', UUID08: ''}
user3, {UUID09: '', UUID10: '', UUID11: '', UUID12: ''}
user4, {UUID13: '', UUID14: '', UUID15: '', UUID16: ''}

结束每个UUID与另一个列族中的tweets相关:

UUID01, { ... }
UUID02, { ... }
UUID03, { ... }

现在,我可以高效地为所有用户或单个用户安排tweet时间。但是,如何获取user1、user2和user3的时间顺序事件呢?你知道吗

注意,user1可能有很多新tweet,但是user2可能只有很少的新tweet。你知道吗

我曾考虑过创建一个“newsfeed”专栏系列,其中包含用户关注的所有用户的tweet的uuid,但这种纯粹的数据冗余级别似乎……太过了。这是一个更明智的方法吗?你知道吗


Tags: 用户uuid时间密钥twittertweetuser1newsfeed
1条回答
网友
1楼 · 发布于 2024-04-28 16:56:25

在客户机上排序(合并),或者复制到一个单独的新闻提要中,基本上是您的两个选择。摘下你的毒药。你知道吗

FWIW,我看到一篇我再也找不到的研究论文,分析哪篇更好。结论是,在一定的tweet音量阈值下,复制效果更好。(每个用户约10000个,IIRC)

相关问题 更多 >