使用numpy/pandas创建两列的联合点击数矩阵

2条回答

网友

1楼 · 编辑于 2024-04-18 22:35:30

numpy_indexed包（免责声明：我是其作者）具有有效解决此问题的功能：

import numpy_indexed as npi
print(npi.count_table(col1, col2))

网友

2楼 · 编辑于 2024-04-18 22:35:30

这可能有用（使用numpy.histogram2d）：

import numpy as np

col1 = np.random.random_integers(1, 5, 100)
col2 = np.random.random_integers(1, 10, 100)
bin1 = np.arange(0.5, 6.5, 1)
bin2 = np.arange(0.5, 11.5, 1)

mat = np.histogram2d(col1, col2, bins=[bin1, bin2])[0]
print mat.shape
print mat

它产生了

^{pr2}$

我没有用长度超过几千的列表来测试它，但是我认为它应该可以扩展到几百万个值。在

编辑：

你好，纳希瓦尔。我对熊猫不太熟悉（但我应该很熟悉），所以我花了几分钟在周围玩耍。这里有几种方法可以得到你想要的（我认为）：

^{3}$

编程相关推荐

使用HQL查询的java Hibernate批更新
java AutoWiring steps与Spring Cucumber Serenity
JavaSpring启动测试用例不会加载所有组件
java RMI运行时何时断开客户端连接？
如果xml文件中缺少元素，如何在java中通过jaxb解组为该元素设置默认值
Mule3.9.0Java。util。ConcurrentModificationException:null
更改Java web服务响应的标头，而不进行Jackson转换
java在选择NEtbeans中的主类时存在歧义，尽管声明了公共类
java jawampa最大WebSock框架尺寸？
安卓安卓x中定义的java add（）。碎片应用程序。零碎交易

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用numpy/pandas创建两列的联合点击数矩阵

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >