我有一个非常具体的问题要解决。我有一个带有字符串(路径)和相关度量的数据帧。为了使结果更具可读性,我想在条件下聚合字符串中的路径(Count)。一旦子串一个接一个频繁出现,此时应向子串添加一个乘数或类似的内容
输入示例:
“SEO>;直接投资;c(未设置)>;直接投资;c(未设置)>;直接投资;c(未设置)>;搜索引擎优化'
所需输出:
“SEO>;3 x(直接(未设置))大于;搜索引擎优化'
正如您所见,子字符串“SEO”不应聚合,因为顺序很重要。输入显示了一个用户路径,因此如果简单地计算不同的子字符串,重要信息就会丢失
Tags:
可以使用^{} 查找匹配的相邻组件;这会将它们分组,因此您可以使用^{} ("iterator length") 获取每个组中的计数(如果不匹配,则为1)
如果不想使用
more_itertools
库,可以改为编写:这与
ilen
的作用相同,但阅读起来更容易混淆相关问题 更多 >
编程相关推荐