我正试图通过Numpy/Pandas的帮助,计算excel表格中包含产品标题的一列中的权重之和。我已经设法将工作表加载到数据框中,并隔离包含我要查找的特定产品的行:
dframe = xlsfile.parse('Sheet1')
dfFent = dframe[dframe['Product:'].str.contains("ABC") == True]
但是,由于问题的明显复杂性(如下所示),我似乎找不到一种方法来总结它的权重。例如,如果“产品标题”列包含如下值-
其中,ABC是我要加起来的产品重量。有没有任何方法,我可以把这些重量加起来,以获得总268克。任何帮助或资源指向解决方案将不胜感激。谢谢!:)
您需要进行一些数据争用,以获得相同格式的列的一致性。您可以进行一些匹配,并尝试使
Product
列对齐并保持一致,类似于日期时间格式。你知道吗就像你可以做以下事情。你知道吗
kg
到grams
熊猫能很好地解决这个问题。你知道吗
注意:这个问题没有捷径,求和时需要去掉带小数的字符串。你知道吗
您可以使用^{} 表示带有单位或百分比的值:
(?P<a>\d+\.\d+|\d+)
表示将float或int提取到列a
\s*
-是数字和单位之间的零个或多个空格(?P<b>[a-z%]+)
是将数字后的小写单位或百分比提取到b
然后用所有单位的} 重塑,按^{} 重塑多列,最后
dictionary
将第一列转换为数字,第二列转换为映射。然后按^{sum
:类似的解决方案:
相关问题 更多 >
编程相关推荐