我有一个数据文件,它是通过以下方式构建的:
源id、目标id、印象、点击
在其上添加以下列:
下限/上限是计算值(这与我的问题无关,但对于好奇的问题these are the bounds for the Wilson confidence interval)。你知道吗
问题是,我试图按下限(位置=6)对列表进行排序,降序。尝试了几件事情(排序/排序,使用lambda与使用itemgetter,创建一个不带标题的新列表,并尝试仅对其进行排序),但仍然没有任何变化。我有下面的代码。你知道吗
import csv
from math import sqrt
from operator import itemgetter
#----- Read CSV ----------------------------------------------------------------
raw_data_csv = open('rawdile', "rb")
raw_reader = csv.reader(raw_data_csv)
# transform the values to ints.
raw_data = []
for rownum,row in enumerate(list(raw_reader)):
if rownum == 0: # Header
raw_data.append(row)
else:
r = [] # Col header
r.extend([int(x) for x in row]) # Transforming the values to ints
raw_data.append(r)
# Add cols for pairs (as tuple) and CTR
raw_data[0].append("pair")
for row in raw_data[1:]:
row.append((row[0],row[1])) # tuple
# row.append(float(row[3])/row[2]) # CTR
# ------------------------------------------------------------------------------
z = 1.95996398454005
def confidence(n, clicks):
if n == 0:
return 0
phat = float(clicks) / n
l_bound = ((phat + z*z/(2*n) - z * sqrt((phat*(1-phat)+z*z/(4*n))/n))/(1+z*z/n)) # lower bound
u_bound = ((phat + z*z/(2*n) + z * sqrt((phat*(1-phat)+z*z/(4*n))/n))/(1+z*z/n)) # upper bound
return phat, l_bound, u_bound
raw_data[0].extend(["CTR","Lower Bound","Upper Bound"])
for row in raw_data[1:]:
phat, l_bound, u_bound = confidence(row[2],row[3])
row.extend([phat, l_bound, u_bound])
# raw_data[1:].sort(key=lambda x: x[6], reverse=True)
sorted(raw_data[1:], key=itemgetter(6), reverse=True)
outputfile= open('outputfile.csv', 'wb')
wr = csv.writer(outputfile,quoting = csv.QUOTE_ALL)
wr.writerows(raw_data)
raw_data_csv.close()
outputfile.close()
有人知道为什么吗? 谢谢!你知道吗
您在一次尝试中排序片(这将创建一个新的list对象),而在另一次尝试中忽略
sorted()
的返回值。你知道吗不能这样对列表的一部分进行排序;请改为通过串联来创建新列表:
相关问题 更多 >
编程相关推荐