在CSV文件中写入和读取浮点数及字符串 - python
我刚接触Python和编程。在我的代码中,我为每个音频文件开发了一个特征,这个特征是一个包含39个元素的一维数组。我想把文件名、特征和目标值{0,1}写入一个CSV文件,以便训练我的SVM分类器。我使用了CSV写入器,代码如下:
with open('train.csv', 'a') as csvfile:
albumwriter = csv.writer(csvfile, delimiter=' ')
albumwriter.writerow(['1.03 I Want To Hold Your Hand'] + Final_feature + [0] )
我想把大约180个音频文件的详细信息写入这个CSV文件,然后用它来训练SVM分类器。我用来读取文件的代码是:
with open('train.csv', 'rb') as csvfile:
albumreader = csv.reader(csvfile, delimiter=' ')
data = list()
for row in albumreader:
data.append(row[0:])
data = np.array(data)
我可以通过data[0][1]
访问文件名,通过data[0][2]
访问特征,但这两个都是<type 'numpy.string_'>
类型。我想把特征转换成浮点数的列表。主要的问题似乎是用','
分隔列表中的元素。我试过使用.astype(np.float),但没有成功。
有没有人能给我推荐一个好的方法,把CSV文件中的字符串转换回浮点数?我非常感谢你的帮助,因为我完成这个项目的时间很紧迫。提前谢谢你。
编辑:根据评论,这就是我的train.csv的样子:
"1.01 I saw her standing there" "[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38]" 0
"1.02 I saw her" "[2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40]" 0
"1.03 I want to hold your hand" "[3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41]" 1
3 个回答
根据我看到的,变量 Final_feature
是一个浮点数的列表,对吧?如果是这样的话,按照你写的文件,下面的代码可以用来导入数据。
with open('train.csv', 'rb') as csvfile:
albumreader = csv.reader(csvfile, delimiter=' ')
audio_file_names = []
final_features = []
target_values = []
for row in albumreader:
audio_file_names.append(row[0])
final_features.append([float(s) for s in row[1:-1]])
target_values.append([int(s) for s in row[-1]])
这里有两个列表推导式,可以把数据转换成浮点数和整数。
要把像 "[1.0, 2.0, 3.0]" 这样的字符串转换成列表 [1.0, 2.0, 3.0],可以使用以下方法:
# string to convert
s = '[1.0, 2.0, 3.0]'
lst = [float(x) for x in s[1: -1].split(',')]
# and result will be
[1.0, 2.0, 3.0]
这个方法适用于普通的 Python 字符串类型,也适用于 numpy.string 类型。
我不太明白你想要达到什么目的,但假设 Final_feature 是一个包含浮点数的 Python 列表,根据你写的代码片段,你得到的列表是一个字符串,可能看起来像这样:(你在 data[0][2] 中得到的)
feature = '[3.14, 2.12, 4.5]' # 3 elements only for clarity
你问怎么把这个字符串转换成浮点数,你可以使用:
map(float, feature[1:-1].split(','))
这里补充一下,map 函数会把第一个参数应用到第二个参数的每一个元素上,这样就能把每个字符串都变成浮点数,并返回一个浮点数的列表。
另外一个解决办法是把你的 Final_feature 中的每个元素写到不同的列里。