csv.writer将单词的每个字符写入不同的列/单元格

63 投票
4 回答
74550 浏览
提问于 2025-04-17 17:24

目标:从models中的每一行提取锚标签里的文本,并把它放到一个csv文件里。

我正在尝试这段代码:

with open('Sprint_data.csv', 'ab') as csvfile:
  spamwriter = csv.writer(csvfile)
  models = soup.find_all('li' , {"class" : "phoneListing"})

  for model in models:

      model_name = unicode(u' '.join(model.a.stripped_strings)).encode('utf8').strip()
      spamwriter.writerow(unicode(u' '.join(model.a.stripped_strings)).encode('utf8').strip())

这段代码运行得不错,但csv文件里的每个单元格只包含一个字符。

像这样:

|  S  |  A  |   M  |   S  |   U   |  N  |   G   |

而不是:

|SAMSUNG|

当然,我遗漏了什么。但到底是什么呢?

4 个回答

8

我通常使用的解决方案是:

import csv
    with open("output.csv", 'w', newline= '') as output:
        wr = csv.writer(output, dialect='excel')
        for element in list_of_things:
            wr.writerow([element])
        output.close()

这样做可以让你把所有列表中的元素输出成一列,而不是一行。

这里的关键是要遍历列表,并使用 '[list]' 来避免 csvwriter 的顺序问题。

希望这对你有帮助!

113

.writerow() 这个函数需要一个序列(比如说用单引号的字符串 ''、小括号的元组 () 或者中括号的列表 []),然后它会把序列里的每一个元素放到这一行的不同列里,按顺序排列。如果你想写的字符串不是序列里的一个元素,writerow() 就会把这个字符串里的每个字母都当成单独的元素,分别写到 CSV 文件的不同单元格里。

在你使用 import csv 之后

假设你的列表是:

myList = ['Diamond', 'Sierra', 'Crystal', 'Bridget', 'Chastity', 'Jasmyn', 'Misty', 'Angel', 'Dakota', 'Asia', 'Texxxas', 'Desiree', 'Monique', 'Tatiana']


listFile = open('Strippers.csv', 'wb')
writer = csv.writer(listFile)
for item in myList:
    writer.writerow(item)

上面的代码会生成一个名为 strippers.csv 的 CSV 文件:

D,i,a,m,o,n,d
S,i,e,r,r,a
C,r,y,s,t,a,l
B,r,i,d,g,e,t
C,h,a,s,t,i,t,y
J,a,s,m,y,n
M,i,s,t,y
A,n,g,e,l
D,a,k,o,t,a
A,s,i,a
T,e,x,x,x,a,s
D,e,s,i,r,e,e
M,o,n,i,q,u,e
T,a,t,i,a,n,a

如果你想让每个名字都放在自己的单元格里,解决办法就是把你的字符串(item)放到一个序列里。这里我使用了中括号 []

listFile2 = open('Strippers2.csv', 'wb')
writer2 = csv.writer(listFile2)
for item in myList:
    writer2.writerow([item])

使用 .writerow([item]) 的代码就能得到想要的结果:生成一个名为 Strippers2.csv 的文件。

Diamond
Sierra
Crystal
Bridget
Chastity
Jasmyn
Misty
Angel
Dakota
Asia
Texxxas
Desiree
Monique
Tatiana
25

writerow 接受一个序列。你给它的是一个单独的字符串,所以它把这个字符串当作一个序列来处理,而字符串就像是一个字符的序列。

你想在这一行里加什么其他的东西吗?如果没有,那就把它变成一个只有一个元素的列表:

spamwriter.writerow([u' '.join(model.a.stripped_strings).encode('utf8').strip()])

顺便说一下,unicode() 这个调用是完全不必要的,因为你已经在用一个unicode的分隔符来连接了。

撰写回答