用水母填充CSV中的行。metaphone()值

2024-04-28 22:12:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我是一个超级Python迷

我正在尝试确定名称列表的变音码。稍后将对这些代码进行比较,以找到可能的相似名称

水母模块适合我的需要,我可以在创建列表时获得变音代码,如下所示:

import jellyfish
names = ['alexander','algoma','angel','antler']
for i in names:
        print(i, "metaphone value =", jellyfish.metaphone(i))

##OUTPUT: 
alexander metaphone value = ALKSNTR
algoma metaphone value = ALKM
angel metaphone value = ANJL
antler metaphone value = ANTLR

但是,我需要获得大约3000个名字的列表的变音码。我用我需要的列标题和现有的名称列表创建了一个.csv。看起来是这样的:

RID *,ST_NAME,FirstWord,FirstWordMeta,StMeta
742,A F JOHNSON,A,,
1240,ABBEY,ABBEY,,
2133,ACES,ACES,,
362,ADAMS,ADAMS,,

因此,理想情况下,我需要为每一行的FirstWord列中的单词使用FirstWordMeta=metaphone代码,为每一行的ST_NAME列中的单词使用StMeta=metaphone代码。我希望输出.csv如下所示:

RID *,ST_NAME,FirstWord,FirstWordMeta,StMeta
742,A F JOHNSON,A,A,A F JNSN
1240,ABBEY,ABBEY,SS,AB
2133,ACES,ACES,SS,SS
362,ADAMS,ADAMS,ATMS,ATMS

我尝试过csv模块,但不明白在使用jellyphish.metaphone()时如何合并引用特定列


Tags: csv代码name名称列表valuessst
2条回答

您可以使用熊猫模块:

import pandas as pd
import jellyfish

data = pd.read_csv("test.csv")  # Your filename here

# Looping over the rows and calculating the metaphone
for i in range(data.shape[0]):
    data["FirstWordMeta"][i] = jellyfish.metaphone(data["FirstWord"][i])
    data["StMeta"][i] = jellyfish.metaphone(data["ST_NAME"][i])

# Save to csv
data.to_csv("result.csv")

您可以尝试以下方法:

import csv
import jellyfish

with open('input.csv') as inputfile:
    reader = csv.reader(inputfile)
    headers = next(reader)
    inputdata = list(reader)

with open('output.csv', 'w') as outputfile:
    writer = csv.writer(outputfile)
    writer.writerow(headers)

    for row in inputdata:
        outputrow = row[:3] + [
            jellyfish.metaphone(row[2]),
            jellyfish.metaphone(row[1])
        ]    
        writer.writerow(outputrow)

相关问题 更多 >