遍历目录中的文件并将结果写入数据帧的新行中

import re import os import pandas as pd files=[i for i in os.listdir("path") if i.endswith("txt")] for file in files: f=open((file), 'r') data=f.read() a=re.findall(r'Company Name(.*?)Type',data,re.DOTALL) a1="".join(a).replace('\n',' ') b=re.findall(r'Sector(.*?)Sub Sector',data,re.DOTALL) b1="".join(b).replace('\n',' ') w={'Company Name': [a1], 'Sector': [b1]} df=pd.DataFrame(data=w) print (os.path.join(file)) df.to_excel(r'/Users/nameuser/info.xlsx')

1条回答

网友

1楼 · 发布于 2024-04-26 09:32:17

import re
import os
import pandas as pd

files=[i for i in os.listdir("path") if i.endswith("txt")]

w={'Company Name': [], 'Sector': []}

for file in files:

    f=open((file), 'r')
    data=f.read()
    a=re.findall(r'Company Name(.*?)Type',data,re.DOTALL)
    a1="".join(a).replace('\n',' ')
    b=re.findall(r'Sector(.*?)Sub Sector',data,re.DOTALL)
    b1="".join(b).replace('\n',' ')
    w['Company Name'].append(a1) 
    w['Sector'].append(b1)

    print (os.path.join(file))

df=pd.DataFrame(data=w)
df.to_excel(r'/Users/nameuser/info.xlsx')

这样，您可以将所有数据填充为dict，然后将其转换为数据帧。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章