擅长:python、mysql、java
<p>如果列是相同的,但是标签有点不同,您可以手动创建一个标准列列表,并将所有数据帧设置为使用这些列。也就是说,第1列总是“ID号”上的一些变体,第2列总是“血管或循环疾病”上的一些变体,但在编码上存在差异。你知道吗</p>
<pre><code>data_frames = []
for file in files:
df = pd.read_excel(f)
df.columns = ['ID Number', 'Vascular or Circulatory Disease'] # and so forth
data_frames.append(df)
combined = pd.concat(data_frames)
</code></pre>
<p>如果您有一组一致的列,但有些文件的末尾有更多的列(例如,某个列在某个点被添加或删除):</p>
<pre><code>def set_columns(data, columns):
if len(data.columns) < len(columns):
diff = len(data.columns) - len(columns)
data.columns = columns[:diff]
# Add missing columns
for i in range(diff, 0):
data[columns[i]] = np.nan
else:
data.columns = columns
return data
</code></pre>