擅长:python、mysql、java
<p>如果您可以发布数据框在pandas中的外观,而不是excel文件的图片,那就太好了。但是,构造一个虚拟df</p>
<pre><code> df = pd.DataFrame({'index1':['a','b','c'],'index2':['b','g','f'],'index3':['w','q','z']
,'Col1':[0,1,0],'Col2':[1,1,0],'Col3':[1,1,1],'Col4':[2,2,0]})
</code></pre>
<p>第1步,可以使用.set\u index()方法指定索引,如下所示</p>
<p><code>df.set_index(['index1','index2','index3'],inplace=True)</code></p>
<p>在数据帧过滤过程中,您可以使用从<code>df_bool.sum(axis=1)</code>得到的返回值,而不是手工进行过滤,如下所示</p>
<pre><code>df.loc[(df==0).sum(axis=1) / (df.shape[1])>0.6]
index1 index2 index3 Col1 Col2 Col3 Col4
c f z 0 0 1 0
</code></pre>
<p>使用它你可以删除那些行,假设20%,那么你会使用</p>
<p><code>df = df.loc[(df==0).sum(axis=1) / (df.shape[1])<0.2]</code></p>
<p>在头文件问题上,如果没有看到文件或数据帧的样子,就有点难以回答</p>