擅长:python、mysql、java
<p>如果你想删除任何副本,这应该可以。排序将把所有有效的条目放在NAs之后,因此它们在<code>drop_duplicate</code>逻辑中具有优先权。在</p>
<pre><code>df.loc[df['B'] == 'none', 'B'] = np.nan
df = df.sort(['A','B']).drop_duplicates(subset='A')
</code></pre>
<p>如果您希望保留重复的有效值,可以执行类似的操作,将数据拆分为nulls/notnull,然后重新组合。在</p>
^{pr2}$