擅长:python、mysql、java
<p>在所有严肃的统计书籍中,你都会发现一句话:了解你的数据。清理和了解数据是工作的一部分(大多数时候也是最大的一部分)。因此,没有标准程序,但有一些提示:</p>
<ul>
<li>数值数据:绘制大量的曲线图,如箱线图、散点图、直方图等</li>
<li>分类数据:进行一些统计,例如使用<code>table</code></li>
</ul>
<p>您可以在这里找到更多的技术讨论:<a href="https://stackoverflow.com/questions/4787332/how-to-remove-outliers-from-a-dataset">How to remove outliers from a dataset</a>或一些教程<a href="https://www.r-bloggers.com/identify-describe-plot-and-remove-the-outliers-from-the-dataset/" rel="nofollow noreferrer">https://www.r-bloggers.com/identify-describe-plot-and-remove-the-outliers-from-the-dataset/</a></p>
<p>赫本</p>