熊猫-集合:熊猫的集合定向操作

pandas-sets的Python项目详细描述


pandas集合:pandas中面向集合的操作

如果您将标准pythonset存储在SeriesDataFrame对象中,您会发现这很有用。

pandas_sets包向任何pandasSeries对象添加一个.set访问器; 就像.dt代表datetime,或者.str代表string,但代表^{}

它公开标准^{}中可用的所有公共方法。

安装

pip install pandas-sets

只要导入pandas_sets包,它就会向任何Series对象注册一个.set访问器。

importpandas_sets

示例

importpandas_setsimportpandasaspddf=pd.DataFrame({'post':[1,2,3,4],'tags':[{'python','pandas'},{'philosophy','strategy'},{'scikit-learn'},{'pandas'}]})pandas_posts=df[df.tags.set.contains('pandas')]pandas_posts.tags.set.add('data')pandas_posts.tags.set.update({'data','analysis'})pandas_posts.tags.set.len()

注释

  • 目前实现是原始的。它主要基于pandas的核心^{}实现。
  • 公共api已经针对大多数预期的场景进行了测试。
  • 需要对api进行扩展以适当地处理NA值。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
maven字段#getGenericType()抛出java。lang.TypeNotPresentException   用java绘制三角形的几何图形   java无法下载主题和发件人地址(rediff)   java如何使代码线程安全   java在尝试转换FileInputStream中的文件时,我遇到了一个FileNotFound异常   java Moxy和Jackson如何将Json映射到Pojo   在foreach循环中使用BufferedWriter生成新行的java问题   java为什么我的测试在单次执行中运行时间小于1秒,而在maven构建中运行时间大于20秒?   java如何显示下载附件的进度条   了解java rmi的良好实践   .net可以将Java portlet嵌入ASP。网页?   循环如何多次执行Java方法?   java如何确保用户输入在给定的有效范围内?   java单元测试定理   java如何在IntelliJ上运行外部构建项目?   JAVA:试图编写一个检查字符串是否为数字的方法。总是返回错误   javahadoop将特定键的所有map方法生成的所有值都发送到一个reduce方法,对吗?   在java中读取和使用文件