python中空间和非空间分离的分析。

segregation的Python项目详细描述


用pysal进行分离分析、推断和分解

生成状态覆盖状态doi

 src=

pysal隔离包是分析城市隔离模式的工具。 只要几行代码,分离用户就可以

计算从简单到最先进的40多项隔离措施,包括:

检验分离估计值是否具有统计学意义:

分解 分离比较成

  • 空间结构差异
  • 人口结构引起的差异

安装

pip和anaconda上提供了隔离的发布版本

:P/<

pip install segregation

蟒蛇

conda install -c conda-forge segregation

您还可以从此存储库安装当前的开发版本

下载蟒蛇

cd进入目录并运行以下命令

conda env create -f environment.yml
conda activate segregation
python setup.py develop

开始

有关分离api的完整指南,请参阅联机 文档

有关代码演练和示例分析,请参见 示例笔记本

计算分离度

分离模块中的每个索引都实现为一个类,该类是根据构建的。pandas.dataframegeopandas.geodataframe。要估计隔离统计信息,用户需要调用隔离类 她想估计一下,并提出三个论点:

  • 包含填充数据的数据帧
  • 具有相关组的人口计数的列的名称
  • 列的名称以及每个枚举单元的总人口

分离中的每个类都有一个统计属性和一个核心数据属性。 第一个是直接访问特定分离度量的点估计 第二个属性允许访问模块内部使用的主数据 执行评估。 要在上面的第一个通用示例中查看估计的d,用户只需运行 index.statistic查看拟合值。

单组测量

例如,如果一个用户正在研究收入隔离,并且想知道 高收入居民往往与其他人更加隔离。 此用户可能希望将不同索引(d)适应名为dfto的数据帧。 一个特定的组,其中有"高收入"、"中等收入"和"低收入"等列,存储每个收入中的人数 括号和名为"total_population"的total列

典型的呼叫如下:

fromsegregation.aspatialimportDissimd_index=Dissim(df,"hi_income","total_population")

如果用户希望适应空间差异索引(sd),则调用将接近 同样,除了dataframe现在需要是geodataframe和适当的geometry列之外

fromsegregation.spatialimportSpatialDissimspatial_index=SpatialDissim(gdf,"hi_income","total_population")

一些空间索引还可以接受apysalw对象,或apandana网络对象, 它允许用户完全控制如何参数化空间效果。 网络功能对于找出 两个城市有两种截然不同的空间结构造成的隔离措施, 例如底特律MI(左)和门罗LA(右):

 src=

对于点估计,所有可用的单组指数总结如下 表:

<表><广告>测量 类/函数空间?特定参数 < /广告><正文>不同(d)异议 否-基尼(G)giniseg否-熵(h)熵否-隔离(xpx)隔离 否-曝光(xpy)曝光否-阿特金森(a)阿特金森否b相关比(V)关联r否-浓度曲线(r)conprof否m修改后的差异性(DCT)修改ssim否 TD对齐"中心">迭代修改的基尼(GCT)modifiedginieg否迭代 偏差校正差异(DBC)biascorrecteddissim否b密度校正差异(DDC)密度校正缺失否xtol空间接近性剖面图(SPP)空间ProxProf是m空间差异性(SD)空间缺失是w,标准化边界空间差异性(bsd)边界空间缺失是标准化 周长面积比空间差异性(pard)周长aratiospatialdisim是标准化 距离衰减隔离(ddxpx)距离衰减 是阿尔法、贝塔、公制 距离衰减曝光(ddxpy)距离曝光是阿尔法、贝塔、公制 空间接近度(SP)空间刺激性是阿尔法、贝塔、公制 绝对群集(ACL)绝对群集是阿尔法、贝塔、公制 相对聚类(rcl)相对聚类是阿尔法、贝塔、公制 增量(del)增量是-绝对浓度(ACO)绝对浓度 是-相对浓度(RCO)相对集中度是-绝对集中(ace)绝对集中化 是-相对集中(RCE)相对中心化是-

多组测量

分离也有助于估计多组分离测度。

在本例中,调用与单个组几乎相同,只是现在我们传递一个 列名而不是单个字符串; 重新引用上面的收入隔离示例,示例调用可能如下所示

fromsegregation.aspatialimportMultiDissimindex=MultiDissim(df,['hi_income','med_income','low_income'])
index.statistic

下表总结了可用的多组索引:

<表><广告>测量 类/函数空间?特定参数 < /广告><正文>多组差异性多异见否-多组基尼多重分页否-多组标准化曝光多规格化曝光否-多组信息理论 多信息理论 否-多组相对分集多相对论版本否-多组平方变异系数多平方系数变化否-多组分集多分集否标准化 辛普森的注意力辛普森浓度否-辛普森的互动辛普森互动否-多组发散多发散否-

当地措施

此外,还可以计算局部分离度。 属性将包含这些索引的值。注意: 在这种情况下,属性是复数的,因为许多统计数据都是拟合的,其中一个用于 每个枚举单元本地分隔索引都具有与其全局索引相同的签名 下表总结了表中的表兄妹:

<表><广告>测量 类/函数空间?特定参数 < /广告><正文>位置商多位置商否-本地分集多本地分集否-局部熵多局部熵否-辛普森的局部浓度多本地辛普森集中否-本地辛普森的互动多本地辛普森接口否-局部集中化 本地相对中心化是-

统计显著性检验

一旦分离指数被拟合,用户就可以进行推断,为 区域分析中的统计显著性。 推理框架的摘要如下表所示:

<表><广告>推理类型类/函数功能主输入 功能输出 < /广告><正文>单个值单值测试 分段类,空下迭代,空方法,双尾p值、估计值、统计值两个值 TwoValueTest分段1、分段2、空、空方法下的迭代p_值、est_sim、est_point_diff

单值推理

 src=

两值推断

 src=

分解

另一个有用的分析可以在分离模块中执行 一种分解方法,其中两个不同的索引可以分解为它们的空间 组件(c_s)和属性组件(c_a)。表中总结了该框架 以下:

<表><广告>框架类/函数功能主输入 功能输出 < /广告><正文>分解 分解梯度索引1、索引2、反事实方法空调、空调

 src=

在这种情况下,底特律和门罗的测量数据的差异是 主要归因于他们的人口构成,而不是 两个城市。 (注意,这是预期的,因为d不是空间索引)

贡献

Pysal隔离正在积极发展中,欢迎投稿。

如果您有任何建议、功能请求或错误报告,请打开一个新的 github上的问题。 要提交修补程序,请遵循pysal开发 指南并打开 拉取请求。一旦合并了更改,您将 自动添加到 贡献者列表

支架

如果您有问题,请在 收发室

许可证

该项目是根据 BSD许可证

资金

奖励 ridir:用于社会科学研究的可扩展地理空间分析

Renan Xavier Cortes感谢Coordena_o de Aperfei_oamento de的支持 巴西国家石油公司(Capes)-流程号88881.170553/2018-01

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JavaSpringbean已创建但未自动连接   java LibGDX游戏在三星Galaxy Grand Prime上结束   如何在Java中列出字符串句子中所有匹配条件的单词   java在Recyclerview中使用“putExtra”传递数据   java从一个特定的数组中提取特定的JSON对象,以便在Android中通过一个意图放入另一个活动   java需要使用IntelliJ和设置项目SDK的帮助   java springcontextindexer和Swagger 3   java使用indexOf和substring计算数字   java使用xml解析在word文档中查找隐式分页符   在添加<context:componentscan basepackage=“com.young.user”/   java无条件更改JTable单元格的背景色   选择列表中的java调用oracle函数:节点无数据类型   java如何添加缓冲图像作为JFrame的背景,然后在此图像上添加面板?   java Javadoc找不到用scala编写的类   java连接到文件共享程序的IP地址   java将数组元素加载到集合中   Tomcat中的java servlet、过滤器和线程   非Bean对象中的java EJB CDI注入?   java与println和printf的不同舍入