Python kimimaro包_程序模块 - PyPI

骨架化密集标记的图像体积。

kimimaro的Python项目详细描述

Kimimaro:骨架化密集标记图像

使用teasar导出的方法快速骨架化二维和三维numpy阵列中的所有非零标签。返回的骨架列表的格式为云卷

在3.7GHz英特尔i7处理器上，此软件包在一分钟内处理了一个512x512x100的卷，包含333个标签。它在8到13分钟内处理了一个512x512x512的卷，其中包含2124个标签（取决于是否设置了fix\u branching。

用kimimaro标记的密集体积骨架

pip安装

< EM >需要C++编译器。<／P>

sudo apt-get install python3-dev g++
pip3 install numpy
pip3 install kimimaro

将来，我们可能会创建一个完全二进制分布。

示例

用kimimaro标记的密集体积骨架
图2:512x512x512密集标记卷上的内存使用情况

图2显示了将Kimimaro 0.5.2应用于包含2124个连接组件的Connectomics数据集的512x512x512断开标签时所需的内存使用和处理时间（约390秒，约6.5分钟）。描述了算法的不同部分。严重的是，序言运行大约半分钟，骷髅化大约六分钟，并在几秒钟内完成。峰值内存使用量约为4.1 GB。下面的代码用于处理标签。由于fix_borders和max_path的组合，glia的处理在中被截断。

Kimimaro已经走了很长一段路。版本0.2.1花费了15分钟，在同一数据集上的前导码运行时间是前者的两倍。

# LISTING 1: Producing Skeletons from a labeled image.importkimimarolabels=np.load(...)skels=kimimaro.skeletonize(labels,teasar_params={'scale':4,'const':500,# physical units'pdrf_exponent':4,'pdrf_scale':100000,'soma_detection_threshold':1100,# physical units'soma_acceptance_threshold':3500,# physical units'soma_invalidation_scale':1.0,'soma_invalidation_const':300,# physical units'max_paths':50,# default None},# object_ids=[ ... ], # process only the specified labelsdust_threshold=1000,# skip connected components with fewer than this many voxelsanisotropy=(16,16,40),# default Truefix_branching=True,# default Truefix_borders=True,# default Trueprogress=True,# default False, show progress barparallel=1,# <= 0 all cpu, 1 single process, 2+ multiprocess)# LISTING 2: Combining skeletons produced from #            adjacent or overlapping images.importkimimarofromcloudvolumeimportPrecomputedSkeletonskels=...# a set of skeletons produced from the same label idskel=PrecomputedSkeleton.simple_merge(skels).consolidate()skel=kimimaro.postprocess(skel,dust_threshold=1000,# physical unitstick_threshold=3500# physical units)

调整`kimimaro.skeletonie`参数

该算法通过在三维物体上寻找一个根点，然后通过dijksta的最短路径算法通过一个惩罚域将路径串行跟踪到最远的不可见点。每次经过后，都会有一个球体（实际上是一个外切立方体）围绕当前路径中的每个顶点展开，该球体会标记所访问对象的一部分。

有关骨骼化过程基本知识的可视化教程，请参阅以下wiki文章：一篇关于teasar骨骼化的图片指南

更详细的信息，阅读下面的内容或茶叶纸（尽管我们德维亚在一些地方）。〔1〕

性能提示

动机

连接组学领域通常产生大量密集标记的神经组织。骨骼是二维或三维物体的一维表示。它们有许多用途，其中一些是神经元的可视化、计算全局拓扑特征、快速测量对象之间的电距离，以及将树结构强加于神经元（对计算和用户界面有用）。有几种方法可以计算骨骼，也有几种方法可以定义它们[4]。经过一些实验，我们发现teasar[1]方法给出了相当好的结果。其他方法包括拓扑细化（"洋葱剥皮"）和寻找由最大内接球体描述的中心线。Seung Lab的校友Ignacio Arganda Carreras为斐济编写了一个拓扑细化插件，名为"Skeletonize3D"。

在connectomics领域中有几种teasar的实现方法[3][5]，但是人们通常都知道teasar的实现是缓慢的，并且可以使用几十亿字节的内存。我们的目标是在一个花瓣体素比例的图像中快速骨架化所有标签，这清楚地表明现有的稀疏实现是不切实际的。在将稀疏方法应用于云管道时，我们注意到在重复计算欧氏距离变换时存在效率低下的问题。rm（edt），连接分量算法的重复计算，在dijkstra算法使用的图的构造中，边由体素之间的空间关系表示，在存储成本中，体素数量是二次方的，用于表示图像中隐含的图形、用于表示相对较小的剪切块的不必要的大数据类型以及重叠区域的重复下载。我们还发现，teasar的"滚动失效球"的简单实现不必要地以骨架路径长度的二次方来重新评估大量体素。

我们进一步发现，edt的商品实现只支持二进制映像。我们无法找到任何可用的Python或C++库来执行图像上的Dijkstra最短路径。图像的连接组件算法的商品实现仅支持二进制图像。因此，设计了几个库来弥补这些缺陷（参见相关项目）。

为什么是提萨？

teasar:m.sato等人在2000年发表的一篇论文[1]中提出了一种用于精确和健壮骨骼的树结构提取算法，该算法是将二维和三维结构转换为嵌入该高维中的一维"骨架"的一系列算法的一员。人们可以将骨骼简化为从二值图像中提取棒状图形。这个问题比看起来更难。在画这样一幅画时，必须考虑不同的情况。例如，香蕉的棒状图可能只是一个弯曲的中心线，而甜甜圈的图可能是一个闭环。在我们分析神经元的案例中，有时我们希望骨骼包括棘突，通常与突触相连的树突的短突起，有时我们只需要描述一个轴突主干的长度。

此外，数据质量问题也可能具有挑战性。如果一个人正在对一个甜甜圈的二维图像进行骨架化，但是角度与圆环的正交轴有足够的偏差，那么甚至有可能精确地执行这项任务吗？在三维情况下，如果一个神经元的标记出现断裂或合并，算法是否能正常工作？这些问题在手动和自动图像精液中都很常见。

在我们的各向异性体素标记的骨架化神经元问题领域中，我们选择的算法应该产生树结构，根据具体情况处理精细或粗略的细节提取，处理体素各向异性，并且在cpu和内存使用方面具有合理的效率。茶满足了这些标准。值得注意的是，teasar并不能保证骨架在形状中的中心位置，但它做出了努力。基本的teasar算法是已知的在转弯处抄近路和过早分支。2001年，teasar团队的成员在第204页第4.2.2节中描述了一种减少早期分支问题的方法。〔2〕

teasar衍生算法

我们实现了teasar算法，但是为了提高路径中心性，提高性能，处理膨胀的细胞体，并实现对大图像的有效分块评估，我们与现有算法有了一些偏差。我们选择不实现[2]中的梯度向量场步骤，因为我们的实现已经相当快了。这篇论文声称输入体素减少了70-85%，因此值得研究。

为了处理包含许多标签的图像，我们的一般策略是尽可能多地执行操作，以便在一次传递中处理所有标签。我们实现的一些组件算法（例如，连接组件、欧几里德距离变换）每次通过可能需要几秒钟，因此，重要的是它们不能运行数百或数千次。本PA的大部分工程贡献ckage取决于这些操作的效率，这些操作将运行时间从小时减少到分钟。

给定一个三维标记体素阵列，i，n>；=0个标记，有序的三重描述体素各向异性a，我们的算法可以分为三个阶段，按照这个顺序进行预处理、骨架化和定形。

一、序言

前导码获取包含n标签的3d图像，并有效地生成骨骼化阶段所需的连接组件、距离变换和边界框。

为了提高性能，如果n为0，则返回一组空骨架。
标记m个连接的组件，i_cc，ofi
要节省内存，请按从1到m的顺序对连接的组件重新编号。将新图像的数据类型调整为包含m并覆盖i_cc的最小uint类型。
生成重新编号的i_cc到i的映射，以便以后为骨骼分配有意义的标签，并删除i以节省内存。
计算e，给定a的i_cc的多标签各向异性欧氏距离变换。e将所有隔行扫描边视为变换边，而不是图像的边界。黑色像素视为背景。
从i_cc中收集唯一标签的列表，l_cc和基于它们所代表的体素数量来处理哪些标签以去除"灰尘"。
在一次过程中，计算与l_cc中每个标签对应的边界框列表b。 < > >
Ⅱ。骨骼化
在此阶段，我们从每个连接的组件标签中提取树结构的骨架。下面，我们引用序言中定义的变量。为了清楚起见，我们省略了soma特定的处理，并保持fix\u branching=true
对于l_cc和b中的每个标签l…
提取i_l，使用b_l从i_cc中紧密包围l的裁剪二值图像
使用i_l和b_l从e中提取e_l。e_l是l的裁剪紧密封闭的edt。这比为每个二进制图像重新计算EDT快得多。
找到任意前景体素并使用该点作为源，计算i_l的各向异性欧几里德距离场。最大值的坐标现在是"根"r
从r计算欧氏距离场，并将其保存为与根场的距离d_r
计算从根字段p_r=pdrf评分*（（1-e_l/max（e_l）^pdrf指数）+d_r/max（d_r）。
而i_l包含前景体素：
将目标坐标t确定为d_r中距离最大的前景体素。
考虑到p_r中的体素值作为边权重，绘制从r到t的最短路径。
对于p中的每个顶点v，扩展物理边长为scale*e_l（v）+const的无效立方体，并将与这些立方体重叠的i_l中的任何前景像素转换为背景像素。
（仅当p中的每个顶点坐标v固定分支=真）时，设置p_r（v）=0。
将p附加到此标签的路径列表。
< > >
使用e_l，提取到骨架中每个顶点表示的最近边界的距离。
对于从i_l中提取的每个原始骨架，将顶点平移b_l，以更正由裁剪操作引起的平移。
将顶点乘以各向异性a将它们放置在物理空间中。
< > >
如果考虑soma处理，我们修改根（r）搜索过程如下：
如果max（e_l）>；soma_detection_threshold..
在i_l中填充拓扑孔。SOMA是一个大的区域，通常有来自不完善的自动标记方法的灰尘。
从这个清理过的图像中重新计算e_l。
如果max（e_l）>；soma_acceptance_threshold，则转到soma处理模式。
如果处于SOMA处理模式，则继续，否则转到上面算法中的步骤3。
将r设置为与max对应的坐标（e_l）
创建一个物理半径为soma_invalization嫒u scale*max（e_l）+soma_invalization嫒u const的无效球体，并从其中包含的i_l中擦除前景体素。这有助于防止在SOMA上绘制出错误的路径。
从上述算法的步骤4继续。
< > >
三、定稿
在最后阶段，我们将不同连接的组件骨架聚集成单个骨架，并将它们的标签分配给输入图像。这一步是人为的，与它的实现与骨架化的混合方式相比，它是分开的，但在概念上是分开的。
与teasar的偏差
有几个地方我们采取了不同于teasar作者所要求的方法。
将DAF用于目标，PDRF用于寻路
原始teasar算法定义了与根体素场（pdrf，p_r以上）的惩罚距离为：
PDRF = 5000 * (1 - DBF / max(DBF))^16 + DAF
dbf是到边界场的距离（e_l以上），daf是到任何体素场的距离（d_r以上）。
我们发现，daf的加入往往会干扰从中心线开始的骨架路径，而这更好地由反向dbf单独描述。我们还发现修改常数和指数有助于调整转弯行为。最初，我们完全去掉了pdrf中daf的添加，但这引入了另一种问题。pdrf的指数运算导致浮点值在很大的开放空间中崩溃。这使得骨骼在追踪由浮点错误描述的路径时变得疯狂。
daf在根体素和目标体素之间提供了一个非常有用的渐变，我们只是不希望这个渐变将路径偏离中心线。因此，鉴于pdrf基场非常大，我们加入了归一化daf，它刚好足以克服浮点误差，并在宽管和凸起处提供方向。
原始文件还要求使用最大（pdrf）前景值选择目标。然而，这有点奇怪，因为pdrf值由边界效应而不是纯距离度量支配。因此，我们从最大值（daf）中选择目标。
零加权先前路径（fix_branching=true）
2001年的骨架化论文[2]呼吁通过使用已经计算出的路径顶点作为场源计算daf来校正早期分叉。这使得dijkstra的算法可以免费追踪现有的路径，并在离目标较近的地方偏离它。
由于我们已经强烈地不强调daf在dijkstra路径发现中的作用，因此不需要计算这个字段，我们只需要沿着e的路径将pdrf设置为零。为达到这个效果而存在的骨骼。这为我们节省了每个路径的昂贵的重复daf计算。
然而，由于我们一直在计算一个dijkstra"父域"，它记录了从每个前景体素到根的最短路径，所以采用这种方法仍然要付出很大的代价。然后我们使用这个保存的结果快速计算所有路径。然而，由于这种零加权修改使得后续计算依赖于先前的计算，我们需要为每条路径重新计算dijkstra算法。
非重叠分块处理（fix_borders=true）
在处理大型卷时，批量生成骨架的一个明智方法是对卷进行分块，独立处理分块，并在最后合并生成的骨架片段。然而，这是复杂的"边缘效应"导致的上下文丢失，这使得它不可能期望由相邻块产生的骨架片段的端点对齐。相比之下，很容易连接网格碎片，因为网格碎片边缘的顶点位于给定一个重叠像素的可预测的相同位置。
以前，我们使用50%的重叠来连接相邻的骨架片段，这将大体积骨架化的计算成本增加了8倍。但是，如果我们可以强制骨骼位于边界上的可预测位置，我们可以使用单像素重叠并复制简单的网格连接方法。作为一种（不正确但有用的）直觉，考虑计算每个边界平面上每个连接组件的质心，并将其添加为所需的路径目标。这将保证平面的两边连接在同一个像素上。但是，质心可能不在非凸面外壳的内部，因此我们必须更加复杂，并在形状内部选择一些真实的点。
为此，我们再次重新调整欧氏距离变换的用途，并将其应用于连接组件的六个平面中的每一个，并选择最大值作为强制目标。这对于许多类型的对象都很有效，这些对象与单个平面接触并且具有单个最大值。但是，我们必须处理具有多个最大值的长方体和形状的角。
为了处理与长方体多个侧面接触的形状，我们只需将目标分配给所有连接的组件。如果这在后处理中引入了一个循环，那么我们已经有了在火成岩中处理它的循环移除代码。如果它引入了一些无用的小附件，我们也有代码来处理这个问题。
如果形状具有多个距离变换最大值，则在不需要在可能在不同机器上不同时间运行的空间相邻任务之间通信的情况下选择相同的像素是很重要的。此外，相邻任务上的同一平面会翻转坐标系。一种简单的方法可能是在其中一个坐标帧中选择具有最小x和y（或其他基于坐标的标准）的坐标，但这需要跟踪所有六个平面上的翻转，而且很烦人。取而代之的是，我们使用了一系列基于无坐标拓扑的过滤器，这些过滤器既有趣，又省力，而且选择了一些外观合理的东西。对这种方法的一个有效的批评是，它会在一个完全对称的物体上失败，但这些物体在生物数据中是罕见的。
我们应用一系列过滤器，并根据通过的第一个过滤器选择点：
最接近当前标签质心的体素。
最接近图像平面质心的体素。
最接近飞机的一角。
最接近平面边缘。
先前找到的最大值。
< > >
重要的是，filter 1必须基于标签的形状，以便使凸面外壳的扭结最小化。例如，最初我们只使用2到5个过滤器，但这导致远离大块中心的神经突骨骼突然在区块边界处向区块中心移动。
滚动失效立方体
最初的teasar论文呼吁在步骤6（iii）中使用"滚动无效球"来擦除前景体素。这个球的一个简单实现非常昂贵，因为路径中的每个体素都需要自己的球，而且这些体素中有许多重叠。在某些情况下，可能需要对从根到目标路径上的每个体素无意义地重新评估整个体积。虽然在最坏的情况下可能会出现特殊情况，但在更常见的一般情况下，会花费大量的重复工作。
因此，我们应用了一种使用拓扑线索的算法来执行线性时间内的失效操作。为了实现的简单，我们用立方体代替了球体。函数名roll\u invalization\u cube旨在引起这种尴尬，尽管它似乎并不重要。
两遍算法如下。给定一个二值图像i、一个骨架s和一组顶点v：
设b_v为一组边界框，这些边界框将茶叶纸所示的球体标记出来。
分配一个3d有符号整数数组，t，表示拓扑的i的大小和维数。t最初设置为全零。
对于每个b_v：
对于沿x轴的b_v左边界上的所有点p设置t（p）+=1。
将t（p）-=1设置为沿x轴的所有点的右边界上的ponb_v。
计算边界框b_global表示所有b_v的并集
从yz平面开始，每行b_全局的点p沿x轴移动。
设置整数着色=0
在每个索引处，着色+=t（p）
如果着色>；0或t（p）为非零（我们在左边缘），则我们位于无效立方体中，并开始将前景体素转换为背景体素。
< > >
相关项目
为了使这个模块成为可能，必须对几个经典算法进行特殊调整。
edt：支持euclidean距离变换实现的单通道、多标签各向异性。
dijkstra3d：dijkstra在26个连接的3d图像上定义的最短路径算法。这避免了边生成的时间开销和图形表示的内存浪费。
connected-components-3d：在26个具有多个标签的连接的3d图像上定义的连接组件实现。
fastremap：允许从3d数组中的1高速重新编号标签，以减少不必要的大32位和64位标签造成的内存消耗。
< > >
此模块最初设计用于CloudVolume和火成岩。
cloudvolume：用于读取和写入神经组织、网格和骨骼的petascale分块图像的无服务器客户端。
火成岩：可视化连接组学数据集的分布式计算。
< > >
此软件包中使用的一些teasar修改首先由alex bae演示。
骨架化：针对稀疏标签的修改teasar的python实现。
< > >
学分
亚历克斯·贝克·戴夫介绍了前体骨架化包和我们在该包中使用的teasar的一些改进。亚历克斯还开发了后处理方法，用于使用50%重叠拼接骨骼。will silversmith将这些技术用于大规模生产，改进了一些基本的算法来同时处理数千个标签，并将它们重写到kimimaro包中。将添加涓流daf，零加权先前探索的路径，并固定边界的算法。forrest collman增加了参数灵活性，并帮助调整daf计算性能。Sven Dorkenwald和Forrest都提供了有益的讨论和反馈。
参考文献
佐藤先生、苦味先生、本德先生、考夫曼先生和中岛先生。"teasar：用于精确和健壮骨骼的树结构提取算法。PROC第八届太平洋计算机图形学与应用会议。10月2000日。doi:10.1109/pccga.2000.883951（链接）
I.苦，A.E.考夫曼和M.佐藤。"惩罚距离体积骨架算法"。ieee可视化与计算机图形学汇刊第7卷，国际空间站。2001年7月至9月3日。doi:10.1109/2945.942688（链接）
赵先生，S广场。"通过果蝇延髓内轴突定位自动识别神经元类型。9月2014日。arxiv:1409.1892[q-bio.nc]（链接）
A.Tagliasacchi、T.Delame、M.Spagnuolo、N.Amenta、A.Telea。"三维骨骼：最新的报告"。2016年5月。计算机图形学论坛。第35卷，国际空间站。2。doi:10.1111/cgf.12865（链接）
P.Li、L.Lindsey、M.Januszewski、Z.Zheng、A.Bates、I.Taisz、M.Tyka、M.Nichols、F.Li、E.Perlman、J.Maitin Shepard、T.Blakely、L.Leavitt、G.Jefferis、D.Bock、V.Jain。"利用洪水充盈网络和局部重新调整，对果蝇脑的连续切片进行自动重建"。2019年4月。比奥希夫doi:10.1101/605634（链接）
< > >
标签：
标记
图像
路径
算法
体积
标签
骨架
密集
体素
欢迎加入QQ群-->： 979659372
推荐PyPI第三方库
raspigaragealert
当车库门开着时发出警报
docker-compose-all
一个非常简单的Docker集群管理工具，递归地搜索和控制一个目录中所有Docker组成的项目。
gym-cap32bis
一个包，可以用来让一个人工智能学习阿姆斯特朗CPC游戏。
invenio-oarepo-files-rest
用于上传/下载OArepo文件的restapi。
azure-ai-nspkg
Microsoft Azure ai命名空间包[内部]
model-tracker
简单近似队列模型度量
z3r-sramr-p
未提供项目说明
AIserver
这是人工智能的包装
LOONTEST
一个小的示例包
pyexpsolver
自动求解代数表达式
falcon-heav
通过规范构建应用程序后端和微服务的框架基于OpenAPI规范3的第一种API设计方法。
swaggerjmx
大摇大摆转换jmx
wlin
很快
pypushflow
工作流引擎
lunchbot-python
午餐机器人API的Python接口。

导航栏
项目描述
版本历史
下载文件
项目链接
首页
标签
许可证: BSD许可证（BSD 3条款）
作者信息:: 暂无
维护者
willsilversmith
最新PyPI项目
italian_vip_says
UFx
vofs
fake_item_generator
NerEva
django-monologue
fio_product_attribute_strict
climailsystem
pyshape
tbb-devel
npy-append-arra
anthill.tal.macrorenderer
odoo11-addon-stock-a
uuuu
contextil
fyl_nester
appomatic_renderable
teacher
chuletas
slackbot_ce
最新Python常见问题
上传图片使用Django Ckeditor获取服务器错误（500）
上传图片到 Google App Engine，来自非网页客户端
上传图片到Djang的cloudinary
上传图片到Flask
上传图片到googleappengine并与用户分享图片
上传图片到googlecolab，并使用Keras预测分类
上传图片到s3python
上传图片到s3后，上传附带的拇指
上传图片在Django，希望是一个循序渐进的指南？
上传图片并显示在Django 2.0模板上
上传图片时创建动态路径
上传多个图像会破坏除第一个Flas之外的所有内容
上传多个文件上传文件FastAPI
上传多个文件到Django
上传多张图片

kimimaro 0.6.0

kimimaro的Python项目详细描述

Kimimaro:骨架化密集标记图像

pip安装 < EM >需要C++编译器。<／P>sudo apt-get install python3-dev g++ pip3 install numpy pip3 install kimimaro 将来，我们可能会创建一个完全二进制分布。

示例

调整kimimaro.skeletonie参数

Ⅱ。骨骼化

三、定稿

与teasar的偏差

将DAF用于目标，PDRF用于寻路

零加权先前路径（fix_branching=true）

非重叠分块处理（fix_borders=true）

滚动失效立方体

相关项目

学分

参考文献

推荐PyPI第三方库

raspigaragealert

docker-compose-all

gym-cap32bis

invenio-oarepo-files-rest

azure-ai-nspkg

model-tracker

z3r-sramr-p

AIserver

LOONTEST

pyexpsolver

falcon-heav

swaggerjmx

wlin

pypushflow

lunchbot-python

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

`pip`安装
< EM >需要C++编译器。<／P>
sudo apt-get install python3-dev g++ pip3 install numpy pip3 install kimimaro
将来，我们可能会创建一个完全二进制分布。

调整`kimimaro.skeletonie`参数

零加权先前路径（`fix_branching=true`）

非重叠分块处理（`fix_borders=true`）

导航栏

项目链接

标签