HDF5内部数据组织与NumPy使用
根据HDF5的文档,HDF5是通过NumPy来存储数据的。
"它建立在HDF5库、Python语言和NumPy包的基础上。它提供了面向对象的接口,再加上为性能关键部分编写的C扩展,使得它成为一个快速且非常易于使用的工具,可以互动地存储和检索大量数据。”
...
"PyTables使用这些NumPy容器作为内存缓冲区,以最大化输入输出的带宽。”
那么它的机制是什么呢?PyTables是如何利用NumPy的?最后,它们生成的HDF5文件可以被其他语言访问...
1 个回答
1
HDF5是一个用C语言写的库。HDF5可以以一种不依赖于平台的方式存储数字,包括浮点数(你可以往下滚动到一个叫“本地数据类型及对应C类型”的表格,用户指南里有更多信息)。
PyTables只是把HDF5的数据类型转换成NumPy的数据类型。而且它将Python代码和本地代码混合使用,以减少输入输出的开销。