使用注释(第一行)和(第一列)操作编码为二维矩阵的数据集

matricks的Python项目详细描述


用于导入和查询作为列组织的表达式数据集的类- 行注释矩阵。

表达式数据集包含一个或多个示例的数值结果 来源于微阵列分析。每个分析的共同点是 特定平台(微阵列)。数据集可以看作是一个表 有行和列。每一列代表一个分析,每一行 包含分析平台上特定探针的分析结果。因此, 任何给定行中的值都是从同一探针位置获得的值 在站台上。它们被称为表达式配置文件。

数据集可以看作是一个表,例如这个表:

probe_idHSC 1HSC 2NK 1NK 2
4528310.149.318.98.78
4528412.5212.6312.5511.96
452856.786.917.837.86
452865.585.066.696.64
452877.858.138.478.56
452888.127.178.718.08
452896.826.155.875.32
4529010.5510.3910.79.93

表达式数据集(很少例外)存储在文本(即平面)文件中 格式如下:

  • 两行或多行数据,由ascii换行符(\x0a)分隔。 (严格来说,根本不需要任何数据,但这又有什么意义呢?)
  • 每一行或每一行由两列或多列数据组成,由ascii制表符(\x09)分隔。
  • 第一列包含键或探测id,假定为字母数字,或用于探测。
  • 第一行由标识探测ID和样本列的标签组成。这也是假设 是字母数字。
  • 第二行到最后一行包含表达式值,除了第一列之外,还有 包含探测ID,假定为浮点数。用微阵列的说法, 每一行通常称为表达式配置文件。

某些数据集可能与此格式不同。例如,可能没有(第一)行标签, 或者数据的格式可能不是浮点。为处理这些 可以说是特殊情况。但是,实例化矩阵类的默认设置 对原始源数据的内容进行上述假设。进一步假设 源数据集以ascii字符串编码,需要转换所有数字数据 到float类型对象。

矩阵选择操作通常返回矩阵对象。这些可以重复, 与列表或元组非常类似,按行访问单个表达式配置文件,其中的内容 可以使用列表/元组语义检索。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
实现接口方法时不允许java@Override   使用BuffereImage加载映像时java高ram使用率   java For循环混乱,为什么不是循环?   java Android网格视图字符串对齐问题   java如何将方法与比较类型的附加功能进行比较?   在Java Swing中放置JSepator后的间隙大小   java如何避免并发访问我的网站中的支付链接   java如何从现有的Unix服务器连接到FTP服务器?   Spring中的java用户相关bean定义   带有scribesjava库的wordpress Woocommerce REST API返回消费者密钥参数缺失错误消息   java我可以自动检测特定设备连接的串行端口吗?   Javafx棋盘游戏   java使用JTextPane显示HTML,支持SVG吗?   SpringBoot如何在java中将映射转换为实体对象?   如何使用java代码对xls文件进行密码保护   Java JPA(EclipseLink)如何在持久化实际实体之前接收下一个生成的值?   Javaservlet启动外部进程