我想获取SWISS-PROT-ID
字段的所有非nan id以及idx_filter
字段的True
值。我还有很多其他方法可以考虑这样做,但在处理数据帧中更复杂的查询时,我遇到了这种反射。你知道吗
有没有办法query
将这些类型的名称用作列的数据帧?
data = {'BLATTNER-ID': {'G0-16600': 'b4714', 'G6866': 'b1615', 'G0-10751': 'b4712', 'G0-10752': 'b4713', 'G6335': 'b0608', 'G6177': 'b0307', 'G0-8892': 'b4599', 'G0-10596': 'b4605', 'EG12861': 'b1915', 'EG12303': 'b1100'}, 'NAME': {'G0-16600': 'ralA', 'G6866': 'uidC', 'G0-10751': 'agrA', 'G0-10752': 'agrB', 'G6335': 'ybdR', 'G6177': 'ykgF', 'G0-8892': 'yneM', 'G0-10596': 'ypaB', 'EG12861': 'yecF', 'EG12303': 'ycfH'}, 'SWISS-PROT-ID': {'G0-16600': np.nan, 'G6866': 'Q47706', 'G0-10751': np.nan, 'G0-10752': np.nan, 'G6335': 'P77316', 'G6177': 'P77536', 'G0-8892': 'A5A616', 'G0-10596': np.nan, 'EG12861': 'P0AD07', 'EG12303': 'P0AFQ7'}, 'idx_filter': {'G0-16600': False, 'G6866': True, 'G0-10751': False, 'G0-10752': False, 'G6335': True, 'G6177': False, 'G0-8892': False, 'G0-10596': True, 'EG12861': False, 'EG12303': False}}
df = pd.DataFrame(data)
# 1st tried this
df.query("SWISS-PROT-ID and idx_filter").index
# UndefinedVariableError: name 'SWISS' is not defined
# 2nd tried escape characters
df.query("SWISS\-PROT\-ID and idx_filter").index
# UndefinedVariableError: name 'SWISS' is not defined
# Expecting
# ["G6335","G6866"]
版本:
pandas: 0.22.0 # I don't want to upgrade b/c there is a serious bug in 0.23.0 that breaks one of my programs
python: 3.6.4 |Anaconda, Inc.| (default, Jan 16 2018, 12:04:33)
[GCC 4.2.1 Compatible Clang 4.0.1 (tags/RELEASE_401/final)]
不幸的是,} (a1}支持算术运算,因此列名中不允许使用这些运算符),因此没有一个解决方案来获得所需的结果。你知道吗
query
使用了^{你有几个选择。首先,您可以简单地将破折号替换为其他内容,例如下划线:
或者你可以简单地根据你的情况建立索引:
两者都产生(尽管其中一个已重命名列):
相关问题 更多 >
编程相关推荐