字符数超过单元格限制或存储可变长度列表时出现问题

import csv import pandas as pd import math import numpy as np #Import list of tissues: df = pd.read_csv(r'E-MTAB-5214-query-results.tsv', skiprows = [0,1,2,3], sep='\t') tissuedict=df.to_dict() tissuelist = list(tissuedict.keys())[2:] all_genes = [gene for key,gene in tissuedict['Gene Name'].items()] data = [] for tissue in tissuelist: #Create array to keep track of the protein mRnaS in tissue that are not present in the network #initiate with first tissue, protein nanInd = [key for key,value in tissuedict[tissue].items() if math.isnan(value)] tissueExpression = np.delete(all_genes, nanInd) datatis = [tissue, tissueExpression.tolist()] print(datatis) data.append(datatis) print(data) df = pd.DataFrame(data) df.to_csv(r'tissue_expression_data.csv')

2条回答

网友

1楼 · 编辑于 2024-06-02 07:22:06

你需要在每个组织中找到的基因名的列表。这会将这些列表作为列写入csv：

import pandas as pd

df = pd.read_csv('E-MTAB-5214-query-results.tsv', skiprows = [0,1,2,3], sep='\t')
df = df.drop(columns='Gene ID').set_index('Gene Name')

res = pd.DataFrame()
for c in df.columns:
    res = pd.concat([res, pd.Series(df[c].dropna().index, name=c)], axis=1)

res.to_csv('E-MTAB-5214-query-results.csv', index=False)

（将它们写成行会更容易，但Excel无法导入这么多列）不要直接在Excel中打开csv，而是使用空白工作表并导入csv（数据-外部数据，来自文本），否则不能在一次运行中将它们分离到Excel列中（至少在Excel 2010中是这样）。你知道吗

网友

2楼 · 编辑于 2024-06-02 07:22:06

创建data变量作为字典您可以使用json.dump文件refer here

import json

data = {}
for tissue in tissuelist:
    nanInd = [key for key,value in tissuedict[tissue].items() if math.isnan(value)]
    tissueExpression = np.delete(all_genes, nanInd)
    data[tissue] =  tissueExpression.tolist()

with open('filename.json', 'w') as fp:
    json.dump(data, fp)

相关问题更多 >

编程相关推荐

热门问题

热门文章