i-输入:输入单细胞rna测序数据的一致策略
i-impute的Python项目详细描述
i-输入:输入单细胞rna测序数据的连贯策略
i-impute是一种连贯的方法来输入scrna序列数据。i-impute利用连续的相似性和丢失概率,并迭代地优化数据,使最终输出自一致。i-插补具有较强的插补能力,并遵循一致性原则。它为揭示真实的scrna序列数据中潜在的细胞亚型提供了敏锐的洞察力。
先决条件
- Python3
- numpy=1.16.1
- 熊猫>;=0.23.4,<;0.24
- scipy=1.3.0
- scikit学习>;=0.21.1
- 任务记录器=0.4.0
安装要求
pip install -r requirements.txt
安装
安装PIP
要使用PIP进行安装,请从终端运行以下命令:
pip install i-impute
从github安装
要克隆存储库并手动安装,请从终端运行以下命令:
git clone https://github.com/xikanfeng2/I-Impute.git
cd I-Impute
python setup.py install
用法
快速启动
下面的代码对i-impute存储库中的模拟数据运行magic。
importiimputeimportpandasaspd# read your reads count or RPKM or TPM datadata=pd.read_csv('simluation-data/sim-counts.csv',index_col=0)# create I-Impute objectiimpute_operator=iimpute.IImpute(normalize=False)# imputeimputed_data=iimpute_operator.impute(data)# store result to a fileimputed_data.to_csv('your file name')# iterative modeiimpute_operator=iimpute.IImpute(normalize=False,iteration=True)# imputeimputed_data=iimpute_operator.impute(data)# store result to a fileimputed_data.to_csv('your file name')
参数
IImpute(n=20,c_drop=0.5,p_pca=0.4,alpha=0.01,normalize=True,iteration=False,verbose=1)
参数
n:int,可选,默认值:20
计算亲和矩阵时,要在其上建立核的最近邻的第n个。
c_drop:浮点,可选,默认值:0.5
退出事件截止。对于退出概率小于c_drop的条目,我们认为它是一个真实的观测值,它的原始值将保持不变。否则,我们会借助类似细胞的信息进行插补。
p_pca:float,可选,默认值:0.4
由主成分分析的选定成分解释的方差百分比。它确定用于计算单元之间距离的PC数量。
alpha:float,可选,默认值:0.01
套索回归的L1惩罚。
规格化:布尔值,可选,默认值:真
默认情况下,i-impute接受非标准化矩阵,并在去噪步骤中执行库大小标准化。但是,如果数据已经规范化或不需要规范化,则可以将normalize设置为false。
迭代:布尔型,可选,默认值:false
插补过程仅在错误时执行一次(相当于本文中描述的c-插补)。插补过程将迭代n次,得到自便秘插补矩阵。
详细:
int
或boolean
,可选,默认值:1如果
True
或> 0
,则打印状态消息
引用我们
待定
帮助
如果您有任何问题或需要使用i-impute的帮助,请与xikanfeng2@gmail.com联系。