i-输入:输入单细胞rna测序数据的一致策略

i-impute的Python项目详细描述


i-输入:输入单细胞rna测序数据的连贯策略

i-impute是一种连贯的方法来输入scrna序列数据。i-impute利用连续的相似性和丢失概率,并迭代地优化数据,使最终输出自一致。i-插补具有较强的插补能力,并遵循一致性原则。它为揭示真实的scrna序列数据中潜在的细胞亚型提供了敏锐的洞察力。

先决条件

  • Python3
  • numpy=1.16.1
  • 熊猫>;=0.23.4,<;0.24
  • scipy=1.3.0
  • scikit学习>;=0.21.1
  • 任务记录器=0.4.0

安装要求

pip install -r requirements.txt

安装

安装PIP

要使用PIP进行安装,请从终端运行以下命令:

pip install i-impute

从github安装

要克隆存储库并手动安装,请从终端运行以下命令:

git clone https://github.com/xikanfeng2/I-Impute.git
cd I-Impute
python setup.py install

用法

快速启动

下面的代码对i-impute存储库中的模拟数据运行magic。

importiimputeimportpandasaspd# read your reads count or RPKM or TPM datadata=pd.read_csv('simluation-data/sim-counts.csv',index_col=0)# create I-Impute objectiimpute_operator=iimpute.IImpute(normalize=False)# imputeimputed_data=iimpute_operator.impute(data)# store result to a fileimputed_data.to_csv('your file name')# iterative modeiimpute_operator=iimpute.IImpute(normalize=False,iteration=True)# imputeimputed_data=iimpute_operator.impute(data)# store result to a fileimputed_data.to_csv('your file name')

参数

IImpute(n=20,c_drop=0.5,p_pca=0.4,alpha=0.01,normalize=True,iteration=False,verbose=1)

参数

  • n:int,可选,默认值:20

    计算亲和矩阵时,要在其上建立核的最近邻的第n个。

  • c_drop:浮点,可选,默认值:0.5

    退出事件截止。对于退出概率小于c_drop的条目,我们认为它是一个真实的观测值,它的原始值将保持不变。否则,我们会借助类似细胞的信息进行插补。

  • p_pca:float,可选,默认值:0.4

    由主成分分析的选定成分解释的方差百分比。它确定用于计算单元之间距离的PC数量。

  • alpha:float,可选,默认值:0.01

    套索回归的L1惩罚。

  • 规格化:布尔值,可选,默认值:真

    默认情况下,i-impute接受非标准化矩阵,并在去噪步骤中执行库大小标准化。但是,如果数据已经规范化或不需要规范化,则可以将normalize设置为false。

  • 迭代:布尔型,可选,默认值:false

    插补过程仅在错误时执行一次(相当于本文中描述的c-插补)。插补过程将迭代n次,得到自便秘插补矩阵。

  • 详细:intboolean,可选,默认值:1

    如果True> 0,则打印状态消息

引用我们

待定

帮助

如果您有任何问题或需要使用i-impute的帮助,请与xikanfeng2@gmail.com联系。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在Android应用程序中处理新活动时出现java NullPointerException   从PSV文件读取Java   在JavaSwing中将方法从一个类传递到另一个类   带有MongoDB错误的java Vertx ClassNotFoundException:com。mongodb。联系溪流工厂   在java中替换2D数组中的数字?   java Avro方案空布尔和双整数布尔的写并集   java导入组织。neo4j无法解决?   从另一个获取变量。使用反射的java文件   Java:以格式化字符串的形式返回具有非常不同的条目长度的2D数组   java客户端应用程序正在从IBMMQ接收不同格式的消息体   java在我的主循环中的步骤有问题   java如何正确安装来自sslforfree的证书。tomcat服务器上的com   java RecyclerView变更单永久   java如何获得屏幕的精确中间位置,即使调整了大小