python库解析流感传播注释

flupan的Python项目详细描述


flupan
==
python库解析流感传播注释。

这些生长条件被记录为速记传递注释。然而,这些段落往往不一致,不容易机器阅读。此库接受单个段落历史字符串(例如m1_s3)并返回包含其解释的对象。

[Github回购项目](https://github.com/claus wilke/flupan)



一轮又一轮的通过。m为mdck细胞,3为传代3次。

-这些部分串在一起形成完整的历史,例如m1_s2。该菌株在mdck细胞中传代一次,然后在siat1细胞中传代两次。

-a"/"在s1/s1中可能意味着该菌株被转移到不同的实验室并重新鉴定。

-a"+"如s2+3所示,可能意味着在某种类型的断裂后,在先前的条件下对应变进行了重新取样。在s2+3中,菌株最初在siat1细胞中传代两次,之后在siat1细胞中传代三次。





/>易于安装flupan
```
或者,flupan也可以从源安装。

``bash
git clone https://github.com/clauswilke/flupan.git
cd flupan
python setup.py install
udo]python setup.py test
```

如果您发现任何问题,请在"问题"选项卡下提交,我们将添加它们。或者,特殊情况可以本地附加到段落查找表中(请参阅下面的"自定义段落注释"部分):[https://github.com/clauswilke/flupan/issues](https://github.com/clauswilke/flupan/issues)



flupan

>;p p=flupan.passageparser()创建passageparser对象
>;p=pp.parse謺passage("m1")謺parse annotation"m1"
>;p.summary謺文章解释的快速摘要

['m1'、'm1'、'cell'、'mdck'、'exactly'、'1']pp.解析"e 1/m3",4)
>;p.原始输入通道
e 1/mdck3

>;p.普通格式;输入通道大写,删除特殊字符r/>和公共段落id被缩短
此步骤目前对于公共注释很有用,但对于解析不常见或格式怪异的段落,可能会返回无意义的结果
e1 m3

>;p.顺序段落
["e1","m3"]

>;p.常规段落攻击通道类型的大类别
["egg","caninecell"]

>;p.特定通道;通道类型的更特定类别(如果已知)
["egg","mdck"]

>;p.总通道;总通道,如果可以确定
4



>;gt;p.min嫒u passages嫒至少出现了这么多轮(对于没有注释轮数的通道id有用)
4


>;p.passages嫒u series嫒a ordered list of each round of passages
[[1'egg',[2,'mdck',[3,'mdck',[4'mdck']


>;p.summary段落特征列表
['e 1/mdck3","e_u 1_mdck3,""e1_m 3,""鸡蛋+卡尼塞尔,""鸡蛋+mdck,""正好,""4"]
1.原始输入,2.标准化输入,3.强制格式输入,4。一般通道类型,5.特定通道类型,6.段落数量限定符,7。段落数


````


显示此帮助消息并退出
-f infile,--infile infile
a通道id文件,例如m1 s4,每行一个
-p通道,--通道
要解析的单个通道id,例如e4
-o outfile,--outfile outfile
存储输出的输出文件

例如
``bash
$translate撸passage-p'm2+rhmk1'
m2+rhmk1,m2撸rhmk1,m2撸r1,caninecell+monkeycell,mdck+rhmk,准确地说,

```

鉴于先前通道类型的同一性,例如,MDCK3+2被解释为在通道类型之后经过5个MDCK通道














《犬类动物通道》

-siat-passage=["siat","s","mdcksiat"]
-mdck-passage=["mdck","m","mk"]
-unknownowncell-passage=["c","x"]

<
《世界动物通道》=["c","x"]



















-rhmk=["rhmk","r mk","r","prhmk","rii"]
-tmk=["tmk"]
-vero=["vero","v"]
-vero=["vero","v"]
-vero=["vero","v"]
-verg=["vero","v"]
-eg卵=["al","尿囊","卵","e","e","am","羊膜"]

"《猪血细胞通道》
-pthyr=["pthyr"]

-pthyr=["pthyr"]

<<<鸡细胞传代]
<
<<
-未知=["未知","p","nc"]

caninecell=siat+mdck

monkeycell=rhmk+tmk+vero

所有细胞=犬细胞+单核细胞+未知细胞+鸡细胞+rmix+minkcell

所有细胞通道=犬细胞+单核细胞+卵细胞+未知细胞+猪细胞+未知细胞+鸡细胞+rmix+minkcell

如果在flupan数据库中观察到或无法解析,则会给出空注释。

添加自定义批注有两种方法:

1。可以将自定义注释添加到非标准的"通道"input.txt,然后运行generate"通道"table.py。这将向passion_lookup.txt添加附加自定义注释

2。直接添加到passage\u lookup.txt。警告:运行generate_passage_table.py将覆盖直接对passage_lookup.txt所做的任何更改。

3.可以将自定义段落类别添加到generate_passage_table.py脚本中,以便从头生成段落注释


自定义段落注释应以以下格式每行编写1个:


passage,general_type,specific_type,number_rounds
例如mdck3,caninecell,mdck,3



flupan中使用的表存储在src/tables

passage_lookup.txt:运行generate_passage_table.py生成的查找表。生成的段落注释、非标准段落注释和未知段落注释的连接。flupan要求。

nonstandard_passage s_input.txt:自定义段落注释表


unknown_passages_input.txt:不可解释的段落ID表。


converte_format.txt:flupan所需的段落关键字和简化版本表(如SIAT S)










欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
c#Java Tcp服务器和。Net Tcp客户端的发送和接收问题   安卓应用程序上的java标记地理位置,其位置位于我周围5Km半径范围内。   向java添加对话框并检索html文件   当eclipse甚至无法打开时,java会在eclipse中更改不兼容的JVM   java中同一jframe中的jlabel和paintComponent   基于另一数组排序的java排序   java AADSTS7000012:该补助金是为另一个租户获得的   java在JSF中使用foreach循环   java如何通过maven为运行junit测试创建运行配置?   java Selenium webDriver不稳定错误堆栈跟踪   java有没有办法创建以键为大写的JSON对象?