用应答集编程压缩图
powergrasp的Python项目详细描述
#powergrass
图形压缩。
请注意,这是powergrass的完整重新实现,
利用了asp和python的提升和简化。
对于2017年发布的版本,请参阅[此存储库](https://github.com/aluriak/powergrass-1)。
python-m powergrass--help
对不起,暂时没有技术文档。
描述了一个幂图。
气泡是由[cytoscape 2]的[cyoog插件(http://www.biotec.tu-dresden.de/research/schroeder/powergraphs/download-cytoscape-plugin.html)处理的一种格式(http://cytoscape.org/),允许加载气泡格式的文件并可视化相应的图形。
因此,必须[安装cytoscape 2](http://chianti.ucsd.edu/cyto-2%5f8%5f3/),并将"cyoog.jar"文件放入"path/to/cytoscape/install/dir/plugins/"中。
另一种方法是将气泡转换为处理分层图的其他格式,如[gexf](https://gephi.org/gexf/format/),
[点](https://www.graphviz.org/doc/info/lang.html)或[cytoscape.js]的api(http://js.cytoscape.org/)。
这是一个由[bubble tools]实现的任务(https://github.com/aluriak/bubble tools/)。
值](powergrass/constants.py),
可以被放在工作目录中的"powergrass.cfg"文件覆盖。
可以用stdout打印配置,使用:
config文件可以是ini或json格式,如[`test/powergrass.oneshot.cfg`](test/powergrass.oneshot.cfg)和[`test/powergrass.manyoptions.cfg`](test/powergrass.manyoptions.cfg)所示。
配置允许用户定义powergrass将输出多少文本,
并优化核心压缩和相关优化。
请参阅[选项部分]中的完整列表(选项)。
并检查您是否正在使用python 3。
您的路径中必须有[`clago`](https://potasco.org/doc/start/)。根据您的操作系统,可以通过系统安装,
或通过[下载](https://github.com/potasco/clago/releases)和(编译和)手动安装来完成。
类似于"breakable"或"last"
-8.11
-对非星形biclique基序的略微改进
-统计/计时器现在提供搜索每个基序所需的时间
-支持[配方](配方),这个小文件允许定义要执行的压缩
-8.10
-选项[并行cc压缩](并行cc压缩),以启用连接组件的并行压缩
-选项[气泡嵌入cc](气泡嵌入cc),将每个cc放入专用的powernode
-选项[bubble with simple edges](bubble with simple edges),保留或丢弃输出中的简单边
-时间统计和压缩度量由cc和所有图形计算。请参阅新选项。
-选项[cc statistic file](cc statistic file),检索连接组件的统计信息和度量。
-选项[global statistics](global statistics),计算所有连接组件的统计/度量。
-选项[bubble with statistics](bubble with statistics),将统计和度量包含在输出bubble文件中
-[motif type order](motif type order)选项,允许用户调整搜索motif的顺序。
-[并行motif搜索](并行motif搜索)选项,使motif在不同的线程中搜索,彻底压缩的速度要慢得多。
-cli:--config标记以stdout格式打印完整配置
-处理空间而不是ini格式的字段名
-不要在连接的组件中单独筛选节点(cf[保留单个节点选项](保持单个节点))
-性能增益:压缩达到最佳分数的第一个基序,而不是最后一个基序
-改进统计文件的处理,它现在包含cc idx和motif bounds
-在包中公开`\u version\u`属性
-在自述文件中添加可用选项列表
-图形过滤:当启用
-改进{low,upp}erbounds计算
-8.9
-许多错误修复
-clago_选项可以是dict,将motif name映射到任意参数
-8.8
-错误修复:lowerbound不能低于2(3代表团)
-团搜索:lowerbound最初计算为聚类系数的最大节点数等于1
-使用新版本的clyngor和bubbletools
-8.7
-在配置文件中发现无效键时引发错误
-starsearch专用于查找星,简化了bicliquesearch的工作(默认情况下启用,用户可以使用biclique而不是star和nonstrabiclique)
-为所有(电源)节点指定一个前缀,其中output_node_prefix config field
-使用clago_options config field为clago指定任意选项
-在不需要引号的情况下修复ini文件中给定的字符串选项保留
-8.6
-ini格式的错误修复
-8.5
-现在可以用ini格式给出配置
-改进日志记录
-配置允许内存或CPU之间的优化目标(当前在asp中定义一个约束实现)
-关于asp和多线程参数
-默认情况下没有要写入的统计文件
-输出写入计时器
-配置允许用户定义clago要使用的cpu数量
-通过删除块中无用的参数简化asp代码/4原子
-8.4
-替换asp代码实现更有效接地的约束条件
-配置允许改进双液化气体的低碳化计算
-生成的气泡允许客户端提供标题注释
-在搜索过程中处理键盘中断,并具有宽限性
-实现计时器和统计记录
-默认情况下启用多热点主题搜索
-各种错误修复
[data/recipe test.txt](data/recipe test.txt):
biclique c g h i
biclique a b d e
biclique a b f
biclique c d e
允许指定要搜索的先前基序。
第二列和第三列的顺序没有任何影响。
并允许提供一些选项(用逗号分隔):
-`primer`:允许程序在可能的情况下扩展给定的基序
-`breakable`:允许程序用多个基序压缩行
-`optional`:如果找不到,忽略而不是停止
-`last`:在此处停止压缩(有助于避免压缩过程接管)
配方文件将逐行读取。
应用所有行后,正常压缩将接管
(除非使用"last"选项)。
有关实例,请参见[data/recipe option test.txt](data/recipe option test.txt)。
并且主要是一个调试工具。
转换。
默认值:
show_motif_handling=false
在其他的压缩图案中,以及它们的压缩时间(如果启用了*timers*选项)。
默认值:
示例值:
写入。
数据将为每个连接的组件包含一行,使用以下数据:
-连接组件索引
-转换率
-边缘缩减
-压缩率
-压缩连接组件所需的时间(如果启用计时器)
=无
示例值:
cc_statistic_file=statistics cc.csv
###bubble with statistics
启用时,输出bubble将包含每个连接组件的统计信息
和整个图形(如果启用全局统计信息)。
默认值:
bubble_with_statistics=true
bubble for each step
生成并保存一个bubble图形在每个步骤的表示。
主要用于调试。
默认值:
bubble_for_each_step=false
output node prefix
要添加到输出中所有(电源)节点名称的前缀。
默认值:
output_node_prefix='
showdebug
显示压缩的完整跟踪。对于调试有用。
默认值:
show_debug=false
如果错误,会让motif searcher计算边缘,这可能更快。
默认值:
因子
气泡中的边与因子关联。
默认值:
bubble_poweredge_factor='1.0'
bubble_edge_factor='1.0'
bubble嵌入cc
如果启用,将每个连接的组件放入一个专用的powernode中。
默认值:
bubble嫒u embeddes嫒u cc=no
bubble嫒bubble简化引号
如果可能,请删除气泡中标识符周围的引号。可能导致节点名称冲突。
默认值:
bubble_simplify_quotes=true
bubble with simple edges
如果禁用,将丢弃输出的简单(即非电源)边。
默认值:
bubble_with_simple_edges=true
config file
加载给定配置文件中的选项,如果存在。
默认值:
config_file='powergrass.cfg'
这通常是一个很好的启用选项。
默认值:
multishot_motif_search=true
可能很贵。用2停用。值为n时,最多考虑n个邻居。
默认值:
biclique_lowerbound_maxnei=2
可能已经被其他选项设置了)。
默认值:
为bicliques搜索提供特定配置:
clago戋options={no-star-biclique':'--configuration=handy'}
clago多线程
clago,或0表示CPU的自动检测数。
默认值:
clago_多线程=1
尽可能多地使用可用的CPU:
clago_多线程=0
指定4个线程之间的竞争搜索:
clago_多线程=4,竞争"
并行cc压缩
用于压缩不同进程中连接的组件。
默认值(在内存中优化):
每个连接组件一个过程:
parallel_cc_compression=0
在大型图形上产生良好的性能改进。
默认值:
use懔star懔u motif=true
确定为无法压缩。
默认值:
graph_filtering=true
尽管如此,它还是会被保留。
默认值:
多处理的情况更糟。
parallel_motif_search=false
biclique
也可以指定基于绑定的顺序:
motif_type_order=magest upperbound first
图形压缩。
请注意,这是powergrass的完整重新实现,
利用了asp和python的提升和简化。
对于2017年发布的版本,请参阅[此存储库](https://github.com/aluriak/powergrass-1)。
python-m powergrass--help
对不起,暂时没有技术文档。
描述了一个幂图。
气泡是由[cytoscape 2]的[cyoog插件(http://www.biotec.tu-dresden.de/research/schroeder/powergraphs/download-cytoscape-plugin.html)处理的一种格式(http://cytoscape.org/),允许加载气泡格式的文件并可视化相应的图形。
因此,必须[安装cytoscape 2](http://chianti.ucsd.edu/cyto-2%5f8%5f3/),并将"cyoog.jar"文件放入"path/to/cytoscape/install/dir/plugins/"中。
另一种方法是将气泡转换为处理分层图的其他格式,如[gexf](https://gephi.org/gexf/format/),
[点](https://www.graphviz.org/doc/info/lang.html)或[cytoscape.js]的api(http://js.cytoscape.org/)。
这是一个由[bubble tools]实现的任务(https://github.com/aluriak/bubble tools/)。
值](powergrass/constants.py),
可以被放在工作目录中的"powergrass.cfg"文件覆盖。
可以用stdout打印配置,使用:
config文件可以是ini或json格式,如[`test/powergrass.oneshot.cfg`](test/powergrass.oneshot.cfg)和[`test/powergrass.manyoptions.cfg`](test/powergrass.manyoptions.cfg)所示。
配置允许用户定义powergrass将输出多少文本,
并优化核心压缩和相关优化。
请参阅[选项部分]中的完整列表(选项)。
并检查您是否正在使用python 3。
您的路径中必须有[`clago`](https://potasco.org/doc/start/)。根据您的操作系统,可以通过系统安装,
或通过[下载](https://github.com/potasco/clago/releases)和(编译和)手动安装来完成。
类似于"breakable"或"last"
-8.11
-对非星形biclique基序的略微改进
-统计/计时器现在提供搜索每个基序所需的时间
-支持[配方](配方),这个小文件允许定义要执行的压缩
-8.10
-选项[并行cc压缩](并行cc压缩),以启用连接组件的并行压缩
-选项[气泡嵌入cc](气泡嵌入cc),将每个cc放入专用的powernode
-选项[bubble with simple edges](bubble with simple edges),保留或丢弃输出中的简单边
-时间统计和压缩度量由cc和所有图形计算。请参阅新选项。
-选项[cc statistic file](cc statistic file),检索连接组件的统计信息和度量。
-选项[global statistics](global statistics),计算所有连接组件的统计/度量。
-选项[bubble with statistics](bubble with statistics),将统计和度量包含在输出bubble文件中
-[motif type order](motif type order)选项,允许用户调整搜索motif的顺序。
-[并行motif搜索](并行motif搜索)选项,使motif在不同的线程中搜索,彻底压缩的速度要慢得多。
-cli:--config标记以stdout格式打印完整配置
-处理空间而不是ini格式的字段名
-不要在连接的组件中单独筛选节点(cf[保留单个节点选项](保持单个节点))
-性能增益:压缩达到最佳分数的第一个基序,而不是最后一个基序
-改进统计文件的处理,它现在包含cc idx和motif bounds
-在包中公开`\u version\u`属性
-在自述文件中添加可用选项列表
-图形过滤:当启用
-改进{low,upp}erbounds计算
-8.9
-许多错误修复
-clago_选项可以是dict,将motif name映射到任意参数
-8.8
-错误修复:lowerbound不能低于2(3代表团)
-团搜索:lowerbound最初计算为聚类系数的最大节点数等于1
-使用新版本的clyngor和bubbletools
-8.7
-在配置文件中发现无效键时引发错误
-starsearch专用于查找星,简化了bicliquesearch的工作(默认情况下启用,用户可以使用biclique而不是star和nonstrabiclique)
-为所有(电源)节点指定一个前缀,其中output_node_prefix config field
-使用clago_options config field为clago指定任意选项
-在不需要引号的情况下修复ini文件中给定的字符串选项保留
-8.6
-ini格式的错误修复
-8.5
-现在可以用ini格式给出配置
-改进日志记录
-配置允许内存或CPU之间的优化目标(当前在asp中定义一个约束实现)
-关于asp和多线程参数
-默认情况下没有要写入的统计文件
-输出写入计时器
-配置允许用户定义clago要使用的cpu数量
-通过删除块中无用的参数简化asp代码/4原子
-8.4
-替换asp代码实现更有效接地的约束条件
-配置允许改进双液化气体的低碳化计算
-生成的气泡允许客户端提供标题注释
-在搜索过程中处理键盘中断,并具有宽限性
-实现计时器和统计记录
-默认情况下启用多热点主题搜索
-各种错误修复
[data/recipe test.txt](data/recipe test.txt):
biclique c g h i
biclique a b d e
biclique a b f
biclique c d e
允许指定要搜索的先前基序。
第二列和第三列的顺序没有任何影响。
并允许提供一些选项(用逗号分隔):
-`primer`:允许程序在可能的情况下扩展给定的基序
-`breakable`:允许程序用多个基序压缩行
-`optional`:如果找不到,忽略而不是停止
-`last`:在此处停止压缩(有助于避免压缩过程接管)
配方文件将逐行读取。
应用所有行后,正常压缩将接管
(除非使用"last"选项)。
有关实例,请参见[data/recipe option test.txt](data/recipe option test.txt)。
并且主要是一个调试工具。
转换。
默认值:
show_motif_handling=false
在其他的压缩图案中,以及它们的压缩时间(如果启用了*timers*选项)。
默认值:
示例值:
数据将为每个连接的组件包含一行,使用以下数据:
-连接组件索引
-转换率
-边缘缩减
-压缩率
-压缩连接组件所需的时间(如果启用计时器)
=无
示例值:
cc_statistic_file=statistics cc.csv
###bubble with statistics
启用时,输出bubble将包含每个连接组件的统计信息
和整个图形(如果启用全局统计信息)。
默认值:
bubble_with_statistics=true
bubble for each step
生成并保存一个bubble图形在每个步骤的表示。
主要用于调试。
默认值:
bubble_for_each_step=false
output node prefix
要添加到输出中所有(电源)节点名称的前缀。
默认值:
output_node_prefix='
showdebug
显示压缩的完整跟踪。对于调试有用。
默认值:
show_debug=false
如果错误,会让motif searcher计算边缘,这可能更快。
默认值:
因子
气泡中的边与因子关联。
默认值:
bubble_poweredge_factor='1.0'
bubble_edge_factor='1.0'
bubble嵌入cc
如果启用,将每个连接的组件放入一个专用的powernode中。
默认值:
bubble嫒u embeddes嫒u cc=no
bubble嫒bubble简化引号
如果可能,请删除气泡中标识符周围的引号。可能导致节点名称冲突。
默认值:
bubble_simplify_quotes=true
bubble with simple edges
如果禁用,将丢弃输出的简单(即非电源)边。
默认值:
bubble_with_simple_edges=true
config file
加载给定配置文件中的选项,如果存在。
默认值:
config_file='powergrass.cfg'
这通常是一个很好的启用选项。
默认值:
multishot_motif_search=true
可能很贵。用2停用。值为n时,最多考虑n个邻居。
默认值:
biclique_lowerbound_maxnei=2
可能已经被其他选项设置了)。
默认值:
为bicliques搜索提供特定配置:
clago戋options={no-star-biclique':'--configuration=handy'}
clago多线程
clago,或0表示CPU的自动检测数。
默认值:
clago_多线程=1
尽可能多地使用可用的CPU:
clago_多线程=0
指定4个线程之间的竞争搜索:
clago_多线程=4,竞争"
并行cc压缩
用于压缩不同进程中连接的组件。
默认值(在内存中优化):
每个连接组件一个过程:
parallel_cc_compression=0
在大型图形上产生良好的性能改进。
默认值:
use懔star懔u motif=true
确定为无法压缩。
默认值:
graph_filtering=true
尽管如此,它还是会被保留。
默认值:
多处理的情况更糟。
parallel_motif_search=false
biclique
也可以指定基于绑定的顺序:
motif_type_order=magest upperbound first