情感分析服务器实现。设计为可扩展的,因此可以使用新的算法和源。
docon的Python项目详细描述
![GSI logo](http://gsi.dit.upm.es/templates/jgsi/images/logo.png)
[docon](http://demos.gsi.dit.upm.es/docon)
========
简介
----
此工具将采用多种输入格式并将其转换为语义格式。它的重点是将语料库转换为nif+[marl]格式(http://gsi.dit.upm.es/ontologies/marl),使用json-ld。
docon正在大力开发中。在撰写本文时,它支持:
*创建和管理翻译模板(管理级)
*编辑模板以将传统格式(csv、tsv、xls、xml)转换为nif+marl+onyx。
*使用可用模板通过此门户或通过post请求转换已知格式
*保存或输出result
*http-api
*logging translation requests
*根据输入格式自动选择最佳模板
在未来,我们可能包括以下功能:
*语义格式的转换
*语义格式之间的自动转换(例如,[rdf](http://www.w3.org/rdf/)到[json-ld](http://json ld.org/)
翻译文档可以通过Web界面、rest界面或命令行进行翻译。
*输入(i):要翻译的原始文件
*informat(f):原始文件的格式
*intype(t)[可选]用法:
*直接(默认值)
*url
*文件
*输出格式(o):
*json ld
*rdfxml
*turtle(默认值,符合nif)
*ntriples
*trix
*基uri(u)[可选]:用于语料库的基uri
*前缀(p)[可选]:替换基uri的前缀
*语言(l)[选项aL]:语言代码(见DC:Terms and[ISO 639](http://en.wikipedia.org/wiki/list_of_ISO_-1_codes))
*模板(T)[可选]:要使用的模板的ID。如果省略,将使用从in format转换为outformat的模板,或从informat转换为其他格式的模板(例如json ld),并自动转换(*待完成*)。
*to file[可选]:结果是应在响应中发送(默认)还是应写入文件。为了方便起见,在使用web表单时,此值默认为false。
使用命令行工具*curl*时,可以发出如下请求:
http://demos.gsi.dit.upm.es/docon/process
>;result.jsonld
-------
Docon模板是具有语法糖、自定义首选项和处理不同文档类型的函数的自定义Jinja2模板。
例如,这是一个模板,它将CSV文件中的每个单元格打印在单独的行中,在行之间添加虚线:
{%set file=open_file(informat="csv",delimiter=',')%}
{%for row in file%}
{%forrow%}
{{{{{item.strip()}
{%endfor%}
{{{'--"if not loop.last}
{%endfor%}
这是使用Jinja的行表达式的同一模板的另一种更干净的形式:
%set file=open_file(informat="csv",delimiter=',')
%对于文件中的行
%on-i<;要转换的文件>;--template<;conversion template>;-o<;output>;
如果不想安装包,也可以像普通的python模块一样运行它:
python-m docon.cli-i<;要转换的文件>;--template<;conversion template>;-o<;output>;
从这个存储库中。
要从源代码安装它,请执行以下步骤:
*将docon/settings-private.py.template复制到docon/settings private.py
*将数据库信息添加到settings.py
*创建一个virtualenv(最好是在项目根目录中)
*安装所需的软件包:
``
pip install-r requirements.txt
`````
*使用以下命令测试环境:
`````
python manage.py runserver localhost:<;port>;
````
如果独立服务器工作正常,可以尝试通过apache/nginx和wsgi为门户提供服务。已经用apache2和uwsgi进行了测试。在这种情况下,您还需要提供来自web服务器的静态文件。apache2的一个示例配置是:
```
<;virtualhost*:80>;
[.]
wsgiscriptalias/docon/path_to_docon/wsgi.py
wsgidaemonprocess docon user=www data group=www data processes=nprocess threads=nthreads python path=/path_to_docon:/path_to_docon/venv/lib/python2.7/site packages
wsgiprocessgroup docon
<;directory/path_to_docon>;
订单允许,拒绝
全部允许
<;目录>;
alias/docon/robots.txt/path_to_docon/static/robots.txt
alias/docon/favicon.ico/path_to_docon/static/favicon.ico
aliasmatch^docon/([^/]*\.css)/path_to_docon/static/styles/$1
alias/docon/media//path_docon/media/
alias/docon/static//path_to_docon/static/
<;directory/path_to_docon/static>;
订单拒绝,允许
allow from all
选项-索引
<;directory>;
<;directory/path_to_docon/media>;
订单拒绝,允许
允许所有选项-索引
<;/目录>;
<;/虚拟主机>;
`````
确认
----
欧洲情感项目
授予协议编号:296277
开始日期:2012年9月1日
项目工期N:24个月
![欧洲情感标志](logo_grande.png)
![FP7徽标](logo_fp7.gif)
[docon](http://demos.gsi.dit.upm.es/docon)
========
简介
----
此工具将采用多种输入格式并将其转换为语义格式。它的重点是将语料库转换为nif+[marl]格式(http://gsi.dit.upm.es/ontologies/marl),使用json-ld。
docon正在大力开发中。在撰写本文时,它支持:
*创建和管理翻译模板(管理级)
*编辑模板以将传统格式(csv、tsv、xls、xml)转换为nif+marl+onyx。
*使用可用模板通过此门户或通过post请求转换已知格式
*保存或输出result
*http-api
*logging translation requests
*根据输入格式自动选择最佳模板
在未来,我们可能包括以下功能:
*语义格式的转换
*语义格式之间的自动转换(例如,[rdf](http://www.w3.org/rdf/)到[json-ld](http://json ld.org/)
翻译文档可以通过Web界面、rest界面或命令行进行翻译。
*输入(i):要翻译的原始文件
*informat(f):原始文件的格式
*intype(t)[可选]用法:
*直接(默认值)
*url
*文件
*输出格式(o):
*json ld
*rdfxml
*turtle(默认值,符合nif)
*ntriples
*trix
*基uri(u)[可选]:用于语料库的基uri
*前缀(p)[可选]:替换基uri的前缀
*语言(l)[选项aL]:语言代码(见DC:Terms and[ISO 639](http://en.wikipedia.org/wiki/list_of_ISO_-1_codes))
*模板(T)[可选]:要使用的模板的ID。如果省略,将使用从in format转换为outformat的模板,或从informat转换为其他格式的模板(例如json ld),并自动转换(*待完成*)。
*to file[可选]:结果是应在响应中发送(默认)还是应写入文件。为了方便起见,在使用web表单时,此值默认为false。
使用命令行工具*curl*时,可以发出如下请求:
>;result.jsonld
Docon模板是具有语法糖、自定义首选项和处理不同文档类型的函数的自定义Jinja2模板。
例如,这是一个模板,它将CSV文件中的每个单元格打印在单独的行中,在行之间添加虚线:
{%set file=open_file(informat="csv",delimiter=',')%}
{%for row in file%}
{%forrow%}
{{{{{item.strip()}
{%endfor%}
{{{'--"if not loop.last}
{%endfor%}
这是使用Jinja的行表达式的同一模板的另一种更干净的形式:
%set file=open_file(informat="csv",delimiter=',')
%对于文件中的行
%on-i<;要转换的文件>;--template<;conversion template>;-o<;output>;
如果不想安装包,也可以像普通的python模块一样运行它:
python-m docon.cli-i<;要转换的文件>;--template<;conversion template>;-o<;output>;
从这个存储库中。
要从源代码安装它,请执行以下步骤:
*将docon/settings-private.py.template复制到docon/settings private.py
*将数据库信息添加到settings.py
*创建一个virtualenv(最好是在项目根目录中)
*安装所需的软件包:
``
pip install-r requirements.txt
`````
*使用以下命令测试环境:
`````
python manage.py runserver localhost:<;port>;
````
如果独立服务器工作正常,可以尝试通过apache/nginx和wsgi为门户提供服务。已经用apache2和uwsgi进行了测试。在这种情况下,您还需要提供来自web服务器的静态文件。apache2的一个示例配置是:
```
<;virtualhost*:80>;
[.]
wsgiscriptalias/docon/path_to_docon/wsgi.py
wsgidaemonprocess docon user=www data group=www data processes=nprocess threads=nthreads python path=/path_to_docon:/path_to_docon/venv/lib/python2.7/site packages
wsgiprocessgroup docon
<;directory/path_to_docon>;
订单允许,拒绝
全部允许
<;目录>;
alias/docon/robots.txt/path_to_docon/static/robots.txt
alias/docon/favicon.ico/path_to_docon/static/favicon.ico
aliasmatch^docon/([^/]*\.css)/path_to_docon/static/styles/$1
alias/docon/media//path_docon/media/
alias/docon/static//path_to_docon/static/
<;directory/path_to_docon/static>;
订单拒绝,允许
allow from all
选项-索引
<;directory>;
<;directory/path_to_docon/media>;
订单拒绝,允许
允许所有选项-索引
<;/目录>;
<;/虚拟主机>;
`````
确认
----
欧洲情感项目
授予协议编号:296277
开始日期:2012年9月1日
项目工期N:24个月
![欧洲情感标志](logo_grande.png)
![FP7徽标](logo_fp7.gif)