使用流行的度量标准(如flesch kincaid、gunning fog、ari、dale chall、smog等)为文本“可读性”评分

py-readability-metrics的Python项目详细描述


py可读性指标

Travis BuildPythonDocumentation StatuswheelMIT license

使用流行的可读性度量为文本的readability评分,这些度量包括:Flesch Kincaid Grade LevelFlesch Reading EaseGunning Fog IndexDale Chall ReadabilityAutomated Readability Index (ARI)Coleman Liau IndexLinsear WriteSMOG

安装

pip install py-readability-metrics
python -m nltk.downloader punkt

用法

fromreadabilityimportReadabilityr=Readability(text)r.flesch_kincaid()r.flesch()r.gunning_fog()r.coleman_liau()r.dale_chall()r.ari()r.linsear_write()r.smog()

*注意:text必须包含>;=100个单词*

支持的指标

可读性度量详细信息和属性

所有度量都提供一个score属性。独立度量为提高可解释性提供了额外的属性。请参阅下面的详细信息以捕获每个度量的详细信息。

注意:在下面的所有示例中r是:

r=Readability(text)

Flesch Kincaid等级

美国陆军使用Flesch Kincaid等级来评估技术手册的难度。宾夕法尼亚州联邦使用弗莱施-金凯等级对汽车保险单进行评分,以确保其文本不高于九级阅读难度。许多其他的美国州也使用flesch-kincaid等级来评分其他法律文件,如商业政策和财务表格。

调用:

r.flesch_kincaid()

示例:

fk=r.flesch_kincaid()print(fk.score)print(fk.grade_level)

弗莱希阅读便利

美国国防部使用阅读简易性测试作为其文件和表格可读性的标准测试。弗罗里达州要求人寿保险单的Flesch Reading Ease评分为45或更高。

调用:

r.flesch()

示例:

f=r.flesch()print(f.score)print(f.ease)print(f.grade_levels)

戴尔·查尔可读性

dale-chall公式是一个精确的可读性公式,原因很简单,它是基于使用熟悉的单词,而不是音节或字母计数。阅读测试表明,如果读者发现文章中的单词很熟悉,他们通常会发现阅读、处理和回忆起来更容易。

调用:

r.dale_chall()

示例:

dc=dale_chall()print(dc.score)print(dc.grade_levels)

自动可读性索引(ARI)

与其他索引不同,ari和coleman liau依赖于每个单词的字符数,而不是通常的每个单词的音节数。ari广泛应用于各种文本。

调用:

r.ari()

示例:

ari=r.ari()print(ari.score)print(ari.grade_levels)print(ari.ages)

coleman liau指数

coleman-liau公式在应用于技术文档时,通常给出的等级值低于任何kincaid、ari和flesch值。

调用:

r.coleman_liau()

示例:

cl=r.coleman_liau()print(cl.score)print(cl.grade_level)

喷枪雾

《炮雾索引》衡量英语写作的可读性。该指数估计了一读课文所需的正规教育年限。雾指数为12需要美国高中生(18岁左右)的阅读水平。

调用:

r.gunning_fog()

示例:

gf=r.gunning_fog()print(gf.score)print(gf.grade_level)

烟雾

烟雾可读性公式(gobbledygook的简单度量)是一种常用的健康素养材料的方法。

调用:

r.smog()

示例:

s=r.smog()print(s.score)print(s.grade_level)

Linsear写入

linsear write是英文文本的可读性度量,据称是为美国空军开发的,用于帮助他们计算技术手册的可读性。

调用:

r.linsear_write()

示例:

lw=r.linsear_write()print(lw.score)print(lw.grade_level)

Contributing

欢迎投稿!

参考文献


热门话题
html Java spring框架:应用程序上下文不会设置属性   java如何保持已通过电话登录的用户登录   基于LWJGL的二维矩形图像java旋转   java如何将这些图像图标调整到我的棋盘格?   java如何在play框架中禁用http端口?   使用spring4@Transactional时,java事务不起作用   java堆栈由编译器或OS/体系结构创建   用vbscript杀死Java进程   java如何使用ApacheSparkML和两列文本作为特性来训练逻辑回归?   Tomcat上的java ElasticSearch节点客户端无法读取请求数据   java访问SharedReference在Android中不起作用   java流式处理使用springdatamongodb的聚合操作的结果   电子邮件javax。邮政AuthenticationFailedException Java邮件