从新闻文章中提取要点

smrzr的Python项目详细描述


摘要生成器返回文档中最相关的句子。


install-r requirements.txt
python setup.py install--record installed廑files.txt
`````

廑usage

```python
import smrzr
url="http://swaminomics.org/can-congress-bounce-back-from-no-3/"
``````

摘要生成器类

``python
article=smrzr.summary生成器(url)
`````

您还可以使用可选的"num_句子"(默认值为4)指定句子数或指定"fmt"(默认值为"default")。默认的提取器是[goose](https://github.com/grangier/python-goose),它在大多数网站上都非常有效。您还可以指定一个自定义提取器。

article对象已填充了一些属性,

``python
>;>;print article.text提取器返回的原始文本已在大选中失败,上周在马哈拉施特拉邦和哈里亚纳邦举行的州选举中,国会能否重振雄风?如果是,怎么做,为什么?\ n在过去,国会经常在大败之后被取消,但又反弹回来。然而,我们可能已经进入了一个新的阶段。国会能够从过去可怕的崩溃中恢复过来,只要它仍然是第二大党,无论是在州内还是在全国选举中。原因很简单。在所有民主国家中,现任者往往会失败,特别是在一个以上任期之后。因此,即使国会州政府表现糟糕,被选民赶下台,它也可能希望新政府在几年后也会面临反在职,并被投票淘汰。在这场比赛中,国会在反对时不必做任何引人注目的事情。它可能只是等待时机,等待对手犯错并受到反在职的打击。\n\n但这种策略在几个州将不再奏效。无论国会在一个州的地位滑落到第三或第四位,反在任都有利于第二党,让第三党处于冷场。国会在任何一个已跌至第三位的州都无法恢复元气。\n\n这首先发生在泰米尔纳德邦。国会直到1967年才统治该州,但输给了DMK。国会议员满怀信心地等待着复出。但随后,mg ramachandran从dmk中分离出来,形成aiadmk。这两个政党从此占据了第一和第二的位置。排在第三位的国会越来越弱了。\n\n接下来比哈尔邦和北方邦又出现了这种情况。1990年,国会在比哈尔邦被拉鲁亚达夫击败,但仍然排名第二。然后在1995年下滑到第三位,被人民党和拉鲁超越。后来,尼蒂什·库马尔从拉鲁分离出来,成立了后来被称为"联合民主党"的萨姆塔党,国会因此滑落到第四位。即使国会在2004-14年在新德里重新执政,它在比哈尔邦仍然是一个俾格米人。\n\n在最大的邦北方邦,穆拉亚姆·辛格·亚达夫在1989年的邦选举中击败了国会。在那之后,人民党和菲律宾党强势崛起,将国会降到第三或第四位。它再也回不来了。\n\n尽管遇到了这些挫折,国会在其他州不是第一就是第二。这使得该党在每次失败后都能卷土重来,尽管通常是作为联合政府的首脑,而不是以其本身的名义。\n\n但在过去几年中,该党在其他几个州已经滑落到第三或更低的位置。前两个位置现在被西孟加拉邦的特里纳莫尔女议员和左阵线占领;在安得拉邦被TDP和YSR国会占领;在哈里亚纳邦被BJP和INLD占领;在马哈拉施特拉邦被BJP和希夫塞纳占领。\n\n今天,曾经强大的国会统治仅在卡纳塔克邦、喀拉拉邦和阿萨姆这三个主要邦,以及一些像北方邦、喜马偕尔邦和曼尼普尔这样的小国。这些州在议会的543个席位中所占的席位不到80个。\n\n很早,国会就不能指望反在职在它已经成为第三的地方重新掌权。它需要一个新的目标,一个新的信息来吸引选民。唉,它的领导层丝毫没有承认这一点的迹象。一些国会议员对普里扬卡·甘地能成为新的救世主抱有绝望的希望。但她丈夫的可疑交易是该党19世纪在哈里亚纳邦被屠杀的一个关键原因,因此她可能是一个负债而不是一个资产。\n\n一些知识分子建议国会应该解雇甘地家族,或者至少是拉胡尔甘地。对不起,但是这个党是一群机会主义者,只有甘地家族才团结在一起。如果没有家庭,它将分裂成无关紧要的一部分。\n\n而且党还保留着一张王牌。即使它在一个又一个州滑落到第三位,在国家一级也很容易成为第二位。地区政党可能会在州选举中敲定它,但没有一个地区政党能够在国家层面上击败它。因此,当一届、两届甚至三届任期结束后,反对在任的人民党如期受到冲击时,国会仍有希望取代它成为一个多元化联盟的领袖。联军法可能意味着国会将不得不忍受比2004年左翼和2009年马玛塔·班纳吉(mamata banerjee)在其身上堆积如山的羞辱还要多的羞辱。但并不是所有的东西都丢失了。'
```

网页中的元描述,如果它存在的话非常有用,并且作为单行摘要候选项被给予了很高的优先权

``python
>;打印文章。元
'
````

`它是否涵盖了"巨蟒"的印刷文章。摘要"你在大选中惨败,上周在马哈拉施特拉邦和哈里亚纳邦的州选举中又一次惨败,国会能重新振作起来吗?"
```

支持第二党,冷落第三党,",
u"尽管遇到了这些挫折,国会在其他州仍然不是第一就是第二,"
u"即使在一个又一个州滑落到第三,在国家一级,它很容易成为第二名。']
```
还有一个命令行界面,用法示例:

``bash
smrzr--url<;url here>;--lines=3
smrzr-u<;url here>;-l=3非冗余
smrzr--text<;text here>;
smrzr--file<;filename>;
```

`

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java为什么这一行是charg=(char)(br.read());被跳过?   java三重DES中的IV在哪里?   java Lombok注释不在Intellij idea下编译   java为什么我不能使用过滤器作为流中的最后一步   sqlite Java编译错误找不到符号方法next()   在Java中解析处理对int来说太大的数字   java摄像头不工作   java是“断言错误”好的做法?   java确定api请求是来自CURL还是POSTMAN?   JavaSpringMVC导航   java使单例模式代码更强大   当Java(解释器)区分大小写时,为什么Java编译器(javac)不区分大小写?   java注释字符串[]oneArr();vs字符串[][]twoArr();公告   java命名查询的利弊   java使用log4jweb在web应用程序中配置Log4j2。罐子   java正则表达式查找以开头和结尾的所有可能出现的文本~   java从字符串执行方法