摄取文本并输出由马尔可夫链生成的句子

helga-markovif的Python项目详细描述


https://badge.fury.io/py/helga-markovify.pnghttps://travis-ci.org/narfman0/helga-markovify.png?branch=master

摄取文本的小体并输出由马尔可夫链生成的句子。 赫尔加现在会监听你的irc频道,并在途中接收对话, 学会说你的行话。你可以从“日志”摄取开始,或者 任何其他摄入技术。

安装

安装和配置helga后,请使用:

pip install helga-markovify

markovify添加到您的设置并重新启动helga。要使用Twitter时间线, 您还必须将以下内容添加到设置(使用凭据):

TWITTER_CONSUMER_KEY = 'asad'
TWITTER_CONSUMER_SECRET = 'sdfs'
TWITTER_ACCESS_TOKEN = 'fghf'
TWITTER_ACCESS_SECRET = 'ghjg'

用法

注意:请在文本中使用标点符号。这是个棘手的问题 练习,但是区分句子是很重要的。

命令语法:

ingest <topic> <learning_type> <learning_type_source>
generate <topic>
drop <topic>

参数

topic:类似于标记,因此helga可以以不同的方式响应

learning_type:赫尔加将如何摄取。可以是文本,原始数据的url, 指向dpaste的url或twitter帐户。

learning_type_source:对应的数据,例如,如果学习类型是明文 是“文本”,url是“url”,twitter屏幕名是“twitter”,helga_日志阅读器 “logs”的参数(建议您变老并使用当前频道)

ingest命令从引用的 语料库.你可以从任何来源教机器人,它可以是twitter或者 文本。混合搭配很好。

generate命令从语料库生成一个句子。

drop命令从存储中删除特定主题。如果一个语料库变成 由于任何原因损坏,用户可能会丢弃它并重新摄取数据以填充 又来了。

设置

MARKOVIFY_ADD_PUNCTUATION:是否应该在行后添加句点。你总是 想要好的标点符号来表示好的句子,这是一个相当安全的“真的” 默认情况下。

MARKOVIFY_CHANNEL_LISTEN:接收当前频道抖动。有点贵, 可能不是很好的隐私问题,但那是lol火车到达的地方。

MARKOVIFY_CHANNEL_GENERATE:regex helga侦听生成的响应 默认频道颤音

MARKOVIFY_TOPIC_DEFAULT:频道数据的默认摄取主题

TWITTER_CONSUMER_KEY TWITTER_CONSUMER_SECRET TWITTER_ACCESS_TOKEN TWITTER_ACCESS_SECRET: 如果使用twitter,则需要从配置的twitter应用程序中获取这些信息。

示例

以下是使用Helga Markovify的不同方法。大多数是 摄取/学习数据的不同方式。

网址

!markovify ingest zen url https://hg.python.org/peps/raw-file/tip/pep-0020.txt
!markovify generate zen
helga> Sparse is better than ugly.

文本

!markovify ingest hitler text "Mein Kampf is the best Kampf."
!markovify ingest hitler text "Don't be stupid, be a smarty. Come and join the nazi party."
!markovify ingest hitler text "Make America hate again."
!markovify ingest hitler text "Kampf America is hate nazi smarty. Hate party again filler sentence. America is the best at being terrible."
!markovify generate hitler
helga> Mein Kampf is the best at being terrible.

粘贴

!markovify ingest zen dpaste http://dpaste.com/1JF2P4S
!markovify generate zen
helga> If the implementation is hard to explain, it may be a good idea.

推特

!markovify ingest narf twitter narfman0
!markovify generate narf
helga> You won't believe this one weird trick to get the target populace hooked.
!markovify generate narf
helga> FOSS: it only takes one highly incentivized dealer to get 4057$ a month doing nothing!

通道日志

!markovify ingest channel logs --channel #bots --start_date 1999-01-01
!markovify generate channel
helga> dropbox serving it does ASAP

helga, thoughts?
helga> it could be a crackhead, who wants to haskell bees

删除语料库

如果你不知怎么搞砸或弄坏了一个语料库,你可能会完全放弃它:

!markovify drop zen

待办事项

  • 特拉维斯
  • 谈论特定主题
  • 保留历史记录,也称为对话
  • 加权循环式对话

许可证

版权所有(c)2016 Jon Robison

有关许可信息,请参见附带的许可证

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java为什么Camel Spring 2.20.2会导致NIST漏洞CVE20169878和CVE20175929   javascript如何在Lodash中获取数组索引。每个   如何在java中欺骗ip   选择的java DropdownChoice与模型值不同,在ajax更新时更改   用于Java库ant构建的GnuPG问题/错误   java Atlas Mapper:使用Atlas Mapping文档为给定负载执行映射   java Paypal Broadleaf集成   java Meteor客户端函数,然后是服务器端响应   JavaJPA2在JavaSE中使用EntityManager有几个问题   java是否将时间戳格式的值更改为其他时间戳格式?   java为什么IF语句不能处理四舍五入的浮点和双精度浮点?   java无法访问handle事件中的按钮/文本区域   java Eclipse将数据插入MySQL时出现while循环未指定值错误   调试是java类库的启用调试/编译版本仍然可用   异步java。lang.ClassCastException:无法强制转换为组织。springframework。util。同时发生的可听未来   打印总是选择默认打印机,而不是指定的JAVA打印机   在Java中实现多重继承的对象   java如何从具有特定联系人的其他应用程序打开Whatsapp?   unicode字符串的java gson序列化不起作用   java如何从Android向flask服务器发送带有参数的post请求?