未知

match的Python项目详细描述


模块match的目的是从原始的未经标记化的源获取已清理的标记化字符串的偏移量(以及偏移量之间的字符串,用于调试)。你可能会说“很重要”,但如果原始文本足够混乱,更不用说充斥着Unicode字符,这实际上是一个相当困难的任务。

考虑一些文本,存储在变量原始文本中,例如:

我在写信!有时候,我忘了放空格(用标点符号做奇怪的事情)?我是奥瑞·尤恩·波姆,我是你的朋友!

这将/应该/可能正确标记为:

[[u'i',u'am',u'writing',u'a',u'letter',u'!'],
[你'有时',你',',你'我',你'忘记',你'到',你'放',你'空格',你'-lrb-',你'和',你'做',你'奇怪',你'东西',你'用',你'标点',你'-rrb-',你'?'], [你“J'aurai”,你“une”,你“pomme”,你“,”你“s'il”,你“vous”,你“plxe2it”,你“!']]

现在:

在[22]:match.match(原文,[u'-lrb-',u'和',u'do',u'怪异',u'stuff',u'with',u'标点符号',u'-rrb-') 出[22]:[(6097,u'(用标点符号做奇怪的事情)]

在[23]:match.match(原文,[u'i',u'am',u'writing',u'a',u'letter',u'!']) 出[23]:[(0,25,你在写信!')]

在[24]中:匹配。匹配(原文,[u“s'il”,u“vous”,u“plxe2it”,u'!']) 出局[24]:[(121,138,你一定要出局!“)]

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Requestcontextholder在spring 4中具有并发访问权限。IBMWebSphere上的x Web应用程序?   java如何下载、设置和使用Eclipse?   java如何组合这些mysql语句   java JDBC无法连接到openshift上的mysql数据库   如果存在允许正确处理的重载,java对于方便的方法来说是否可行?   使用hibernate序列的java Spring MVC不存在   具有路径的java Selenium ChromeDriver负载扩展问题   读一本书。java中的java文件   退出队列时,Java队列程序结果为空   Java lambda返回带有重复代码问题的列表   java使用意图从其他活动传递数据并在listview中显示   java如何在java中创建JSON输出   java Android:在不破坏或暂停活动的情况下关闭显示   支持Android电视和手机的java多apk   关于Java应用程序测试和调试的一组问题   如何在JavaSE中使用jdbcRealmShiro进行授权   在java中是否有一个无异常检查的URL解析实用程序?   当页面上有多个相同类型的元素时,java会选择一个特定的元素   递归需要帮助发现java代码中的缺陷