解析SQL语句的正则表达式

网友

1楼 · 编辑于 2024-04-20 07:30:13

如果GO总是在一条线上，您可以这样使用split：

#!/usr/bin/python

import re

sql = """-- this is a great database script!  go team go!
INSERT INTO myTable(stringColumn) VALUES ('go away!')
/*
  here are some comments that go with this script.
*/
GO 5 --this is a test
INSERT INTO myTable(stringColumn) VALUES ('this is the next script')"""

statements = re.split("(?m)^\s*GO\s*(?:[0-9]+)?\s*(?:--.*)?$", sql)

for statement in statements:
    print "the statement is\n%s\n" % (statement)

(?m)打开多行匹配，即^和{}将匹配行的开始和结束（而不是字符串的开始和结束）。在
^匹配行的开头
\s*匹配零个或多个空白（空格、制表符等）
GO匹配文本GO
\s*与之前一样匹配
(?:[0-9]+)?匹配可选整数（可能有前导零）
\s*与之前一样匹配
(?:--.*)?匹配可选的行尾注释
$匹配行末尾

分割会消耗GO线，所以你不必担心。这将给您留下一个语句列表。在

这个修改过的拆分有一个问题：它在执行后不会返回数字，如果这很重要，我会说是时候转向某种形式的解析器了。在

网友

2楼 · 编辑于 2024-04-20 07:30:13

“围棋”是不是总是在一条线上？你可以在“^GO$”上分开。在

网友

3楼 · 编辑于 2024-04-20 07:30:13

因为您可以在注释中包含注释、嵌套注释、查询中的注释等，所以没有一种合理的方法来处理正则表达式。在

我只需设计以下脚本：

INSERT INTO table (name) VALUES (
-- GO NOW GO
'GO to GO /* GO */ GO' +
/* some comment 'go go go'
-- */ 'GO GO' /*
GO */
)

不提：

^{pr2}$

唯一的方法是构建一个有状态的解析器。一次读取一个字符，并且有一个标志，当它在注释/引号分隔的字符串/etc中时，它将被设置，当它结束时重置，因此代码可以在这些实例中忽略“GO”实例。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

解析SQL语句的正则表达式

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >