Regexp匹配和弦，使用民族口音

1条回答

网友
1楼 · 发布于 2024-04-26 18:16:56

Python脚本逐行读取文本文件，并希望通过正则表达式确定当前行是带有和弦的行还是带有其他信息的行。你知道吗
也许在每一行上应用正则表达式^[\t #()/\dAC-Hac-jmsu]+$就足够了。如果正则表达式不返回匹配项，则该行包含带和弦的行中不允许使用的字符。也许这个仅使用单个字符类定义的简单正则表达式就足够了。你知道吗
但有可能是一行有名字或歌词也符合上述表达。就你的例子来说，情况并非如此，但也可能如此。在这种情况下，我建议首先在每一行上使用函数strip()，从每一行的开始和结束处删除空格和制表符。然后应用以下正则表达式
^(?:[#()/\dAC-Hac-jmsu]{1,6}[\t ]+?)*[#()/\dAC-Hac-jmsu]{1,6}$
不同之处在于，现在每个不包含空格或制表符的字符串的长度必须在1到6之间。不允许使用较长的字符串。有了这个额外的规则，就可以在检测有和弦的线条时不再出现假阳性。你知道吗
和弦线检测规则的问题肯定是作为名称的字母或仅由和弦允许的字母组成的歌词文本也可能匹配。一个解决方案是创建一个字符串列表，其中只包含允许用于和弦的字母，并在OR表达式中使用它们。这就避免了名字或歌词串的误报。有了弦的完整列表，很可能也可以定义较短的规则，而不需要在OR表达式中列出所有弦。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章