我试图为存储在文件中的类似于下面的字符串创建正则表达式模式。其目的是为任何行获取任何列,行不必在一行上。例如,考虑以下文件:
"column1a","column2a","column
3a,", #entity 1
"column\"this is, a test\"4a"
"column1b","colu
mn2b,","column3b", #entity 2
"column\"this is, a test\"4b"
"column1c,","column2c","column3c", #entity 3
"column\"this is, a test\"4c"
每个实体由四列组成,实体2的第4列是“column”,这是测试“4b”,实体3的第2列是“column2c”。每列以引号开始,以引号结束,但是您必须小心,因为有些列有转义引号。提前谢谢!你知道吗
你可以这样做
阅读整个文件。
根据不带逗号的换行符拆分输入。
迭代被吐出的元素,然后再次对逗号(和下面可选的换行符)进行拆分,逗号前面和后面都有双引号。
代码:
输出:
这是支票。。你知道吗
f
是输入文件名,f.py
是包含python脚本的文件名。你知道吗你的问题对于我每个月要处理三次的事情来说非常熟悉:)除了我没有使用python来解决它,但是我可以“翻译”我通常做的事情:
ideone demo
相关问题 更多 >
编程相关推荐