我在我的输入csv文件中有一个记录,是
"2017-11-01","2017-10-29","2017-11-04","4532491","","","","Natural States: "The Environmental Imagination" in Maine, Oregon, and the Nation","1000","Richard W. Judd"
当我在pyspark中读到这个csv时,字段"Natural States: "The Environmental Imagination" in Maine, Oregon, and the Nation"
被分隔为单独的列。在
除了更改输入文件中的分隔符之外的任何解决方法,因为我们无法更改输入文件。在
您可以使用}转换为{},如下所示
sparkContext
读取文件,并使用多个字符","
读取文件,然后将{您应该有以下输出
^{pr2}$这可能与
sep='","'
一起工作,例如:相关问题 更多 >
编程相关推荐