我有一个缺少值的数据帧。我如何编写python或R代码来将空格替换为0,将单个字符串替换为1,并将多个由“\t”连接的字符串替换为一个对应于“s+1”数量的数字。在
我的数据框:
col1 col2 col3
row1 5blue 2green5 white
row2 white green\twhite3\t3blue5
row3 blue3 white
row4 7blue green2
row5 3green 3white6
row6 6blue green\t6white7 green
row7 5blue5 6green white
row8 blue6
预期输出:
^{pr2}$有什么想法吗?谢谢
使用
yourstring.count("\t")
函数来获得制表符的数量,将1加到值中就可以得到单词的数量。如果字符串为空,则输出0。在我使用了一个函数,该函数将访问每个column元素并检查元素是否为一个空格(您可以根据所拥有的内容更改该元素)。它在我看来像一个空格),如果是,则返回0,否则它用“\t”拆分字符串并计算生成的字符串。在
Parsing Tab Delimited
阅读上面的这篇文章。它涵盖了使用pythonscsv模块解析制表符分隔符。我想这对你有帮助。在
输入文件数据_帧.txt
下面的代码
^{pr2}$这个代码应该可以工作。。。您只需将输出矩阵输出到csv文件。在
输出
相关问题 更多 >
编程相关推荐