Python中文
首页
教程
问答
标签
搜索
登录
注册
在应用编码进行写入之前,检查数据是否不同
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个刮网器,刮取以下数据:</p> <pre><code>TESTDATA DATA:DATA Data £9500 Data £930 Data £500 Data £2250 Data £930 Data £500 Data £2250 DATATEST DATA:DATA Data £95001 Data £9302 Data £5003 Data £22504 Data £9305 Data £5006 Data £22507 </code></pre> <p>运行:<code>print full_end</code>返回:</p> <pre><code>[u'TESTDATA', 'DATA:DATA', 'Data £9500', 'Data £930', 'Data £500', 'Data £2250', 'Data £930', 'Data £500', 'Data £2250', '\r', DATATEST', 'DATA:DATA', 'Data £95001', 'Data £9302', 'Data £5003', 'Data £22504', 'Data £9305', 'Data £5006', 'Data £22507'] </code></pre> <p>运行:<code>print repr(full_end)</code>返回:</p> <pre><code>u"TESTDATA\nDATA:DATA\nData £9500\nData £930\nData £500\nData £2250\nData £930\nData £500\nData £2250\n\r\nDATATEST\nDATA:DATA\nData £95001\nData £9302\nData £5003\nData £22504\nData £9305\nData £5006\nData £22507" </code></pre> <p>运行:<code>print repr('\r\n'.join(full_end).strip())</code>返回:</p> <pre><code>u"TESTDATA\r\nDATA:DATA\r\nData £9500\r\nData £930\r\nData £500\r\nData £2250\r\nData £930\r\nData £500\r\nData £2250\r\n\r\r\nDATATEST\r\nDATA:DATA\r\nData £95001\r\nData £9302\r\nData £5003\r\nData £22504\r\nData £9305\r\nData £5006\r\nData £22507" </code></pre> <p>图片:<a href="https://i.imgur.com/Qe0TE5Y.png" rel="nofollow noreferrer">http://i.imgur.com/Qe0TE5Y.png</a></p> <p>使用以下脚本</p> <pre><code>with open('FULL_DATA.txt','r') as full_end_datafile: full_end_datafile_read = full_end_datafile.read() encoded_data = '\n'.join(full_end).encode("Latin-1") if full_end_datafile_read == encoded_data: encoded_data = "" else: with open('FULL_DATA.txt','w') as full_end_datafile: full_end_datafile.write('\n'.join(full_end).encode("Latin-1")) </code></pre> <h3>注意:在记事本中编辑文件时,每个数据集/组之间显示1行,在记事本++中,每个数据集/组之间显示2行</h3> <p><img src="https://i.stack.imgur.com/6w3gV.png" alt="http://i.imgur.com/FhV5wJx.png"/></p> <h3>如果我将写和读选项更改为<code>rb</code>和<code>wb</code>,我会得到以下结果:</h3> <p><img src="https://i.stack.imgur.com/ZrYrL.png" alt="http://i.imgur.com/hmXy6tf.png"/></p> <p>它无法识别数据是否相同,它会重新保存文件</p> <p>有人知道怎么修吗?你知道吗</p> <p>提前谢谢 -海弗莱克斯</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>打开文件时,请使用U标志:</p> <pre><code>with open('FULL_DATA.txt','Ur') </code></pre> <p>这意味着“通用EOL”,并将所有不同的EOL(如<code>\r\n</code>)转换为<code>\n</code>。EOL之间的差异是比较失败的原因之一。可能还有其他的,但从这个开始。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
我是否正确构建了这个递归神经网络
10 回答
我是否正确理解acquire和realease是如何在python库“线程化”中工作的
6 回答
我是否正确理解Keras中的批次大小?
5 回答
我是否正确理解PyTorch的加法和乘法?
10 回答
我是否正确组织了我的Django应用程序?
7 回答
我是否正确计算执行时间?如果是这样,那么并行处理将花费更长的时间。这看起来很奇怪
4 回答
我是否每次创建新项目时都必须在PyCharm中安装numpy?(安装而不是导入)
3 回答
我是否每次运行jupyter笔记本时都必须重新启动内核?
2 回答
我是否用python安装了socks模块?
4 回答
我是否真的需要知道超过一种语言,如果我想要制作网页应用程序?
7 回答
我是否缺少spaCy柠檬化中的预处理功能?
10 回答
我是否缺少给定状态下操作的检查?
3 回答
我是否能够使用函数“count()”来查找密码中大写字母的数量((Python)
10 回答
我是否能够使用用户输入作为colorama模块中的颜色?
6 回答
我是否能够创建一个能够添加新Django.contrib.auth公司没有登录到管理面板的用户?
4 回答
我是否能够将来自多个不同网站的数据合并到一个csv文件中?
4 回答
我是否能够将目录路径转换为可以输入python hdf5数据表的内容?
9 回答
我是否能够等到一个对象被销毁,直到它创建另一个对象,然后在循环中运行time.sleep()
9 回答
我是否能够通过CBV创建用户实例,而不是首先创建表单?(Django)
8 回答
我是否要使它成为递归函数?
9 回答