Unicode数据的hexDump

unidump的Python项目详细描述


Unicode码位转储。

该命令分析输入,然后打印三列:此行中第一个代码点的原始字节数,十六进制表示法中的代码点,最后,原始输入字符
用一个点替换控制和空白。


无效字节序列用一个“x”表示,十六进制值en-
用问号封闭,例如“?五楼?“

您可以从stdin导入数据,一次选择多个文件,甚至将所有这些输入方法混合在一起。


示例:

*stdin的基本用法:

0 0041 0042 0043 0044 abcd
4 0045 0046 0047 0048 efgh
8 0049 004a 004b 004c ijkl
12 004d 004e 004f 0050 mnop

*转储从另一种编码转换的代码点:


unidump-c latin-1一些旧文件

*同时转储许多文件:

unidump foo-*.txt

*控制字符和空白是安全的呈现:

echo-n-e'\x01'unidump-n 1
0 0001。

*最后了解您最喜欢的表情符号由哪些组成:

(echo-n-e'\xf0\x9f\x7d\xf0\x9f\x8f\xbd\xe2';\
echo-n-e'\x80\x8d\xe2\x99\x82\xef\xb8\x8f';)|\
unidump-n 5
0 1f9dd 1f3fd 200d 2642 fe0f.

有关图像,请参见http://emojipedia.org/man elf medium skin tone/>;。“elf”
emoji(第一个字符)在这里替换为一个点,因为当前版本的python的unicodedata还不知道这个字符。

*像字符串一样使用它(1):



这将用“x”替换输入文件中的每个未知字节,用“.”替换每个
控件和空白字符。

*仅打印输入的代码点:

unidump-e'{repr}'$'\n'-n 1 some file.txt

如果
通过“wc-l”管道传输,则可以使用此项计算文件中字符(而不是原始字节)的总数。


这是Unidump的1.1.2版,使用Unicode 8.0.0数据。




欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java组在不同线程中记录消息   java Wicket挂载404错误页   Java:如何制作对象数组的副本?   类似Windows中的java日期时间选择器   java无法获取JTextField用户输入以搜索文本文件   安卓 Java:如何随机更改背景和字体颜色   Java定时器中的摆动变化延迟   java让Selenium暂停X秒   将响应传递到视图时发生java Nativescript错误   java刷新安卓列表视图的最佳方式是什么?   单java进程的多线程队列/工作线程体系结构   web服务Java NoSuchMethodException   java groupingBy和filter一步到位   java游标。getCount()给定错误   即使引用的文件位于项目根目录中,java PrintWrite仍会持续引发“未找到文件”异常