Unicode数据的hexDump

unidump的Python项目详细描述


Unicode码位转储。

该命令分析输入,然后打印三列:此行中第一个代码点的原始字节数,十六进制表示法中的代码点,最后,原始输入字符
用一个点替换控制和空白。


无效字节序列用一个“x”表示,十六进制值en-
用问号封闭,例如“?五楼?“

您可以从stdin导入数据,一次选择多个文件,甚至将所有这些输入方法混合在一起。


示例:

*stdin的基本用法:

0 0041 0042 0043 0044 abcd
4 0045 0046 0047 0048 efgh
8 0049 004a 004b 004c ijkl
12 004d 004e 004f 0050 mnop

*转储从另一种编码转换的代码点:


unidump-c latin-1一些旧文件

*同时转储许多文件:

unidump foo-*.txt

*控制字符和空白是安全的呈现:

echo-n-e'\x01'unidump-n 1
0 0001。

*最后了解您最喜欢的表情符号由哪些组成:

(echo-n-e'\xf0\x9f\x7d\xf0\x9f\x8f\xbd\xe2';\
echo-n-e'\x80\x8d\xe2\x99\x82\xef\xb8\x8f';)|\
unidump-n 5
0 1f9dd 1f3fd 200d 2642 fe0f.

有关图像,请参见http://emojipedia.org/man elf medium skin tone/>;。“elf”
emoji(第一个字符)在这里替换为一个点,因为当前版本的python的unicodedata还不知道这个字符。

*像字符串一样使用它(1):



这将用“x”替换输入文件中的每个未知字节,用“.”替换每个
控件和空白字符。

*仅打印输入的代码点:

unidump-e'{repr}'$'\n'-n 1 some file.txt

如果
通过“wc-l”管道传输,则可以使用此项计算文件中字符(而不是原始字节)的总数。


这是Unidump的1.1.2版,使用Unicode 8.0.0数据。




欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在饼图的图例中只包含每个类别的长描述?   json Grails应用程序,可以从Java DAO服务访问数据库如何访问控制器中的服务?   java将大型远程数据库表同步到本地数据库表,该表包含字段“lastModificationTime”   java如何在JFrame中创建交互式地图   web服务如何创建异步Java Restlet web服务?   java开始读取特定字节   java在jTable中返回不带SQL的搜索结果(带DAOMock)   jakarta ee java ee MVC模式,模型和视图是否直接相互通信   当由负载平衡器处理时,java Spring引导CSRF失败   java为什么JavaMail连接超时太长   java IzPack需要从安装程序安装JDK/JRE版本   java如何创建一个只接受实现Iterable的元素的方法   java spring数据存储库无法使用idClass保存实体   java如何从列表中删除重复项?   java在SocketChannel中发送大量数据时,影响速度的因素有哪些?   算法分支和绑定错误:节点1无法转换为java。可比的   java使用邮件API从Swing应用程序创建Jar文件   java枚举与简单常量声明?