我需要使用字典数据库,但大部分是一些字母数字无用的东西,有趣的领域要么是非字母数字(如中文字符)或在一些括号内。我搜索了很多,了解了很多工具,比如sed,awk,grep,etc,我甚至想过创建一个Python脚本来解决这个问题,但是我从来没有找到一个解决方案。你知道吗
数据库的一行如下所示:
助 L1782 DN1921 K407 O431 DO346 MN2313 MP2.0376 E314 IN623 DA633 DS248 DF367 DH330 DT284 DC248 DJ826 DG211 DM1800 P1-5-2 I2g5.1 Q7412.7 DR3945 Yzhu4 Wjo ジョ たす.ける たす.かる す.ける すけ {help} {rescue} {assist}
我需要这样:
助 ジョ たす.ける たす.かる す.ける すけ {help} {rescue} {assist}
我怎么能用上面提到的任何一种工具来做这个?你知道吗
就我个人而言,在你的示例行中,我列出了所有以空格开头和结尾的字母数字字符:
sed -i 's/ [a-zA-Z0-9 .-]+ / /g'
应该接近你所需要的。如果要擦除的文本包含其他内容,则可能需要添加更多特殊字符。这是对单个空间的就地替换(本质上是删除)。你知道吗没有linux的盒子来验证这个。。。可能需要按摩一下。你知道吗
同样值得一提的是,如果括号可以包含两个空格:
{test results found}
,这将不起作用,因为它会吹走results
如果您仍然想要一个Python解决方案,那么这里有一个Python解决方案:
我的结果:
'21161ジョたすけるたすかるすけ{帮助}{救援}{协助}
使用
perl
:内联注释中的解释。你知道吗
与
sed
类似的逻辑:相关问题 更多 >
编程相关推荐