有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java从HTML内容中删除空白?

我有一个CRUD维护屏幕,带有一个自定义的富文本编辑器控件(实际上是FCKEditor),程序将格式化文本从控件中提取为HTML,保存到数据库中。然而,我们的部分标准是,在保存之前,需要从内容中删除前导和尾随空格,因此我必须删除多余的&;nbsp;和<;br>;从HTML字符串的开头和结尾就是这样

我可以选择在客户端(使用Javascript)或服务器端(使用Java)使用正则表达式或其他方法来实现这一点吗?我不确定它需要多复杂,我需要能够删除以下内容:

<p><br /> &nbsp;</p>

但如果中间有任何有意义的文本,请保留它。(上面的代码片段来自测试人员保存的实际HTML数据)


共 (1) 个答案

  1. # 1 楼答案

    /<p>(?:<br\s*\/>|&[#\w]{2,6};|[\s\n\r])*?<\/p>/g
    

    这应该匹配所有不包含任何“有意义文本”的段落

    不过,最好还是在服务器端完成