java从HTML内容中删除空白?
我有一个CRUD维护屏幕,带有一个自定义的富文本编辑器控件(实际上是FCKEditor),程序将格式化文本从控件中提取为HTML,保存到数据库中。然而,我们的部分标准是,在保存之前,需要从内容中删除前导和尾随空格,因此我必须删除多余的&;nbsp;和<;br>;从HTML字符串的开头和结尾就是这样
我可以选择在客户端(使用Javascript)或服务器端(使用Java)使用正则表达式或其他方法来实现这一点吗?我不确定它需要多复杂,我需要能够删除以下内容:
<p><br /> </p>
但如果中间有任何有意义的文本,请保留它。(上面的代码片段来自测试人员保存的实际HTML数据)
# 1 楼答案
这应该匹配所有不包含任何“有意义文本”的段落
不过,最好还是在服务器端完成