有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

html创建java正则表达式以获取href链接

抱歉,如果之前有人问过这个问题,我在网上找不到任何答案。我很难弄清楚这个正则表达式的反方向:

"\"[^>]*\">"

我想用replaceAll替换除链接之外的所有内容。如果我有一个类似的标签:

<p><a href="http://www.google.com">Google</a></p>

我需要一个正则表达式来满足这一点:

s.replaceAll(regex, "");

给我这个输出:

http://www.google.com

我知道有更好的方法,但我必须使用正则表达式。非常感谢您的帮助,谢谢


共 (2) 个答案

  1. # 1 楼答案

    您可以签出http://regexlib.com/以获取所需的所有正则表达式帮助。下面的一个是url:

    ^[a-zA-Z0-9\-\.]+\.(com|org|net|mil|edu|COM|ORG|NET|MIL|EDU)$
    
  2. # 2 楼答案

    您不必使用replaceAll。更好地使用以下模式组:

    Pattern p = Pattern.compile("href=\"(.*?)\"");
    Matcher m = p.matcher(html);
    String url = null;
    if (m.find()) {
        url = m.group(1); // this variable should contain the link URL
    }
    

    如果HTML中有多个链接,请在循环中执行m.find()