在Java中使用JSoup和正则表达式从URL创建字符串变量?
因此,我试图制作一个程序,从网站检索IFrame标记,打开链接并下载视频。目前,它检索IFrame标记,但我不知道如何忽略实际的标记。我很肯定我能用这个。split()特性,但我不知道如何创建一个正则表达式代码,以便只从引号内部提取数据。我还尝试使用JSoup的。html,但它只是打印了一条空白语句。以下是我所拥有的(它大部分是正确分割的,除了URL中有“id=…”之外)这会导致它再次分裂):
package com.trentmenard;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class Main {
public static void main(String[] args) {
Document website;
try{
website = Jsoup.connect("https://swordartonlineepisode.com/sword-art-online-season-3-episode-1-english-dubbed-watch-online/").get();
System.out.println("Website Found! Title: " + website.title());
Element videoLink = website.select("iframe").first();
System.out.println("Found Video Link: " + videoLink);
videoLink.removeAttr("width");
videoLink.removeAttr("height");
videoLink.removeAttr("scrolling");
videoLink.removeAttr("allowfullscreen");
System.out.println("Modified: " + videoLink);
String link = videoLink.toString();
String[] stringArray = link.split("=");
for(String a : stringArray){
System.out.println(a);
}
}
catch (IOException e) {
e.printStackTrace();
}
}
}
输出:https://i.stack.imgur.com/ZXTiV.png
提前谢谢
共 (0) 个答案