我正在尝试编写一个脚本,使用Python和Selenium自动从网站下载文本和音频文件。在
网址:https://learn.dict.naver.com/conversation#/korean-en/20190713(yyyymmdd)
import requests
from time import sleep
from selenium import webdriver
from selenium.webdriver.firefox.options import Options
url = 'https://learn.dict.naver.com/conversation#/korean-en/20190713'
options = Options()
options.headless = True
driver = webdriver.Firefox(options=options, executable_path = 'geckodriver')
driver.get(url)
sleep(3)
driver.find_element_by_class_name('btn_listen').click() #for the first one
音频在点击时播放/加载,但我不知道如何在加载和下载时“捕获”文件。在
将其复制到浏览器中,会加载一个可以手动下载的音频文件。我想自动下载(能够动态重命名的加分)。在
我已经试过几次了options.set_首选项(),但它们似乎主要与要下载的文件有关(即“单击此处下载”按钮),而不是简单的播放。在
谢谢!在
您可以使用requests下载mp3文件,并在页面上以文本格式获取有关句子的其他有用信息。
下面的代码是https://learn.dict.naver.com/conversation#/korean-en/20190713的示例。在
data
变量中使用json可以查看可以使用的信息。在相关问题 更多 >
编程相关推荐