录下某个声音的到来

from seleniumwire import webdriver import sys from webdriver_manager.chrome import ChromeDriverManager import time import pyaudio import wave from selenium.webdriver.chrome.options import Options import warnings warnings.simplefilter(action='ignore', category=FutureWarning) chrome_options = Options() chrome_options.add_argument("--headless") browser = webdriver.Chrome(ChromeDriverManager().install(), chrome_options=chrome_options) #selenium part browser.get('website') search = browser.find_element_by_id("text-area") search.clear() data="this is a simple test" search.send_keys(data) time.sleep(2) browser.find_element_by_id("btn").click() print("waiting for audio") size = len(data)/200 time.sleep(size*2) print("audio detected") CHUNK = 1024 FORMAT = pyaudio.paInt16 CHANNELS = 1 RATE = 44100 #number = len(data) RECORD_SECONDS = size*17 WAVE_OUTPUT_FILENAME = 'first.mp3' open(WAVE_OUTPUT_FILENAME, "wb+") frames = [] p = pyaudio.PyAudio() stream = p.open(format=FORMAT, channels=CHANNELS, rate=RATE,input=True, frames_per_buffer=CHUNK) print("started recording") for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)): audio = stream.read(CHUNK) frames.append(audio) print("end of recording") stream.stop_stream() stream.close() p.terminate() wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb') wf.setnchannels(CHANNELS) wf.setsampwidth(p.get_sample_size(FORMAT)) wf.setframerate(RATE) wf.writeframes(b''.join(frames)) wf.close()

2条回答

网友

1楼 · 编辑于 2024-04-19 19:51:09

我解决这个问题的方法是从网站上下载音频文件，而不是

记录下来，这个link帮助很大

网友

2楼 · 编辑于 2024-04-19 19:51:09

我无法让您的示例代码正常工作，但我有一个基本猜测：您是否更改了每个调用的输出文件名？看看你的脚本，情况似乎并非如此。在某些情况下，不更改文件名可能会导致文本乱码

某些包（例如pyttsx3）会做一些古怪的事情，以便将音频写入一个非线程安全的文件。这很可能就是您的方法所发生的情况

脱机文本到语音的转换

我发现完成这项任务的一个非常可靠的方法是直接调用类似^{}的东西

I've written a little package that provides a CLI for this.它的核心在这个片段中：

import os
import tempfile
import re

# These packages are conveniences.
# Listing builtin packages that will require a few more lines to use
from bs4 import BeautifulSoup  # Alt. html.parser


def text_to_mp3(text: str, outfile: str) -> None:
    """Given some text, generate an mp3 speaking the text.
    Args:
        text (str): Text to speak
        outfile (str): *.mp3 file to write
    """

    # For some reason espeak doesn't find NamedTemporaryFile files to be agreeable...
    _, text_filename = tempfile.mkstemp(suffix=".txt")

    with open(text_filename, "w") as file:
        file.write(text)
    try:
        with tempfile.NamedTemporaryFile(suffix=".wav", delete=True) as wav_file:
            os.system(f"espeak -f {text_filename} -w {wav_file.name}")
            os.system(f"lame  preset insane {wav_file.name} {outfile}  silent")
    finally:
        if os.path.exists(text_filename):
            os.remove(text_filename)


def html_to_mp3(html: str, outfile: str, select: str = "body") -> None:
    """Given a string containing html, generate an *.mp3 that speaks the text.
    Args:
        html (str): HTML string
        outfile (str): *.mp3 to generate
        select (str, optional): CSS selector from which to select text. Defaults to "body".
    Raises:
        ValueError: In case the CSS selector is not present in the text.
    """
    soup = BeautifulSoup(html, features="html.parser")
    elements = soup.select(select)
    if not elements:
        raise ValueError(f"No elements found for CSS selector `{select}`")
    text = "\n".join([element.get_text() for element in elements])
    text_to_mp3(text, outfile)

基本步骤是：

使用beautifulsoup从html文件中提取感兴趣的文本
对感兴趣的文本调用espeak，并将结果输出到*.wav文件。
- 我们将文本写入文件，而不是试图通过命令传递一个大字符串，以避免分析'、"等问题
- espeak仅输出到wav
- 声音有很多可供修补的选项
使用^{}将上一步中的*.wav转换为mp3

虽然您的计算机上可能已经安装了这些实用程序，但您始终可以通过以下方式（在ubuntu上）安装它们：

sudo apt-get update
sudo apt-get install lame espeak

在线文语转换

如果您可以使用连接到google的在线文本到语音转换，那么^{}包工作得非常好。特别是，以下功能可根据您的需要工作：

gtts-cli 'hello'  output hello.mp3 & gtts-cli 'world'  output world.mp3

脱机文本到语音的转换

在线文语转换

相关问题更多 >

编程相关推荐

热门问题

热门文章