精华内容
下载资源
问答
  • 输入要转换的内容,程序直接帮你把转换好的mp3文件输出(因为下一步–语音识别–需要.pcm格式的文件,程序自动执行格式转换,同时生成17k.pcm文件,暂时不用管,(你也可以通过修改默认参数改变文件输出的位置,名称...
  • python语音识别(语音转文字

    万次阅读 多人点赞 2019-10-10 17:40:44
    调用第三方百度的语音识别api进行语音识别 步骤: 1)安装百度提供的Python库:pip install baidu-aip 2)运行以下代码: from aip import AipSpeech APP_ID = '160' API_KEY = 'f6XVtm' SECRET_KEY = 'zbvyYC' # ...

    存在问题:
    将音频转化成文字进行输出


    解决方案:
    调用第三方百度的语音识别api进行语音识别

    步骤:
    1)安装百度提供的Python库:pip install baidu-aip
    2)运行以下代码:

    from aip import AipSpeech
    APP_ID = '160'
    API_KEY = 'f6XVtm'
    SECRET_KEY = 'zbvyYC'
    # 百度AI库获取的参数
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    
    # 构造读取语音文件函数
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
    
    # 识别本地文件  主函数
    result = client.asr(get_file_content(r'F:\PythonFiles\PycharmFile\16k.pcm'), 'pcm', 16000, { 'lan': 'zh',})
    #此处地址处必须要加r,使其成为绝对地址,要么容易字符转义出现错误
    print(result)
    

    注:
    1)百度AI云平台地址:https://ai.baidu.com/
    2)进入后添加应用,获取相应的接口ID和密钥(上文提到的三个参数)
    3)该接口只支持pcm、wav和amr格式音频
    4)程序返回值有4个,如下
    在这里插入图片描述
    5)存在一个问题,自己录的音总是报3301错误,该错误显示录音效果差,无论怎么录音都显示这个错误

    展开全文
  • 不停的熟读稿子,又或者提前花费大量时间把稿子写好,在录屏的时候对着读但是光写稿子也要花费了大量的时间啊所以我想到的方法就是先对着照PPT说一遍并录下来,再将用代码自动将音频自动提取出来文字,...

    大家好,我是一行

    不知道你有没有录过自我介绍的视频,尤其是那种加上PPT播放的长时间视频

    可能因为说错一句话就得重来,又或者因为思考而暂停时间太久又得重来,以至于弄了两个小时才做好五分钟的视频

    所以就像为了答辩一样,为了让演讲流利不卡壳一遍过,不停的熟读稿子,又或者提前花费大量时间把稿子写好,在录屏的时候对着读

    但是光写稿子也要花费了大量的时间啊

    所以我想到的方法就是先对着照PPT说一遍并录下来,再将用代码自动将音频自动提取出来转成文字,然后第二遍正式录制视频的时候看着生成的讲稿就不用因为不熟练而卡壳,同时也省去了一个个码字的时间消耗

    所以为了更好的去录制视频,这里将上述过程全部用代码流程化分享给大家

    • 视频提取音频

    • 音频频率转化、音频切割

    • 音频转成文字

    1视频提取音频

    如果你练习时是录的视频,那需要将视频里的语音提取出来,方便后期操作

    当然这个过程目前在各个视频剪辑软件里都可以一键分割,例如剪映、必剪、Pr等等

    但是当任务量增加的时候,操作就显得非常浪费时间,而用Python的话3行代码就可以提取出来,就算任务量增加最多再加个循环即可

    代码如下

    from moviepy.editor import AudioFileClip
    # 导入视频
    my_audio_clip = AudioFileClip("一行玩Python/1012 视频转文字/11.mp4")
    # 提取音频并保存
    my_audio_clip.write_audiofile("一行玩Python/1012 视频转文字/11.wav")
    
    

    2音频转文字

    提取音频之后就要把音频转成文字了,目前市面上有很多方式都可以快速的将视频里的音频内容转成文字

    • 科大讯飞、知意等付费平台

    • 剪映、Pr等剪辑如案件生成字幕

    • 百度云、腾讯云等国内接口

    • GOogle、IBM、Bing等国外接口

    • 自己造轮子,语音识别训练

    • 自己一边听一边打字

    虽然说有这么多方法可以去实现这个需求,但任务量增长后,想不花钱,又想不花时间造轮子,最好的办法就是用现成的接口

    百度接口使用

    申请百度接口

    如果想用百度接口来批量处理,需要

    百度语音API地址:https://cloud.baidu.com/doc/SPEECH/index.html

    from aip import AipSpeech
    
    """ 你的 APPID AK SK """
    APP_ID = 'xxx'
    API_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxx'
    SECRET_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxx'
    
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    
    # 读取文件
    def get_file_content(file_path):
        with open(file_path, 'rb') as fp:
            return fp.read()
    
    # 识别本地文件
    result = client.asr(get_file_content('音频.wav' % i), 'wav', 16000, {
        'dev_pid': 1537  # 默认1537(普通话 输入法模型),dev_pid参数见本节开头的表格
    })
    
    print(result['result'])
    
    

    如果你恰巧是用mac录的音频,那就得对音频进行降频处理

    因为百度接口只能识别16 kHz的音频,而mac录的是48 kHz的音频,当然用ffmpeg重采样一下就可以

    import ffmpeg
    ffmpeg.input('输入音频.wav').output('输出音频.wav', ar=16000).run()
    
    

    如果的你音频比较长,但是百度短语音识别接口支持1分钟以内的音频,这时候需要对音频进行分割处理

    from pydub import AudioSegment
    from pydub.utils import make_chunks
    
    #blues文件30s
    audio = AudioSegment.from_file("voice.wav", "wav")
    
    size = 30000  #切割的毫秒数
    
    chunks = make_chunks(audio, size)  ##将文件切割为59s一块
    
    for i, chunk in enumerate(chunks):
        ##枚举,i是索引,chunk是切割好的文件
        chunk_name = "voice{0}.wav".format(i)
        print(chunk_name)
        ##保存文件
        chunk.export(chunk_name, format="wav")
    
    

    然后重采样、剪切好的音频循环调用百度API接口就可以完成了~

    exe

    当然,也有前辈利用百度API直接写成了一个exe来使用

    只需要在刚才百度智能云注册申请账号即可使用

    3最后

    而现在互联网的大趋势是视频内容,了解视频相关的应用对于做内容也非常有帮助

    之前有前辈分享过如果做短视频创作秘籍,就是把互联网上最火的内容下载个1、200个,然后拿来翻拍,毕竟火过的内容很大概率还会再火

    当然有些人会向我过去一样质疑,这tm不是抄袭嘛,但是很多内容本来就可以同主题多形式的,例如别人拍的炒蛋炒饭,那你同样可以翻拍炒蛋炒饭,这有什么不好的吗

    而批量下载抖音之前介绍过,现在又可以把这些的视频内容提取出来,下一步就可以进行批量翻拍,离实现一个小目标岂不是越来越近了

    技术永不眠,下期见~


    一行把自己的各种Python玩法文章整理成了一本电子书,干货满满!

    目录如下,还包括自己各种面试赚钱经验,现在免费送给大家~

    链接: https://pan.baidu.com/s/11R1XRdxbDrFeHdosfP3aGA 密码: dl55

    在这里插入图片描述

    展开全文
  • python语音转文字Here you will get python text to speech example. 在这里,您将获得python文本语音转换示例。 As we know, some people have difficulty reading large amounts of text due to dyslexia and ...

    python语音转文字

    Here you will get python text to speech example.

    在这里,您将获得python文本语音转换示例。

    As we know, some people have difficulty reading large amounts of text due to dyslexia and other learning disabilities. Some people have basic literary levels. They often get frustrated trying to browse the internet because so much of it is in text form or on other hand some people prefer to listen or watch a news article (or something like this) instead of reading. So to solve all these problems a concept comes into mind that is ”text to speech”.

    众所周知,由于阅读障碍和其他学习障碍,有些人难以阅读大量文字。 有些人具有基本的文学水平。 他们经常尝试浏览Internet时感到沮丧,因为其中很多都是文本形式的,或者另一方面,某些人更喜欢听或看新闻文章(或类似的东西)而不是阅读。 因此,要解决所有这些问题,就会想到一个概念,即“文本到语音”。

    So in this tutorial we are going to learn that how to convert text to speech in Python. Here we’ll show you two best and easiest ways to convert your text into speech

    因此,在本教程中,我们将学习如何在Python中将文本转换为语音。 在这里,我们将向您展示将文本转换为语音的两种最简便的方法

    1. Text to speech without internet connection (using pyttsx3)

      文本到语音无需互联网连接(使用pyttsx3)

    2. Text to speech having internet connection (using gTTS)

      具有互联网连接的文本到语音(使用gTTS)

    Python文字转语音示例 (Python Text to Speech Example)

    方法1:使用pyttsx3 (Method 1: Using pyttsx3)

    Pyttsx3 is an offline cross-platform Test-to-Speech library which is compatible with both Python 3 and Python 2 and supports multiple TTS engines

    Pyttsx3是一个离线跨平台的“测试到语音转换”库,与Python 3和Python 2兼容,并支持多个TTS引擎

    To use pyttsx3, first we have to download and install it. In order to install it open your command prompt or terminal and type this command.

    要使用pyttsx3,首先我们必须下载并安装它。 为了安装它,请打开命令提示符或终端,然后键入此命令。

    pip install pyttsx3

    点安装pyttsx3

    If you’re using windows operating system then you also have to install “pypiwin32” to make it work. To install pypiwin32 again type this command and hit enter in command prompt.

    如果您使用的是Windows操作系统,则还必须安装“ pypiwin32 ”以使其正常运行。 要再次安装pypiwin32 ,请键入此命令,然后在命令提示符下按Enter。

    python  -m  pip install pypiwin32

    python -m pip安装pypiwin32

    Make sure you’ve internet connection while running both of the command. It is one time process, after you’ve installed pyttsx3 now to use it, the program will be as shown below.

    同时运行两个命令时,请确保您已连接互联网。 这是一次过程,现在安装pyttsx3以使用它后,程序将如下所示。

    import pyttsx3
    engine = pyttsx3.init()
    engine.say("hello crazy programmer")
    engine.setProperty('rate',120)
    engine.setProperty('volume', 0.9)
    engine.runAndWait()

    In this program, in first Line we’re initializing pyttsx3 for use then we’re passing the text in method say(). After it we’re setting some properties like volume and rate of the voice. Here we’re passing 120 as rate, which means it will speak 120 words per minute and last line of above program will be produce an audio saying “hello crazy  programmer”.

    在此程序中,在第一行中,我们将初始化pyttsx3以供使用,然后在方法say()中传递文本 之后,我们要设置一些属性,例如声音的音量和速率。 在这里,我们以120的速率传递,这意味着它将每分钟讲120个单词,并且上述程序的最后一行将产生一个音频,说“你好疯狂的程序员”。

    We can also modify the voice like we can change it into female voice (by default its male), age and language. For more information please visit http://pyttsx3.readthedocs.io/en/latest/engine.html

    我们还可以修改语音,就像可以将其更改为女性语音(默认为男性),年龄和语言一样。 有关更多信息,请访问http://pyttsx3.readthedocs.io/en/latest/engine.html

    方法2:使用gTTS(Google文本到语音) (Method 2: Using gTTS (Google Text to Speech))

    Google Text to Speech is one of the best TTS API out there, because it will generate audio as approximately similar to human voice while other APIs generate audio like a metallic voice or robotic voice. But there is also a disadvantage of gTTS, it will need an internet connection to convert the text into an audio. So it can be slow then other offline APIs.

    Google Text to Speech是目前最好的TTS API之一,因为它会产生与人类语音大致相似的音频,而其他API会产生诸如金属语音或机器人语音之类的音频。 但是gTTS的另一个缺点是,它需要互联网连接才能将文本转换为音频。 因此,它可能比其他脱机API慢。

    To install gTTS API open your command prompt or terminal and type this command:

    要安装gTTS API,请打开命令提示符或终端,然后输入以下命令:

    pip  install gTTS

    点安装gTTS

    Program for conversion will be as shown below.

    转换程序如下所示。

    from gtts import gTTS
    tts = gTTS(text="Hello crazy programmer", lang='en')
    tts.save("audio.mp3")

    Unlike other APIs it will generate an audio and will save into the same directory where your program stored.

    与其他API不同,它将生成音频并将其保存到程序存储的同一目录中。

    To play this audio we’ll need another tool to play audio on command line.

    要播放此音频,我们需要另一个工具在命令行上播放音频。

    If you’re using Linux (eg. Ubuntu) then mpg321 will be best command line player.

    如果您使用的是Linux(例如Ubuntu),则mpg321将是最佳的命令行播放器。

    To install it open terminal and type this command-

    要安装它,请打开终端并输入以下命令:

    sudo apt-get install mpg321

    sudo apt安装mpg321

    Now we can use this command to play any audio on command line:

    现在我们可以使用此命令在命令行上播放任何音频:

    mpg321 audio.mp3 -quiet

    mpg321 audio.mp3-安静

    To run this command in python program, add these two lines into above program

    要在python程序中运行此命令,请将这两行添加到上述程序中

    import os     #will be on the top
    os.system('mpg321 audio.mp3 -quiet')

    On other hand, for windows, we doesn’t have to install any new software or API to play the mp3 file. All we have to do is open command prompt and enter the name of your file it will play that file using your default media player. So to run this command in python add these two lines in above program.

    另一方面,对于Windows,我们无需安装任何新软件或API即可播放mp3文件。 我们要做的就是打开命令提示符,然后输入文件名,它将使用默认的媒体播放器播放该文件。 因此,要在python中运行此命令,请在上述程序中添加这两行。

    import os       #will be on the top
    os.system("audio.mp3")

    For more information on gTTS please visit https://pypi.org/project/gTTS/

    有关gTTS的更多信息,请访问https://pypi.org/project/gTTS/

    Comment below if you have queries regarding python text to speech conversion.

    如果您有关于python文本到语音转换的查询,请在下面评论。

    翻译自: https://www.thecrazyprogrammer.com/2018/05/python-text-to-speech.html

    python语音转文字

    展开全文
  • 直接输入要转换的内容,程序直接帮你把转换好的mp3文件输出(因为下一步–语音识别–需要.pcm格式的文件,程序自动执行格式转换,同时生成17k.pcm文件,暂时不用管,(你也可以通过修改默认参数改变文件输出的位置及...

    话不多说,直接上代码运行截图

    1.语音合成

    ------->
    执行:
    直接输入要转换的内容
    结果:
    在这里插入图片描述
    输入要转换的内容,程序直接帮你把转换好的mp3文件输出(因为下一步–语音识别–需要.pcm格式的文件,程序自动执行格式转换,同时生成17k.pcm文件,暂时不用管,(你也可以通过修改默认参数改变文件输出的位置,名称及是否进行pcm转换
    <-------

    2.语音处理

    ---->
    方便起见, 我们直接运行语音处理程序,识别我们上一步的17k.pcm文件:

    识别结果
    What?识别居然出现了点错误,不过不用担心,博主已经调用过数百次了,总体效果还是能满足大部分需求的

    <----

    好了,代码已经演示过了,有需要的小伙伴可以到我的github直接拿,不用客气!
    git地址:Github:maker_training_camp
    最后提醒下:语音合成和识别 分别对应 chr_to_mp3.py 及 mp3_to_chr.py(哈哈,通过名字应该也能看出来)
    注:windows运行程序可能不能输出17k.pcm文件(需要安装依赖)不过不影响声音合成,linux一切正常(同样是安装好依赖的情况下,依赖在代码中已体现)

    祝大家项目顺利!

    展开全文
  • python 语音转化文字

    2020-11-20 20:54:17
    广告关闭腾讯云11.11云上盛惠 ... 不过文字转语音就相对而言容易实现很多了。 简言之, 汉字转语音实现就分为两步,第一步将汉字转为拼音,第二步通过拼音调用相匹配的音频文件。 下面是具体的开发实例教程。 开发环...
  • Python调用标贝科技语音识别接口,实现语音转文字 环境准备: Python 3 登录 点击产品地址进行登录,支持短信、密码、微信三种方式登录。 创建新应用 登录后进入【首页概览】,各位开发者可以进行创建多个...
  • python3实现简单的语音识别转化成文字

    万次阅读 多人点赞 2019-07-26 16:56:38
    自己对python感兴趣,利用业余时间弄了个自动回复微信消息的小机器人,纯属自己瞎...以python3为基础语言,用到了 itchat +谷歌的语音识别+思知机器人API+pydub类库。简单说下: 1.itchat 他的开发者介绍说这是实...
  • 语音文字转换(speech-to-text)(STT)系统就像它名字所蕴含的意思那样,是一种将说出的单词转换为文本文件以供后续用途的方式。语音文字转换技术非常有用。它可以用到许多应用中,例如自动转录,使用自己的声音写书籍...
  • 这里用到的包为sphinx,sphinx是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。有一些成熟的模型,可以将语音文字。例如Cloud Speech API,但是需要你使用google云平台的前提。speech ...
  • Python3文字识别转语音,简单几句代码实现把记事本文件的中文转换成语音播报 学习使用pyttsx3的运用
  • 语音识别是计算机软件识别口语中的单词和短语,并将其转换为可读文本的能力。那么如何在 Python 中将语音转换为文本?如何使用 SpeechRecognition 库在 Python 中将语音转换为文本?我们不需要从头开始构建任何机器...
  • /usr/bin/python3import urllib.requestimport requests#导入requests库import urllibimport jsonimport base64class BaiduRest:def __init__(self, cu_id, api_key, api_secert):# token认证的urlself.token_url = ...
  • wav文件中的识别语音信息,转换为文字。同时把文字保存到文本中。
  • 整合了语音识别Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别非常简单。阅读本指南,你就将会了解。你将学到:很多人学习python,不知道从何学起。很多人学习...
  • 1、先安装PyAudiopython -m pip install PyAudio-0.2.11-cp37-cp37m-win_amd64.whl2、安装语音识别pip install SpeechRecognition3、安装离线语音识别python -m pip install pocketsphinx-0.1.15-cp37-cp37m-win_amd...
  • Python讯飞语音转文字保存到文件

    千次阅读 2020-11-06 18:27:04
    因为有朋友需要将录音文字, 给我的是m4a格式, 我给成txt发给他的. 我找了找, 发现网上很多都是收费软件,而且转换结果不尽人意., 最后决定使用讯飞服务来完成转换, 讯飞语音转写api支持大文件, 转换结果也十分...
  • python离线语音转文字

    2021-07-11 16:02:51
    最好还是调api import speech_recognition as sr def wav2txt(): r = sr.Recognizer() # 打开语音文件 with sr.AudioFile('./test.wav') as source: audio = r.record(source) # print('文本内容: ', r.recognize_...
  • Python百度AI语音识别——文字转语音

    千次阅读 2020-01-09 20:13:34
    接上一篇内容,这次利用百度AI提供的语音合成api,将爬取到的小说文字数据转化为音频数据。需要有一个百度账号,然后再...创建一个百度AI语音识别应用(免费的) 官方网址:https://ai.baidu.com/tech/speech 点击立...
  • 利用Python和API轻松实现:语音转文字,文字转语音语音转文字(支持实时麦克风输入和从音频文件读入):百度 API科大讯飞 APISpeechRecognition (CMU PocketSphinx)文字转语音:pyttsx3EnvironmentPython 3.6.7MacOS...
  • 小编为大家提供了语音转文字工具免费版,一款通过Python编写语音转文字软件。用户通过使用语音转文字工具免费版,可以将语音批量转换文字,而且操作也是非常的简单,如果你需要一款语音转文字工具的话,一定不要错过...
  • python语音识别

    2020-11-29 14:44:02
    语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相应的文字。应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。一、功能概述实现将语音转换为文字,...
  • 参考链接: Python语音识别简介 广告关闭 云服务器1核2G首年99年,还有多款热门云产品满足您的上云需求 语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相应的文字。 应用包括...
  • Python语音识别

    千次阅读 2021-02-22 17:35:05
    Python语音识别文本转换为语音   语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相 应的文字文字转换为语音。 文本转换为语音 使用 pyttsx  使用名为 pyttsx 的 python 包,你...
  • Python实现文字转语音

    千次阅读 2020-05-19 20:30:50
    Python实现文字转语音前言创建应用获取应用的API Key和Secret Key编写python代码替换API Key和Secret Key 前言 因为该功能的实现,需要使用百度的语音合成技术,所以,首先需要注册并登陆百度AI: ...
  • 干货收藏 | Python语音识别终极指南

    千次阅读 2020-12-04 03:01:21
    作者 | David Amos 编译 | 廉洁来源 | AI科技大本营原文 | python语音识别终极指南亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 8,005
精华内容 3,202
关键字:

python语音识别转文字

python 订阅