精华内容
下载资源
问答
  • 音频转换文字工具.exe

    2020-03-18 14:58:33
    本软件可将现有的音频文件转换成文字,生成TXT或WORD文件。软件适用的系统:winXP/vista/win7/win8/win10/Mac 虚拟 windows,要求用户电脑保障至少 1M 上行宽带或手机热点信号充足,网络信号强弱会直接影响语音转写...
  • 音频转换文字.zip

    2020-08-28 17:57:15
    录音转文字,语音转文字,文字转语音,多国语言翻译。一款智能文字、语音互转的文字语音转换软件。录音转换文字_音频录音,精准识别,免费下载,适用教育培训,媒体传播等各种场景下的音频转文字需求!
  • 科大讯飞语音识别自己写的demo,已经过自测没有问题; 1.使用前建议下载看科大讯飞的接口文档 http://doc.xfyun.cn/msc_java/299249; MSC Develop Manual for Java.pdf 2.必须添加语音识别的jar包
  • 主要实现的是java平台的音频转文字,默认的是普通话,先上传到讯飞的服务器,得到data,再result读取data,之后再通过json解析,得到你需要的内容
  • 视频 音频转换 音频转文字 字幕,字幕处理规则。录音啦
  • 亲测:真正免费的音频转文字软件

    万次阅读 2020-10-23 16:13:23
    在网上找了不少软件,比如搜狗音频助手、迅捷、科大讯飞等一系列软件,不论是在线还是客户端,一开始都说是免费的,结果进去先要注册,微信验证,手机号验证完之后才知道,转换服务并不是免费的,一般都有限制时长,...

    因工作上的需要,要将会议现场录音转为文本,以提高工作效率。

    在网上找了不少软件,比如搜狗音频助手、迅捷、科大讯飞等一系列软件,不论是在线还是客户端,一开始都说是免费的,结果进去先要注册,微信验证,手机号验证完之后才知道,转换服务并不是免费的,一般都有限制时长,1小时是比较常见的。

    但是我们会议一般都得2、3个小时起,没法使用这些赠送的时长,最后找啊找,找到一个浮云软件,安装后倒是可以用,但是转换比较慢,2个多小时的音频,按进度条预计得6个小时以上,转换出的结果貌似也不是很理想,就没再用了。

    最后,找到一个:i滴云听写www.voiceclub.cn,在线的,用手机号登录后,就可以用这个转换服务。

    点击立即试用,

    点击左侧的录音转文字,然后点添加音频,转写场景有默认选项可以不管,最后点开始转写。

    这是正在转换,2个半小时的m4a格式的音频,预计需要1个小时左右,应该算比较快的。

     

    目前正在等待转换结果,转换完再评估一下准确率。

    展开全文
  • 网上有很多的相关软件都可以实现音频转文字,但是这些软件中大多是收费的,而且有一些软件的费用还不低,但是对于用户来说,谁不希望找到一款免费而且好用的小工具。免费且好用说起来简单,但是到底哪款是这样的呢?...

    进入职场的人士,学生,许许多多的人群中,应该有一部分人会遇到想把录音转文字,语音转文字甚至是视频转文字的时候。工作中会议内容需要整理文案记录,学习中老师讲课的重点需要记录,或者平时一大段的音频内容,但我们只需要其中的几分钟,从头开始播放感觉太浪费时间了。网上有很多的相关软件都可以实现音频转文字,但是这些软件中大多是收费的,而且有一些软件的费用还不低,但是对于用户来说,谁不希望找到一款免费而且好用的小工具。免费且好用说起来简单,但是到底哪款是这样的呢?我们如果网络一搜索出来的太多了,知道很多人面临这样的问题,所以我把自己喜欢的一款免费音频转文字的工具介绍给大家,微信小程序“微转写”便是我要说的主角,它的操作也是非常方便的,下面简单说明一下:

    第一步:打开微信,在搜索栏搜索“微转写”,你会看到微信小程序“微转写”出现。

    第二步:点击进入“微转写”,选择音频转文字。

    第三步:上传音频到云端,把音频云端地址粘贴到下方输入框中。

    第四步:点击一键转写即可完成。

    在这里插入图片描述

    打开微信就可以使用,每天无限次的免费使用,而且除了音频转文字还可以视频转文字,你们确定不去试用吗?

    展开全文
  • win10电脑音频转文字

    千次阅读 2020-04-24 20:04:33
    5、声音输出选择扬声器,否则讯飞输入法无法识别到电脑音频(可以插有线耳机,但不要用蓝牙耳机) 6、播放一段音频,将光标移动到文本框,此时点击讯飞输入法语音输入悬浮窗就可以将音频转文字啦 → PS:如果觉得...

    1、在应用商店下载讯飞输入法

     

    2、将讯飞输入法语音输入设置为连续录音

     

    3、设置 → 系统 → 声音 → 管理声音设备,点击立体声混音,点击启用

     

    4、返回上一界面,点击高级声音选项的应用音量和设备首选项,将讯飞输入法的输入改为立体声混音(需要启动讯飞输入法的语音输入功能才会出现讯飞输入法语音这一项)

     

    5、声音输出选择扬声器,否则讯飞输入法无法识别到电脑音频(可以插有线耳机,但不要用蓝牙耳机)

     

    6、播放一段音频,将光标移动到文本框,此时点击讯飞输入法语音输入悬浮窗就可以将音频转文字啦

      

     

    PS:如果觉得识别效果不好,可以试试调大音量

    展开全文
  • 百度提供REST API和完整的SDK,其中REST API 仅支持整段语音识别的模式,即单段语音音频时长不超过60s;完整的SDK识别不限时长。 本来想用linux-C+±SDK,下载:百度AI开放平台-全球领先的人工智能服务平台-百度AI...


    此文首发于我的Jekyll博客:zhang0peter的个人博客

    应该在暑期的时候就有这个想法,想把录音转文字,语音转文字甚至是视频转文字。

    因为有些时候有大段的音频内容,但我只需要其中的几分钟,从头开始播放感觉太浪费时间了。

    网上有很多收费的解决方案软件,比如讯飞就做的不错,安卓端的APP用起来也很方便,就是贵了点。

    然后我看到了这个知乎问题:有能把录音变成文字的软件么? - 知乎

    下面按识别准确率和易用性来排序各个软件。

    网易见外工作台(推荐)

    有人推荐:网易见外工作台

    每天可以免费使用2小时,支持视频翻译,语音翻译,语音转写,图片翻译,文档翻译。

    上传录音后等待几分钟,识别结果出来。

    中文的识别准确率不错:

    反正我虽然说我我的转变过程吧,我当时这样的就是因为我在找工作。我在研一研二下个月上半学期的时候要找工作,所以我要去频繁的刷这个算法。因为我那时候发现我要找的是外企吗?外企的那个侧重角度更偏向于算法数据结构,还有一些的系统设计。在当时我的那个项目经历还不是很丰富的时候,你要想给面试官一个眼前一亮或者是印象深刻的一个想法的话,其实算法是一个比较性价比高点的事情。

    优点:网页版直接使用,无需编程基础,识别准确率非常高

    缺点:每天限制使用2小时

    Chrome插件 Speechnotes

    有人推荐Chrome插件:Speechnotes 听写记事本 - Chrome 网上应用店

    不用注册,在线实时声音转文字。

    试了一下,对中文的实时识别效果不错:

    要找工作,所以我要去平凡的策略算法.因为我那时候发现我要找的是外企吗,买气的那个特种角度更偏向于算法数据结构一些的系统设计.在当时我的那个项目经历还不是很丰富的时候,你要想给面试官一个眼前一亮或者印象深刻的一个想法的话,其实算法是一个比较轻价比高的一个事情。

    优点:直接使用,支持实时语音,对会议记录的帮助很大,准确性高

    缺点可以忽略不计

    autosub

    有人推荐这个库: [NO LONGER MAINTAINED] Command-line utility for auto-generating subtitles for any video file。但这个库的原作者一年前就不维护这个库了,现在由一个国人维护: Command-line utility to transcribe/translate from video/audio/subtitles to subtitles

    这个Python库做的是通过Google Web Speech APIvideo or an audio转换成SRT字幕或者json格式的文本。

    安装ffmpegautosub

    apt install ffmpeg python python-pip git -y
    pip install git+https://github.com/BingLingGroup/autosub.git@alpha ffmpeg-normalize
    

    使用示例:

    ->% autosub -i 54.mp3 -S zh
    ........
    Converting speech regions to short-term fragments.
    Converting: 100% |#############################################################################################################################| Time:  0:02:37
    
    Sending short-term fragments to Google Speech V2 API and getting result.
    Speech-to-Text: 100% |#########################################################################################################################| Time:  0:02:22
    Speech language subtitles file created at "42.zh.srt".
    
    All works done.
    

    结果如下:

    我当时这样的就是因为我在找工作我在严依然而下班上面学期的首要找工作所以,作者我要去平凡的穿着算法,因为我那时候发现我要找的是外企吗,白起的那个特征角度,更偏向于算法数据结构而一切的系统设计,在当时我的那个项目经历还不是很丰富的时候呢,你要想给面试官一个眼前一亮或者印象深刻的一个想法的话其实算法是一个逼,是一个比较现在的高低的事情。

    准确性稍差

    优点:不限时转换

    缺点:需要谷歌,而且准确性没前2个好

    百度语音识别API

    百度AI开发平台提供免费的语音识别API接口:百度智能云-管理中心

    注册后获得

    百度提供REST API和完整的SDK,其中REST API 仅支持整段语音识别的模式,即单段语音音频时长不超过60s;完整的SDK识别不限时长。

    本来想用linux-C+±SDK,下载:百度AI开放平台-全球领先的人工智能服务平台-百度AI开放平台

    但这个SDK只支持g++4.8和x64,无语了。

    随后我打算使用Python的REST API,支持pcm, wav, m4a格式音频,而且每段限时1分钟,转换格式:

    ffmpy 安装教程参考:anaconda 下安装ffmpeg

    安装库:

    pip install baidu-aip
    

    Python代码如下:

    from aip import AipSpeech
    import ffmpy
    import os
    
    """ 你的 APPID AK SK """
    APP_ID = '10540827'
    API_KEY = 'PS79KGjFGoUlcuMVY5Lu0srs'
    SECRET_KEY = '963de1bda70666389ed7dce7894594ef'
    
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    
    
    # 读取文件
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
    
    
    FILENAME = "42.mp3"
    # mp3转换为wav
    ff = ffmpy.FFmpeg(
        inputs={FILENAME: None},
        global_options=['-y'],
        outputs={'output.wav': '-ar 16000'})
    ff.run()
    # 把wav文件切割为小块
    ff_split = ffmpy.FFmpeg(
        inputs={'output.wav': None},
        global_options=['-y'],
        outputs={'temp_wav%d.wav': '-f segment -segment_time 30 -c copy'})#每段30秒
    ff_split.run()
    
    text = ''
    
    files = [f for f in os.listdir('.') if os.path.isfile(f) and 'temp_wav' in f]
    for filename in files:
        # 识别本地文件
        result = client.asr(get_file_content(filename), 'wav', 16000, {
            'dev_pid': 1536,
        })
        if 'error_msg' in result or result['err_no'] != 0:
            print(result)
        else:
            print(result['result'][0])
            text = text + result['result'][0]
        os.remove(filename)
    
    with open('result.txt', 'w') as f:
        f.write(text)
    

    我进行测试的时候,返回结果不正常,有色情内容,可能有黑客侵入了百度的系统,我就不做评判了。

    IBM的Speech to Text(不推荐)

    另外一个免费的工具是IBM推出的Speech to Text 工具,也是免费的:Watson Speech to Text - 概述 - 中国 IBM

    注册账户后打开页面Speech to Text - IBM Cloud

    选择Lite套餐,每个月有500分钟免费的音频转文字套餐,缺点是不能转录100M以上大小的音频(异步调用可以转录最大1G的音频)。

    推荐使用Python操作api,直接使用curl返回的结果是json,不利于进一步操作。

    安装库:pip install --upgrade ibm-watson

    代码如下:

    from ibm_watson import SpeechToTextV1
    from ibm_cloud_sdk_core.authenticators import IAMAuthenticator
    
    authenticator = IAMAuthenticator('API')
    speech_to_text = SpeechToTextV1(
        authenticator=authenticator
    )
    speech_to_text.set_service_url(
        'https://api.us-south.speech-to-text.watson.cloud.ibm.com/instances/xxxxxxxx')
    
    f = open("42.mp3", "rb")
    result = speech_to_text.recognize(audio=f, content_type='audio/mp3', model='zh-CN_NarrowbandModel')
    l = result.result['results']
    text = ''
    for i in l:
        text = text + i['alternatives'][0]['transcript'] + ','
    
    fo = open("audio-text.txt", "w")
    fo.write(text)
    fo.close()
    

    对中文的识别效果并不好:

    反正 我 涮 肉 我 我的 转 亮果厂 吧 ,我 当时 这样的 就是 因为 我的 找工作 我 再 延期 你 而 下的 上面 学习 的 首要 找工作 索要 去 平方米 川 流 ,你 没有 那时候 发现 我要 找 的 是 外企 吗 ,那个 特种 较多 ,更 偏向 与 结构 ,写 的 系统 设计 ,在 当时 我的 那个 项目 经理 还不是 很 丰富 的 时候 ,你 要想 给 面食 馆 一个 眼前 一 亮 或者 印象 深刻 的一个 想法 的话 其实 上海 是一个 比较 性价比 高的 的 事情

    IBM和谷歌的接口效果不好的原因是,他们把音频切为一段一段进行识别,并不会根据上下文来调整文字,准确性自然低。

    如果不加@符号会报错:

    {
       "code_description": "Bad Request", 
       "code": 400, 
       "error": "Stream was 15 bytes but needs to be at least 100 bytes."
    }                
    

    如果文件大小超过100M,会报错:

    <HTML><HEAD>
    <TITLE>Internal Server Error</TITLE>
    </HEAD><BODY>
    <H1>Internal Server Error - Write</H1>
    The server encountered an internal error or misconfiguration and was unable to
    complete your request.<P>
    Reference&#32;&#35;4&#46;c8142017&#46;1580636884&#46;75fa462e
    </BODY></HTML>
    
    展开全文
  • 科大讯飞音频转文字使用(Java)

    千次阅读 2020-12-08 12:57:39
    //音频文件路径 //1、绝对路径:"C:/Users/WJL/Desktop/Java_lfasr4.1/target/classes/audio/lqh.mp3" //2、相对路径:./resources/audio/lfasr.mp3 //3、通过classpath: private static final String AUDIO_FILE_...
  • 视频or音频转文字的处理方案

    千次阅读 2019-03-26 19:21:57
    1,windows下有软件,百度一搜索一堆,但效果一般,推荐“录音啦” 2,开源软件autosub,archtime(视频添加字幕),其中autosub以来google的语音识别接口,...ffmpeg视频提取音频为wav ffmpeg -i 01-20170326.mp4 ...
  • 基于google云平台实现音频转文字

    千次阅读 2018-09-26 10:34:36
    google云平台包含了相当多的服务,而我们本次的目的是实现将音频识别为文字,所以需要查找并添加speech recognition方法。 在左侧菜单的“API和服务”下找到“库”,并输入“speech recognition"。 ...
  • 文章目录第一步:下载软件第二步:导入视频素材第三步:等听译结束第四步:人工差错(识别难免有错)第五步:压制第六步:可导出字幕第七步:最重要的一步 第一步:下载软件 字幕制作工具 软件免费不收费!...
  • 几行代码,抱上IBM爸爸大腿,实现音频快速转文字~用到了IBM Waston的Speech to text(目前还是个demo) 碎碎念的废话~ 前几天工作中遇到需要把音频转为文字稿的任务,顺便学了个新词语:扒词。扒词:根据视频信息...
  • Python音频转文字之autosub

    万次阅读 2019-06-19 12:08:46
    音频转化成文字进行保存,输入可以是音频文件,也可以是视频文件,最终保存是文本文件。 Autosub就是今天用到的工具。 类似一个传话筒的工具吧。他会动态调用google的api,googl给他最终的结果。测试了一下。为一...
  • 很多办公的朋友在会议记录的时候都会用手写笔记活码字来记录会议内容,这样的话很难跟上会议发言人的速度,有得时候还会因为漏了重点而被...方法二:录音转文字助手 第一步:首先我们在百度手机助手或者应用市场里...
  • JAVA语音转文字

    2017-12-13 21:38:47
    在工程中如果需要用到语音转文字功能,可以使用本代码,修改后调用。测试时可以运行main.java文件,根据控制台提示信息,进行录音,然后自动转化为文字。
  • MATLAB语音转文字.7z

    2020-04-17 19:14:23
    这个代码实现了MATLAB语音转文字,用了别人公布的AccessToken所以不需要你去申请百度API的一个id和密码。可以直接运行。
  • 声音的 请按照教程尝试将音频转换为文本
  • 话不多说,直接上代码运行截图  1.语音合成 ——-> 执行: 结果: ...输入要转换的内容,程序直接帮你把转换好的mp3文件输出(因为下一步–语音识别–需要.pcm格式的文件,程序自动执行格式转换,同时生成17k.pcm...
  • 语音转文字.rar

    2019-10-05 11:16:02
    tts语音包,2个系统必要的安装包,一个英文语音播报示例,一个基于H5的语音播报示例
  • 将莫尔斯电码的音频转换为英文文本。 句法: demorse('你的文件.wav') 这是快速而肮脏的版本。
  • 本程序在vs2013下完美运行,如果编译不通过,请先下载Microsoft Speech SDK,并设置好对应选项,程序分为两部分,分为语音转文字和文字转语音
  • 浮云语音转文字是款可以批量转换音频文件的工具。它可以帮助用户将音频转换成文本,如果有想要快速浏览的小伙伴们可以将音频转换成文本...适用于会议录音,采访录音及电话录音等各种场景下的音频转文字需求。 使用方法
  • Python(九)- 音频文字转换

    千次阅读 2020-04-05 17:42:04
    Python 是一门通用性很强的语言,本文主要讲述其中的音频模块 gtts(Google文本到语音)的使用。 1.音频模块简介 文本语音: ...win32com:Windows操作系统内置的语音引擎实现文字发音 音频...
  • C# 开发的离线语音识别,语音转文字,可以识别短语音,指定识别库,程序已测试运行成功,识别速度快,需要的可以自行修改使用
  • 文字转音频工具 文字转音频工具
  • 如何在线把音频转文字

    千次阅读 2019-09-17 13:32:32
    但音频格式的种类是很丰富的,没有那么的直观,那么为了方便使用,我们就需要把采访音频转写成文字。可是我们该如何实现呢?下面小编就来给大家分享一下吧。 第一步:打开手机应用商店,搜索【录音转文字助手】再把...
  • 但音频格式的种类是很丰富的,没有那么的直观,那么为了方便使用,我们就需要把采访音频转写成文字。可是我们该如何实现呢?下面小编就来给大家分享一下吧。 第一步:打开手机应用商店,搜索【录音转文字助手】再把...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 35,423
精华内容 14,169
关键字:

怎么音频转文字