精华内容
下载资源
问答
  • 亲测:真正免费的音频转文字软件

    千次阅读 2020-10-23 16:13:23
    在网上找了不少软件,比如搜狗音频助手、迅捷、科大讯飞等一系列软件,不论是在线还是客户端,一开始都说是免费的,结果进去先要注册,微信验证,手机号验证完之后才知道,转换服务并不是免费的,一般都有限制时长,...

    因工作上的需要,要将会议现场录音转为文本,以提高工作效率。

    在网上找了不少软件,比如搜狗音频助手、迅捷、科大讯飞等一系列软件,不论是在线还是客户端,一开始都说是免费的,结果进去先要注册,微信验证,手机号验证完之后才知道,转换服务并不是免费的,一般都有限制时长,1小时是比较常见的。

    但是我们会议一般都得2、3个小时起,没法使用这些赠送的时长,最后找啊找,找到一个浮云软件,安装后倒是可以用,但是转换比较慢,2个多小时的音频,按进度条预计得6个小时以上,转换出的结果貌似也不是很理想,就没再用了。

    最后,找到一个:i滴云听写www.voiceclub.cn,在线的,用手机号登录后,就可以用这个转换服务。

    点击立即试用,

    点击左侧的录音转文字,然后点添加音频,转写场景有默认选项可以不管,最后点开始转写。

    这是正在转换,2个半小时的m4a格式的音频,预计需要1个小时左右,应该算比较快的。

     

    目前正在等待转换结果,转换完再评估一下准确率。

    展开全文
  • 百度提供REST API和完整的SDK,其中REST API 仅支持整段语音识别的模式,即单段语音音频时长不超过60s;完整的SDK识别不限时长。 本来想用linux-C+±SDK,下载:百度AI开放平台-全球领先的人工智能服务平台-百度AI...


    此文首发于我的Jekyll博客:zhang0peter的个人博客

    应该在暑期的时候就有这个想法,想把录音转文字,语音转文字甚至是视频转文字。

    因为有些时候有大段的音频内容,但我只需要其中的几分钟,从头开始播放感觉太浪费时间了。

    网上有很多收费的解决方案软件,比如讯飞就做的不错,安卓端的APP用起来也很方便,就是贵了点。

    然后我看到了这个知乎问题:有能把录音变成文字的软件么? - 知乎

    下面按识别准确率和易用性来排序各个软件。

    网易见外工作台(推荐)

    有人推荐:网易见外工作台

    每天可以免费使用2小时,支持视频翻译,语音翻译,语音转写,图片翻译,文档翻译。

    上传录音后等待几分钟,识别结果出来。

    中文的识别准确率不错:

    反正我虽然说我我的转变过程吧,我当时这样的就是因为我在找工作。我在研一研二下个月上半学期的时候要找工作,所以我要去频繁的刷这个算法。因为我那时候发现我要找的是外企吗?外企的那个侧重角度更偏向于算法数据结构,还有一些的系统设计。在当时我的那个项目经历还不是很丰富的时候,你要想给面试官一个眼前一亮或者是印象深刻的一个想法的话,其实算法是一个比较性价比高点的事情。

    优点:网页版直接使用,无需编程基础,识别准确率非常高

    缺点:每天限制使用2小时

    Chrome插件 Speechnotes

    有人推荐Chrome插件:Speechnotes 听写记事本 - Chrome 网上应用店

    不用注册,在线实时声音转文字。

    试了一下,对中文的实时识别效果不错:

    要找工作,所以我要去平凡的策略算法.因为我那时候发现我要找的是外企吗,买气的那个特种角度更偏向于算法数据结构一些的系统设计.在当时我的那个项目经历还不是很丰富的时候,你要想给面试官一个眼前一亮或者印象深刻的一个想法的话,其实算法是一个比较轻价比高的一个事情。

    优点:直接使用,支持实时语音,对会议记录的帮助很大,准确性高

    缺点可以忽略不计

    autosub

    有人推荐这个库: [NO LONGER MAINTAINED] Command-line utility for auto-generating subtitles for any video file。但这个库的原作者一年前就不维护这个库了,现在由一个国人维护: Command-line utility to transcribe/translate from video/audio/subtitles to subtitles

    这个Python库做的是通过Google Web Speech APIvideo or an audio转换成SRT字幕或者json格式的文本。

    安装ffmpegautosub

    apt install ffmpeg python python-pip git -y
    pip install git+https://github.com/BingLingGroup/autosub.git@alpha ffmpeg-normalize
    

    使用示例:

    ->% autosub -i 54.mp3 -S zh
    ........
    Converting speech regions to short-term fragments.
    Converting: 100% |#############################################################################################################################| Time:  0:02:37
    
    Sending short-term fragments to Google Speech V2 API and getting result.
    Speech-to-Text: 100% |#########################################################################################################################| Time:  0:02:22
    Speech language subtitles file created at "42.zh.srt".
    
    All works done.
    

    结果如下:

    我当时这样的就是因为我在找工作我在严依然而下班上面学期的首要找工作所以,作者我要去平凡的穿着算法,因为我那时候发现我要找的是外企吗,白起的那个特征角度,更偏向于算法数据结构而一切的系统设计,在当时我的那个项目经历还不是很丰富的时候呢,你要想给面试官一个眼前一亮或者印象深刻的一个想法的话其实算法是一个逼,是一个比较现在的高低的事情。

    准确性稍差

    优点:不限时转换

    缺点:需要谷歌,而且准确性没前2个好

    百度语音识别API

    百度AI开发平台提供免费的语音识别API接口:百度智能云-管理中心

    注册后获得

    百度提供REST API和完整的SDK,其中REST API 仅支持整段语音识别的模式,即单段语音音频时长不超过60s;完整的SDK识别不限时长。

    本来想用linux-C+±SDK,下载:百度AI开放平台-全球领先的人工智能服务平台-百度AI开放平台

    但这个SDK只支持g++4.8和x64,无语了。

    随后我打算使用Python的REST API,支持pcm, wav, m4a格式音频,而且每段限时1分钟,转换格式:

    ffmpy 安装教程参考:anaconda 下安装ffmpeg

    安装库:

    pip install baidu-aip
    

    Python代码如下:

    from aip import AipSpeech
    import ffmpy
    import os
    
    """ 你的 APPID AK SK """
    APP_ID = '10540827'
    API_KEY = 'PS79KGjFGoUlcuMVY5Lu0srs'
    SECRET_KEY = '963de1bda70666389ed7dce7894594ef'
    
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    
    
    # 读取文件
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
    
    
    FILENAME = "42.mp3"
    # mp3转换为wav
    ff = ffmpy.FFmpeg(
        inputs={FILENAME: None},
        global_options=['-y'],
        outputs={'output.wav': '-ar 16000'})
    ff.run()
    # 把wav文件切割为小块
    ff_split = ffmpy.FFmpeg(
        inputs={'output.wav': None},
        global_options=['-y'],
        outputs={'temp_wav%d.wav': '-f segment -segment_time 30 -c copy'})#每段30秒
    ff_split.run()
    
    text = ''
    
    files = [f for f in os.listdir('.') if os.path.isfile(f) and 'temp_wav' in f]
    for filename in files:
        # 识别本地文件
        result = client.asr(get_file_content(filename), 'wav', 16000, {
            'dev_pid': 1536,
        })
        if 'error_msg' in result or result['err_no'] != 0:
            print(result)
        else:
            print(result['result'][0])
            text = text + result['result'][0]
        os.remove(filename)
    
    with open('result.txt', 'w') as f:
        f.write(text)
    

    我进行测试的时候,返回结果不正常,有色情内容,可能有黑客侵入了百度的系统,我就不做评判了。

    IBM的Speech to Text(不推荐)

    另外一个免费的工具是IBM推出的Speech to Text 工具,也是免费的:Watson Speech to Text - 概述 - 中国 IBM

    注册账户后打开页面Speech to Text - IBM Cloud

    选择Lite套餐,每个月有500分钟免费的音频转文字套餐,缺点是不能转录100M以上大小的音频(异步调用可以转录最大1G的音频)。

    推荐使用Python操作api,直接使用curl返回的结果是json,不利于进一步操作。

    安装库:pip install --upgrade ibm-watson

    代码如下:

    from ibm_watson import SpeechToTextV1
    from ibm_cloud_sdk_core.authenticators import IAMAuthenticator
    
    authenticator = IAMAuthenticator('API')
    speech_to_text = SpeechToTextV1(
        authenticator=authenticator
    )
    speech_to_text.set_service_url(
        'https://api.us-south.speech-to-text.watson.cloud.ibm.com/instances/xxxxxxxx')
    
    f = open("42.mp3", "rb")
    result = speech_to_text.recognize(audio=f, content_type='audio/mp3', model='zh-CN_NarrowbandModel')
    l = result.result['results']
    text = ''
    for i in l:
        text = text + i['alternatives'][0]['transcript'] + ','
    
    fo = open("audio-text.txt", "w")
    fo.write(text)
    fo.close()
    

    对中文的识别效果并不好:

    反正 我 涮 肉 我 我的 转 亮果厂 吧 ,我 当时 这样的 就是 因为 我的 找工作 我 再 延期 你 而 下的 上面 学习 的 首要 找工作 索要 去 平方米 川 流 ,你 没有 那时候 发现 我要 找 的 是 外企 吗 ,那个 特种 较多 ,更 偏向 与 结构 ,写 的 系统 设计 ,在 当时 我的 那个 项目 经理 还不是 很 丰富 的 时候 ,你 要想 给 面食 馆 一个 眼前 一 亮 或者 印象 深刻 的一个 想法 的话 其实 上海 是一个 比较 性价比 高的 的 事情

    IBM和谷歌的接口效果不好的原因是,他们把音频切为一段一段进行识别,并不会根据上下文来调整文字,准确性自然低。

    如果不加@符号会报错:

    {
       "code_description": "Bad Request", 
       "code": 400, 
       "error": "Stream was 15 bytes but needs to be at least 100 bytes."
    }                
    

    如果文件大小超过100M,会报错:

    <HTML><HEAD>
    <TITLE>Internal Server Error</TITLE>
    </HEAD><BODY>
    <H1>Internal Server Error - Write</H1>
    The server encountered an internal error or misconfiguration and was unable to
    complete your request.<P>
    Reference&#32;&#35;4&#46;c8142017&#46;1580636884&#46;75fa462e
    </BODY></HTML>
    
    展开全文
  • 讯飞语记在音频转文字方面,我愿称它为大哥,讯飞语记是我用过的音频转文字软件中,最功能为成熟完善的一款。软件支持普通话、英语、粤语、东北话等十种语言,识别准确率高,且录音时就会开始转写,边录边转非...
    b3f1c98e78a41ee9870c2d94d2394aa2.png

    作为一名文字狗,我深知整理录音的痛苦,做一次人物采访或会议记录,大部分时间都用在了录音整理上。

    今天,我给大家推荐三款好用的录音转文字软件,安卓、iOS、电脑各一款,都是我用过的软件中认为最好的。

    讯飞语记

    97b57518d6940a6572d3eb3523a31488.png

    在音频转文字方面,我愿称它为大哥,讯飞语记是我用过的音频转文字类软件中,最功能为成熟完善的一款。

    软件支持普通话、英语、粤语、东北话等十种语言,识别准确率高,且录音时就会开始转写,边录边转非常方便。

    7eea7a567d0ed83abae42dd4fc4f1ab8.png

    另外,讯飞语记还支持实时的中英互译和中译韩、日、俄,若善于利用,初高中生用来写篇英语作文也是简单的不要不要。

    目前来讲,讯飞语计是我认为最好用的录音转文字软件,它支持安卓、iOS、电脑、网页,四端同步使用。(会员版可关注公众号获取)

    有道云笔记

    f5dbb8ca493f7a9742b5db158c9ebc0b.png

    鉴于iOS端没有讯飞语记会员版,前辈推荐有道云笔记进行代替。完全免费,语音识别正确率也不错。

    支持普通话、英语、粤语、河南话、四川话五种语言。

    录音啦

    cbbc6eb9adba24a9ab4393683510899a.png

    录音啦也是前辈认为目前电脑上较好用的录音转文字软件,最大优势是:可以将录制好的音频文件直接导入转换为文字。

    录音啦提供科大讯飞、阿里云、百度语音、云知声等识别引擎,支持普通话、英语、粤语、上海话、四川话五种语言,识别准确较好。

    以上就是前辈自己用过且认为最好的录音转文字方法。

     获取资源请关注公众号 

     回复 

     音频转文字 

    429b5a01bb9cba3e1c5e02ce742c019c.png
    展开全文
  • 音频转文字用什么软件高效转换成文字 高效办公也成为人们所追求的办事风格,比如在办公的时候,需要将音频文件快速的转换成文字,应该如何完成需要的转换呢。下面就来和大家分享一些方法,一起来学习吧 想要将音频...

    音频转文字用什么软件高效转换成文字

    高效办公也成为人们所追求的办事风格,比如在办公的时候,需要将音频文件快速的转换成文字,应该如何完成需要的转换呢。下面就来和大家分享一些方法,一起来学习吧
    null

    想要将音频转换成文字非常的简单只需要用到专业的录音文字转换工具【录音转文字助手】来帮助完成。
    null

    在将这个应用安装在手机知乎就可以点击进入到应用的界面选择【导入文件识别】这个功能
    null

    在点击后就会看到我们进入到了文件库的界面,在这里选择需要识别的文件来将文字进行识别
    null

    稍等片刻后就可以看到音频文件的内容就转换成了文字,在这里需要将音频文件识别出的文字按下复制按钮将文字使用到需要的地方了。
    null

    如果有翻译的需要的话,点下翻译按钮文字就会进行中英文翻译,也是非常的实用。
    null

    展开全文
  • 语音转文字工具(音频转文字助手)是一款很方便实用的用python编写的小工具集合。这款语音转文字工具功能全面,简单易用,使用后可以帮助用户更轻松便捷的将音频转换成文字。语音到文本工具包括图片,语音识别和pdf...
  • 音频转换文字.zip

    2020-08-28 17:57:15
    录音转文字,语音转文字,文字转语音,多国语言翻译。一款智能文字、语音互转的文字语音转换软件。录音转换文字_音频录音,精准识别,免费下载,适用教育培训,媒体传播等各种场景下的音频转文字需求!
  • 文字转换音频软件

    2012-05-03 09:54:53
    文字转变成音频(免安装) 非常简单,下载后解压就可以用了
  • 音频转换很多人都认为是中文转换成英文,其实两者相互转换...可以把英文音频转文字的app有哪些?1、首先为大家解答什么APP可以实现英文音频转换文字,目前比较常用的有录音转文字助手,该软件可以实现多国家语言转...
  • 音频转换文字工具.exe

    2020-03-18 14:58:33
    软件可将现有的音频文件转换成文字,生成TXT或WORD文件。软件适用的系统:winXP/vista/win7/win8/win10/Mac 虚拟 windows,要求用户电脑保障至少 1M 上行宽带或手机热点信号充足,网络信号强弱会直接影响语音转写...
  • 原标题:可以把英文音频转文字的工具,手机上还能录音转文字音频转换很多人都认为是中文转换成英文,其实两者相互转换使用的频率也非常高,特别是在一些外企,翻译的工作很繁重,有些凭借自己来翻译工作量非常大。...
  • 或者一些录音转文字的功能,实际都运用到了智能语音技术,可以说融入到了我们生活与学习甚至工作中,运用很是广泛,录音转文字要实现很简单,一款微信小程序“微转写”就可以简单操作完成,它都有什么优点呢?...
  • 王华:音频转文字工具,完全免费,自己用Python写的!​zhuanlan.zhihu.com一、需求分析:1、音频转文字:目前市面上的音频转文字大多收费。音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较...
  • 王华:音频转文字工具,完全免费,自己用Python写的!​zhuanlan.zhihu.com一、需求分析:1、音频转文字:目前市面上的音频转文字大多收费。音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较...
  • 录音提取转文字是一款功能非常强大的手机音频提取应用软件,录音提取转文字app为用户提供了音频转文字的功能,可以一键导出,适用于工作会议记录、学习记录、录音等。感兴趣的朋友欢迎使用西西下载!基本内容录音转...
  • 还是很简单的,现在网上有很多的工具都有语音转文字的功能,把需要转换的语音或者视频放进操作页面就可以轻松实现了,小编今天为大家介绍语音转文字的方法,可以说很实用了,软件设计也非常的简单!首先我们先来了解...
  • 今天看到一篇很好的朗读,想把它文字,现知的方法有几种: 1、手机上讯飞输入法的实时语音识别。但需要人一直在旁边,需要声音外放。 2、已知的一些识别软件或者字幕软件。但找着麻烦,有的还要付费。 3、调用...
  • 直接将文字转换为音频,支持中文英文,可以自己再下音库,安装后可以使用本机已经安装的音库。
  • 文字转换语音软件(可存储为音频文件)
  • 语音转文字工具是一款使用python写的小工具合集,语音转文字工具包括图片、语音识别、翻译pdf等功能,能帮助用户朋友进行音频转文字,文字转语音,截图文字识别等操作。软件特色1.音频转文字:目前市面上的音频转...
  • 同时呢,该软件使用起来也是非常的简单,所有的功能都在菜单中会对其进行显示,当你需要进行任何操作的时候,只需要根据功能文字提示来进行操作即可,十分的便捷。除此之外呢,在widi软件中还体用了强大的音频录制...
  • 文章目录第一步:下载软件第二步:导入视频素材第三步:等听译结束第四步:人工差错(识别难免有错)第五步:压制第六步:可导出字幕第七步:最重要的一步 第一步:下载软件 字幕制作工具 软件免费不收费!!!! ...
  • 想要体验一键音频转文字飞一般的感觉?为速记费用昂贵、录音整理复杂、查找重点困难、角色辨认模糊、录音质量低劣等问题而苦恼?别急,讯飞听见来帮你。它以语音转文字为核心功能,提供便捷高效的机器转写服务和专业...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 452
精华内容 180
关键字:

音频转文字软件