当实时互动爆发后,谁会成为领跑者?
发表于 2022-01-24 14:09:56

在疫情线上化需求的催化和元宇宙的宏大概念下,实时音视频是近两年开发界最火热的技术领域了。几天前,第三方国际分析机构 IDC 最新出炉的《中国视频云市场跟踪(2021 上半年)》报告,详细调查了在中国音视频RTC 技术领域的厂商份额,最终的结果是:声网 Agora 以 43.4% 的占比蝉联市场份额第一,2021 年上半年份额甚至大于 2-8 位厂商的总和!

国内实时音视频赛道玩家涌入,第一名为什么是声网?

随着全球疫情爆发、元宇宙概念火热,音视频需求猛增,实时音视频赛道从最早的通讯服务中独立出来,实时音视频市场也发生了剧烈变化,互联网头部大厂纷纷涉足其中。阿里云、腾讯云、华为云等入局,让实时音视频赛道涌入越来越多的玩家。在声网近日发布的首个 RTE 赛道全景报告《实时互动场景创新生态报告》中显示,“预计 2025 年,RTE 行业将是千亿规模市场,5 年内复合增长率达 40% 以上”。这证明了实时音视频赛道未来的巨大的发展空间。

当前,在 IDC 的市场份额报告中,声网持续保持着第一的市场份额,并且在音视频 RTC 领域几乎形成独占性优势。

能够在垂直赛道赢过众多大厂,并占据绝对优势,让业界不禁想知道,RTC的第一名,为什么是声网?

回顾声网 2021 年的举措,作为领域内首家且唯一一家上市企业,在上市之后,仍然投入了大量精力在技术与产品的打磨精进中。

2021 年初,声网收购了 IM 领域的头部技术服务商环信,推出 RTC+IM 的产品组合。之后,也进行了更全面的 RTE 产品体系布局,包括“全链路加速 FPA”、“融合 CDN 直播”、“在线K歌房解决方案”等多维度的新产品发布。2021 年声网还完成了全品类、全球范围的安全合规认证,成为行业内唯一全面合规的 RTE 厂商,从信息安全和隐私保护上,为全球客户的服务打好坚实的信息安全保障。此外,在 RTE 2021 实时互联网大会上,声网发布了基于实时互动场景的“RTE 万象图谱”,共覆盖教育、泛娱乐、IoT、金融等 20+ 行业赛道、200+ 场景。这也是 RTE 行业首个全场景的雏形,为行业开发者和创业者挖掘场景、做产品和技术创新提供更多可能性。

以底层技术创新,收获竞争硬实力

在产品与应用之下,实时音视频的底层技术主要涉及音频、视频与网络传输等。想要提供优异的实时音视频互动能力,技术厂商就必须要在这些底层技术上做出改进和创新,站在音视频技术发展的前沿,甚至引领音视频技术的发展。

在音频技术的突破,2021 年声网推出了自研的音频编解码器——Agora Silver。作为国内率先正式推出的基于机器学习的语音编解码器,Silver 在超低码率下可以提供 32KHz 采样率的超宽带编码音质。传输的码率最低可达 2.7kpbs,如遇到弱网环境,可为用户节省带宽资源,并保证高质量音频的传输。另外声网推出了自研的语音无参考客观的 Agora MoS 评分方法,实时提供当前用户的音频互动体验参考数据,是目前行业唯一支持实时通话打分、采样率覆盖全频带的评价方法。2021 年声网首创了全球第一个全自动多场景模拟声学实验室,实验室中配备了声网独创的自动化场景模拟环境,可以针对不同互动场景,进行更前沿与创新的声学测试与研究。

声网全自动多场景模拟声学实验室

在视频领域,声网在深耕实时视频画质增强技术,推出 ClearVision 1.0 方案,提供暗光增强、色彩增强、视频降噪等功能,实现对暗部区域智能补光,提升画面色彩还原度和自然度,大幅降低闪烁噪点,为使用者提供各场景的高清视频通信体验。另外,声网还支持了最新的视频编解码格式 AV1。在屏幕共享场景的同等画质下,AV1 码率约为 H.264 的 1/3至 1/2,弱网情况下清晰度对比 H264 明显提升。2021年,声网也上线了移动端支持 3 倍超分技术,在低带宽、低码率环境实现高分辨率、高清晰度画质。

在传输协议的创新中,声网推出了自研传输协议——AUT,实现在异构网络下提供针对性的弱网对抗,安全保护和网络评估能力。在弱网情况下,传输速度和到达率都高于 QUIC 和 SRT 协议。同时,声网还自研了 FEC 向前纠错算法,配合视频 SVC 编码实现不对等保护,在相同的丢包率下,比广泛使用的 RS 编码恢复效率高 50%。以及在优化 SD-RTN 传输质量上,声网提升用户体验,目前全球接近 70% 的用户享有优秀的接入体验。

在运维和稳定性上,声网实现了 AI Ops 方案,解决传统运维痛点,提供更高质量的 RTC 服务。另外,声网提升了 SDK 稳定性,保证 SDK 崩溃率为 0.004%,是行业平均水平的千分之一,卡死率方面指标仅为行业平均水平的十分之一。

以上各层面的研发投入和技术创新,让声网有了更加健壮全面的实时音视频服务能力并对外持续输出。底层技术创新,也让声网收获了竞争中最硬核的实力,也是声网蝉联份额第一的最大底气。

用RTE赋能全行业场景,“万象更新”

底层技术的过硬实力,最终是为了给客户带来更切实的业务增长与价值。过去一年,声网在和客户共同创新、打磨服务的过程中,双方对技术专业性、技术指标与业务相关性的挖掘也产生了很多对业务的震撼影响。以 CSDN 了解到声网的秀场直播案例为例,因为声网将实时互动卡顿率降低了 22%,秀场用户的观众日平均使用时长增加了 30%。在另一个同类秀场直播中,声网的技术使得视频画面分辨率从 SD 升级为 HD 高清后,月均收入增加了 10%。在教育场景中,在优化延时、卡顿率之后,大班课转变为互动性更强的 RTC 超级小班课,转化率提升已超过 25%。

在实时音视频技术不断向前发展的同时,人们线上线下的体验发生了更多新的变化,也衍生出了更多实时音视频使用场景和行业创新,例如线上展会、云演唱会、在线自习室、视频办医保、互动播客等等。

过去一年声网持续在产品和技术上发力,正是为了更快速打磨出创新场景的最佳解决方案,让开发者更便捷的打造出理想中的产品。

以实时合唱场景为例,在线唱歌已经是线上娱乐的一个重要场景,无论在疫情前后都很受欢迎,但目前实时合唱的体验受延时指标影响较大,200 毫秒延时下就可以明显感觉到合唱双方字句之间的不同步,这会使线上一起唱歌的乐趣大打折扣。目前,声网已经将实时合唱的延时降到 64ms,让这个场景在很多社交泛娱乐应用中引起了用户和玩家的兴趣,获得巨大的成长机会。

元宇宙 2021 年在互联网上爆火,RTE 已经成为帮助元宇宙场景增加临场感和沉浸感的基础设施。过去一年中,声网在元宇宙领域可谓动作频频,不仅与 HTC Vive、创幻科技、Rokid 等企业在各领域展开合作,近期还专门推出了“MetaChat 元语聊”场景解决方案,提供了全新的语聊方式,“ MetaChat 元语聊”支持 360° 空间音频,为语聊房中的玩家带来身临其境的聊天体验和更为沉浸的在场参与感,让元宇宙场景的沟通更高效、更有趣。

进一步分析,声网的 360° 空间音频是增加临场感和沉浸感最关键的技术之一。360° 空间音频采用纯软件算法方案,能够模拟头部球面区域立体声场,因此不受硬件的限制,用户使用普通耳机在手机或电脑上就能体验。当用户操作 Avatar 在虚拟场景里移动时,听到的音效会根据 Avatar 的头部及脸部朝向、声源角度和距离不同而变化,完美模拟现实听觉。

声网总结和梳理了 20+ 个行业赛道超过 200 个行业场景,在 2021 年重磅推出“RTE 万象图谱”。其中在社交、直播、教育、会议等领域已初步形成成熟场景,并且未来将长期存在。此外,也有大量远超成熟场景的新萌芽场景。

基于场景,声网联合生态合作伙伴向开发者提供完整解决方案、功能更完备的一站式交付。封装后的简洁产品与服务,为全球的技术开发者解除音视频底层繁琐技术的后顾之忧,让开发者更聚焦于应用与创新的突破。

RTE2021 实时互联网大会中,声网 Agora 创始人兼 CEO 赵斌在演讲中也提到,RTE 的应用和技术能力在未来将成为 5G 下的杀手锏应用,实时音视频技术的渗透率在关键行业或将超过 50%。所以,在更远的未来,实时音视频如何服务线上线下的融合,还有无限的想象力,而那些“科幻”的场景也将更快走进我们的生活。

例如在互动虚实结合上,人们将可以和虚拟人物沟通,交流击掌、聊天,甚至踢球。感官虚实结合领域,在元宇宙中,人们可以对自己的虚拟形象实现更丰富而具体的操控。场景虚实结合中,使用 VR 等全息设备,实时音视频技术将更高精度和灵敏度地还原专业工作的物理场景等等。

以实时音视频技术,驱动全行业的创新与发展,将是 RTE 赛道的重要机会。实时音视频潜藏的无限潜力,也将由具有底层技术实力的厂商去引爆。声网作为目前份额第一的技术厂商,如何去创新、引领行业的发展,值得期待!

CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
微博关注
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件有任何怀疑或质疑,请立即与CSDN联系,我们将迅速给您回应并做处理。】