技术干货
-
让更多人乐在其中!| ZEGO实时合唱方案
在社交平台刚刚把KTV搬到线上的2017年,能做到单人音轨与伴奏音乐的对齐已经殊为不易。直到目前,也仍有相当数量的社交平台仅提供「单人独唱,众人围观」的K歌体验。 01 让更多人乐…
-
ZEGO 即构音乐场景降噪技术解析
随着线上泛娱乐的兴起,语聊房、在线 KTV 以及直播等场景在人们的日常生活中占据越来越重要的地位,用户对于音质的要求也越来越高,因此超越传统语音降噪算法的 AI 降噪算法应运而生,…
-
音视频技术持续进击,直播互动场景会如何“进化”?
小到远程会议、直播娱乐,大到元宇宙话题中对于未来互动方式的讨论,音视频技术与我们生活方式的变革息息相关。目前,音视频赛道的技术突破,也给直播互动带来了很多新的玩法和形式。音视频领域…
-
SDK 接入|游戏语音之“范围语音”接入实践
语音是线上游戏用户的主要交流方式,大多数用户会通过游戏中的内置语音功能与其他玩家沟通,而一些用户在游戏没有内置语音功能的情况下,通过其他语音软件与玩家沟通。 并且,游戏语音在玩家开…
-
【限时免费领取】2020-2022音视频 & 元宇宙行业报告精华合集,可单份或一次性打包下载!
各位开发者小伙伴,社区运营小姐姐为大家准备了一份技术大礼包。涵盖音视频、元宇宙两大领域2020-2022年度精选行业分析报告,现开启限时免费领取! 微信扫码获取行业报告,开启你的学…
-
音视频开发进阶第七讲:分辨率与帧率·上篇
在视频系列的前几篇推文中,我们已经接触了视频相关的不少概念,它们都是围绕着几个核心角色 :色彩、像素、图像和视频来展开的。这几个核心角色之间的关系,大家应该都有了基本的了解,我们再…
-
即构 ZIM 在超大房间架构模型设计上的思考与实践
大型群聊聚集了同一项目爱好者,将单纯的群聊功能转变为线上俱乐部性质的大型发烧友群聊,如APP场景中大规模用户的即时消息推送,是区别于普通 IM 房间的,类似这种超大规模 IM 通讯…
-
什么是图像位深【音视频基础知识】
计算机在处理图像时,需要按一定规则将像素数据从内存中读取出来。这里的“规则”,首先基于色彩的采样 & 存储格式,其规定了色彩分量的“存储顺序”以及“分平面存储逻辑”。但仅知…
-
大规模连麦的技术难点及如何突破(万人实时互动能力养成)
早在五年前,ZEGO就推出了支持32人实时互动的视频通话连麦技术,比苹果的FaceTime早一年实现该能力。 但时至今日,在大多数用户的感知中,支持同时上麦互动的人数也并未显著提升…
-
图像宽高(Width、Height)与跨距(Stride)【音视频基础知识】
“图像的基本组成单元为像素,对视频图像的存储,实际上是对像素的存储”。基于图像位深,我们可以确定存储一个像素所需的字节数,下面,可以开始“指导”计算机如何定量读取图像数据了。 像素…
-
如何设置同时推多路流
推多路流即 SDK 提供了同时推多路流的能力。 目前 SDK 支持最大推流通道数量为 4 路流,2.14.0 之前版本默认最大推流通道数量为 2 路,如需支持更多推流通道,请联系 …
-
RGB 的采样和存储【音视频基础知识】
在前文《RTC 应用中最常使用的色彩空间之 RGB 和 YUV》中,我们已经知道,图像由像素组成,而像素通过记录色彩空间各分量呈现各种各样的色彩。对于 RGB 色彩空间,其三个分量…
-
YUV的采样和存储【音视频基础知识】
1 YUV 的采样格式 大家已经知道,区别于 RGB 色彩空间,YUV 色彩空间的三个分量并非都参与颜色的表示,即便仅存在亮度分量 Y,也能呈现黑白灰的图像轮廓。而人眼对…
-
噪声抑制ANS原理解析【音频基础知识】
我们今天讨论的噪声,无论是稳态还是非稳态,都是相对于“有用的声音”(人声)的加性噪声。加性噪声和人声不相关,人声的存在与否不影响加性噪声的存在性,它们的混合信号可以通过相加得到。 …
-
基于即构 SDK 实现虚拟直播间的搭建流程
虚拟直播场景为元宇宙社交娱乐模式下的全新直播方式,由虚拟形象替代真人出镜,可以给用户打造不一样的直播体验,还可以加入表情随动、手势识别触发特效等多种玩法,在场景里支持多位虚拟形象视…
-
WebRTC 降噪模块存在的一些问题及弥补方式
通过上文 噪声抑制ANS原理解析,我们学习了 WebRTC 的一种降噪方案,大致了解了噪声抑制的基本原理。基于对这些原理的了解,我们可以进一步讨论WebRTC 降噪模块存在的一些问…
-
AI 降噪:消灭非稳态噪音的利器
摘要:轻量级神经网络降噪方法,解析 ZegoAIDenoise 的算法实现! 轻量级神经网络降噪——ZegoAIDenoise 当下,用户在进行音频通话时常常置身于各种不同的场景中…
-
RTC 应用中最常使用的色彩空间之 RGB 和 YUV
本文分享在 RTC 应用中最常使用的两种色彩空间:RGB 和 YUV 。 1 RGB 首先,我们来认识一下 RGB 色彩空间。 我们前面已初步了解,RGB 色彩模型基于光的三…
-
多路混流实操流程
功能简介 混流是把多路音视频流从云端混合成单流的技术。 1混流优点 2混流常见使用场景 3混流使用说明 SDK 既支持音视频混流,也支…
-
如何选择音频编解码格式【音视频编码基础知识】
在上文中我们除了提及的 AAC ,常见的音频编解码格式还有:OPUS、SILK、SPEEX、MP3、iLBC、AMR、Vorbis、G.7 系列等等,而在 RTC 应用中常用的有 …