以“激发创新活力 提升发展质量”为主题的第二十五届高交会于 11 月 15 日 – 19 日在深圳拉开帷幕,即构科技作为“国家级专精特新小巨人”企业亮相本次高交会,并在现场发布即构新一代“实时音视频 AI 引擎”,创新实时互动新体验。
即构新一代“音视频 AI 引擎”从底层音视频 AI 引擎、音视频云实时传输、音视频生态能力三个方面进行了全新升级,并推出全新实时互动数智人。即构实时互动产品负责人祁伟斌在高交会现场做了详细解读。
一键接入画质提升综合方案,根据用户网络状况、手机性能、场景、预算提供最佳画质,获得超高清画质。即构视频 AI 引擎,支持 4K 60帧、HDR 超高质量视频画质,支持移动端超分、暗光增强、背景分割、色彩增强、视频降噪等能力,优化编解码,大幅提升编码效率, 节省 30% 及以上的码率,同时支持 ROI、分层编码、大小流等能力。
即构音频 AI 引擎,致力于为用户提供更加生动、有趣且具有沉浸感的音频互动体验。自研 3A 算法,获得极低性能损耗下、对噪声进行回声抑制后的纯净人声;自研场景化 AI 降噪,智能调整 AI 降噪策略,提供最佳的降噪及音质效果,且在音乐场景下,能在保留更多音乐细节的同时抑制其它噪音。此外,还有 AI 变声&混响 & 空间音频等效果,提供身临其境的音质体验。
此外,本次即构新一代“音视频 AI 引擎”发布,还对音视频云实时传输进行了全面优化,基于海量有序网络 MSDN 全球覆盖,采用最佳的采集渲染&编解码策略,从而获得最低的延迟、音质及画质,带来最优性能消耗,让即构⾳视频服务的 CPU 使用率、内存占用率、发热、耗电等各项性能表现优异。目前,即构可以做到首帧延迟低于 400ms、 视频卡顿率平均 2% 以内,极致抗弱网,端到端延迟低至 70ms、最高 80%丢包、带宽限速最低可至 30kbps。
为了给客户提供最优最全的服务,即构也在不断建设生态能力让客户快速接入。内容风控保障业务安全合规,携手智能语音行业生态服务商提供实时语音转写及翻译服务,让用户可以不惧怕语言障碍、顺利交流,还结合合作伙伴丰富的边缘计算节点、灵活的 GPU 虚拟化技术,将应用客户端云化,实现云渲染、云游戏等更多云端应用。
即构数智人作为今年推出的自研 AI 数字人平台,能够拟真还原真人表情与神态,通过文字或者语音即可驱动数字人如真人般交流互动。本次即构全新发布的“实时互动数智人”,基于行业客户的专业知识库,通过大模型和 NLP、实时推拉流、数字人形象呈现,提供互动屏、语音和文本问答、真人托管等实时交互的解决方案。
即构新一代“音视频 AI 引擎”的发布,将为用户提供更加可靠和高质量的音视频通信体验,不断赋能泛娱乐、在线教育、远程会议、数字人直播等领域,未来,即构将继续致力于音视频技术的研发和创新,不断提升产品性能和用户体验。
原创文章,作者:ZEGO即构科技,如若转载,请注明出处:https://market-blogs.zego.im/reports-news/1053/