数字人[2]

快手可灵AI数字人技术公开:从对口型到全身表演,数字人迈入“会表演”时代

快手可灵AI推出Kling-Avatar数字人技术,突破传统数字人僵硬局限,通过多模态大语言模型实现"全身自然表演"。支持文本/音频/图像输入,生成含表情、肢体、情绪的流畅视频,口型精准、动作连贯。技术已开放公测,助力虚拟主播、动画制作等内容创作,重新定义数字人表演边界。

快手可灵团队发布MIDAS框架:64倍压缩与500ms低延迟实现数字人多模态实时交互

快手可灵团队发布MIDAS框架,破解数字人实时交互高延迟与多模态融合难题,端到端延迟<500ms,支持音频、文本、姿态协同控制。通过64倍压缩自编码器、双阶段生成设计,实现自然对话、跨语言歌唱等场景落地,推动虚拟主播、元宇宙社交等领域数字人交互升级。