视频生成[16]
快手可灵团队发布MIDAS框架:64倍压缩与500ms低延迟实现数字人多模态实时交互
快手可灵团队发布MIDAS框架,破解数字人实时交互高延迟与多模态融合难题,端到端延迟<500ms,支持音频、文本、姿态协同控制。通过64倍压缩自编码器、双阶段生成设计,实现自然对话、跨语言歌唱等场景落地,推动虚拟主播、元宇宙社交等领域数字人交互升级。
AI视频生成初创公司Higgsfield完成5000万美元A轮融资,GFT Ventures领投
AI视频生成公司Higgsfield完成5000万美元A轮融资,以“Click-to-Video”技术简化视频创作,吸引超1100万用户,瞄准6000亿短视频市场。融资将用于扩展企业级功能、扩充团队及市场推广,助力从个人到企业用户高效创作,推动内容产业生态重塑,同时面临市场竞争等挑战。
Recall.ai发布桌面录制SDK:无需会议机器人,推动会议数据API化变革
Recall.ai桌面录制SDK革新会议录制技术,告别传统机器人参会模式,终端本地采集+云端API输出,攻克大规模高可靠录制难题。具备动态发言人识别、智能视频合成等核心能力,提升数据质量与AI处理效率,服务金融、医疗、销售分析等2000+企业客户,低延迟高可靠,合规保障数据安全,助力企业挖掘会议数据价值。
YouTube多语言音频功能全面开放 创作者国际观看时长显著增长
YouTube多语言音频功能已面向全球创作者开放,支持AI生成40+语言配音,大幅降低国际分发成本,非主要语言观众观看时长平均增超25%。配合多语言缩略图测试及数据洞察工具,助创作者精准定位全球受众,提升国际互动率与观看量,突破语言壁垒触达更广阔市场。
爱诗科技完成6000万美元B轮融资 刷新国内视频生成领域单次最大融资纪录 PixVerse V5图生视频全球第一
AI视频生成企业爱诗科技获阿里巴巴领投6000万美元B轮融资,系国内视频生成领域最大单次融资。公司以“让每个人成为生活的导演”为愿景,全球用户超1亿,自研PixVerse模型完成五次迭代,V5版本图生视频全球测评第一,开放平台半年生成视频超千万次,覆盖动态壁纸、公益等多元场景。
拍我AI限时免费开放,零门槛体验AI视频创作轻量化新纪元
9月5日-10日,国内AI视频生成平台“拍我AI”(PixVerse中国版)启动免费开放日活动,用户可零门槛体验AI视频创作新纪元。作为首批集成谷歌Gemini 2.5 Flash Image(Nano Banana)技术的平台,其凭借低延迟特性,30秒短片数秒生成,支持文生视频(3秒)与图生视频(30秒),搭配Agent助手自动生成脚本、音效字幕,简化“上传-生成-微调”流程。模板覆盖宠物短剧、3D手办动画等多元场景,全球用户已破亿,所有视频自动添加“AI生成”水印保障合规。即刻参与,零门槛体验谷歌技术加持的轻量化创作,让灵感秒变动态画面!