视频生成[11]
生数科技完成数亿元A轮融资 Vidu多模态大模型加速全球布局
生数科技完成数亿元A轮融资,博华资本领投,百度战投等跟投。其核心产品Vidu多模态大模型对标OpenAI Sora,具备图文音视频生成能力,以参考生成、主体库功能解决行业痛点,服务京东、亚马逊等头部客户,ARR超2000万美元,覆盖200+国家,推动AI内容生产变革。
YouTube CEO专访:AI赋能创作者,变现新模式与电视市场新布局
2025年YouTube“Made on YouTube”活动上,CEO Neal Mohan发布AI工具矩阵,覆盖内容创作(背景生成、智能编辑)、直播优化及品牌合作,助力创作者简化流程、提升变现效率,推动从流量依赖转向多元收益。平台同时发力电视大屏,以技术重构内容生态,重新定义产业未来。
宇树科技开源UnifoLM-WMA-0:机器人动作预测通用世界模型
宇树科技开源世界模型UnifoLM-WMA-0,实现机器人动作预测与环境仿真一体化,通过双模式架构精准预判物理交互后果,降低试错成本,推动通用机器人从被动执行向主动决策升级。开源代码、模型权重及推理工具已上线GitHub,助力开发者快速应用于机械臂抓取、避障等场景。
快手可灵AI数字人技术公开:从对口型到全身表演,数字人迈入“会表演”时代
快手可灵AI推出Kling-Avatar数字人技术,突破传统数字人僵硬局限,通过多模态大语言模型实现"全身自然表演"。支持文本/音频/图像输入,生成含表情、肢体、情绪的流畅视频,口型精准、动作连贯。技术已开放公测,助力虚拟主播、动画制作等内容创作,重新定义数字人表演边界。
英伟达推出NVIDIA Rubin CPX GPU:首款百万级token上下文AI推理芯片,性能与内存双重突破
英伟达发布新一代AI推理GPU Rubin CPX,专为超大上下文处理与生成式视频打造,配备128GB GDDR7内存、30 PFLOPS算力(NVFP4精度优化),集成视频编解码单元,投资回报率达50倍,2026年底上市,重塑AI推理效率与应用边界。
快手可灵团队发布MIDAS框架:64倍压缩与500ms低延迟实现数字人多模态实时交互
快手可灵团队发布MIDAS框架,破解数字人实时交互高延迟与多模态融合难题,端到端延迟<500ms,支持音频、文本、姿态协同控制。通过64倍压缩自编码器、双阶段生成设计,实现自然对话、跨语言歌唱等场景落地,推动虚拟主播、元宇宙社交等领域数字人交互升级。
AI视频生成初创公司Higgsfield完成5000万美元A轮融资,GFT Ventures领投
AI视频生成公司Higgsfield完成5000万美元A轮融资,以“Click-to-Video”技术简化视频创作,吸引超1100万用户,瞄准6000亿短视频市场。融资将用于扩展企业级功能、扩充团队及市场推广,助力从个人到企业用户高效创作,推动内容产业生态重塑,同时面临市场竞争等挑战。
Recall.ai发布桌面录制SDK:无需会议机器人,推动会议数据API化变革
Recall.ai桌面录制SDK革新会议录制技术,告别传统机器人参会模式,终端本地采集+云端API输出,攻克大规模高可靠录制难题。具备动态发言人识别、智能视频合成等核心能力,提升数据质量与AI处理效率,服务金融、医疗、销售分析等2000+企业客户,低延迟高可靠,合规保障数据安全,助力企业挖掘会议数据价值。
YouTube多语言音频功能全面开放 创作者国际观看时长显著增长
YouTube多语言音频功能已面向全球创作者开放,支持AI生成40+语言配音,大幅降低国际分发成本,非主要语言观众观看时长平均增超25%。配合多语言缩略图测试及数据洞察工具,助创作者精准定位全球受众,提升国际互动率与观看量,突破语言壁垒触达更广阔市场。
爱诗科技完成6000万美元B轮融资 刷新国内视频生成领域单次最大融资纪录 PixVerse V5图生视频全球第一
AI视频生成企业爱诗科技获阿里巴巴领投6000万美元B轮融资,系国内视频生成领域最大单次融资。公司以“让每个人成为生活的导演”为愿景,全球用户超1亿,自研PixVerse模型完成五次迭代,V5版本图生视频全球测评第一,开放平台半年生成视频超千万次,覆盖动态壁纸、公益等多元场景。