AIGC[23]
小红书发布FireRedTTS-2对话合成模型 重塑AI播客与多语言语音生成
小红书发布新一代对话合成模型FireRedTTS-2,双模块驱动革新:离散语音编码器提升效率与语义,双Transformer合成模型实现多说话人自然切换。解决行业灵活性不足、发音错误等痛点,流式解码低延迟,支持多语言,自然度逼近真人,赋能AI播客、智能对话等场景,成AIGC音频重要工具。
西湖大学发布AiraXiv与DeepReview:AI生成论文筛选评审前沿方案
AI生成论文激增致学术界“水文”筛查难题,西湖大学WestlakeNLP发布创新方案:AiraXiv预印本平台(首个AI生成论文专属渠道)与DeepReview AI审稿系统(模拟专家思考链)。二者协同实现AI论文分类管理、分钟级审稿,大幅提升筛选效率,破解传统审稿压力,引领AI时代学术评审新范式。
AI视频生成初创公司Higgsfield完成5000万美元A轮融资,GFT Ventures领投
AI视频生成公司Higgsfield完成5000万美元A轮融资,以“Click-to-Video”技术简化视频创作,吸引超1100万用户,瞄准6000亿短视频市场。融资将用于扩展企业级功能、扩充团队及市场推广,助力从个人到企业用户高效创作,推动内容产业生态重塑,同时面临市场竞争等挑战。
蚂蚁百宝箱发布Tbox超级智能体:多智能体协同驱动软件业进入“成果即服务”新纪元
蚂蚁百宝箱发布Tbox超级智能体,以多智能体协同推动AI向成果即服务(SaaO)跃迁。用户通过自然语言指令,无需代码即可分钟级获取PPT、网页等专业成果,支持按成果计费,重塑AI价值交付逻辑。
YC W25新秀Adam AI:AI驱动CAD,以语言指令重塑物理世界设计流程
Adam AI是旧金山Y Combinator初创公司,以“语言即设计”的Text-to-CAD技术革新CAD设计。用户通过自然语言或语音即可生成CAD模型,大幅降低3D打印等领域设计门槛,兼容专业软件提升工程师效率,正重塑物理世界数字化构建方式。
Vidu Q1参考生图全球上线:支持7张参考图刷新AI生图技术上限
Vidu Q1参考生图全球上线,支持一次性上传7张参考图,远超谷歌Nano Banana等主流工具(最多3张)。多图融合助力创意合成、时尚穿搭、专业海报及跨次元合照,主体一致性强,操作简洁,可生成1080p高清图。现免费试用,开启AI图像创作新可能。
爱诗科技完成6000万美元B轮融资 刷新国内视频生成领域单次最大融资纪录 PixVerse V5图生视频全球第一
AI视频生成企业爱诗科技获阿里巴巴领投6000万美元B轮融资,系国内视频生成领域最大单次融资。公司以“让每个人成为生活的导演”为愿景,全球用户超1亿,自研PixVerse模型完成五次迭代,V5版本图生视频全球测评第一,开放平台半年生成视频超千万次,覆盖动态壁纸、公益等多元场景。
字节跳动Seedream 4.0全量开放 多模态创作重新定义AI生图
字节跳动AI生图模型Seedream 4.0已全量开放,通过豆包、即梦等C端平台及火山引擎面向用户与企业。该模型支持文本、图像、草图多模态混合输入,可实现跨次元合影、故事化分镜等创作,主体特征跨场景不漂移,4K超高清图8秒即可生成。依托特征锚点技术与分块渲染优化,其多图融合精度达98%,中文意图理解准确率92%,较Midjourney、DALL·E 3更适配本土场景。从用户“跨次元合影”“虚拟换装”到企业家居设计、短视频素材生产,20余种场景覆盖趣味玩图与商业设计,4K图商用成本低至0.3元/张,效率较国际竞品提升3倍,重塑AI生图从趣味到专业的内容生产方式。
谷歌Nano Banana:AI穿搭生成技术如何重塑时尚内容生态
谷歌AI模型“Nano Banana”因命名调整引发关注,其核心在于强大的AI穿搭生成能力。该模型基于扩散模型优化,融合文本与图像识别技术,能精准解析服饰材质、风格,实现“秒级生成”且节省40%算力。它重塑时尚内容生态,降低OOTD创作门槛,电商平台如SHEIN接入后退货率降低18%。同时,AI对时尚博主带来机遇与挑战,头部博主探索“真人+AI”模式,腰部博主面临流量压力。目前模型在小众品牌细节生成上仍有不足,行业关注技术边界与版权伦理,未来人机协作或成主流。
纽约州立大学石溪分校等团队开发PosterGen:AI多智能体自动化生成专业学术海报
学术海报制作常让非设计背景研究者面临耗时费力的困境,现有工具难兼顾自动化与设计质量。PosterGen作为多智能体AI工具,由纽约州立大学等团队开发,可直接将论文PDF转为专业可编辑海报。其核心通过模拟设计师流程,实现内容解析、叙事重构、空间布局及色彩版式优化,无需手动输入,单张制作时间从10小时缩短至2小时,支持PPTX二次修改。开放代码与项目主页结合设计原则编码,首次实现“全自动+专业级”平衡,被《Nature》评价为重新定义学术海报生产标准,助力研究者从排版中解放,聚焦内容打磨与学术交流。