AIGC[23]

新代码图表工具:代码+拖拽+AI,一站式生成与定制

DiagramPro是一款融合AI生成、代码驱动与拖拽编辑的图表工具,解决传统工具效率与定制难题。支持自然语言生成图表初稿,代码与拖拽双向协同,可导出代码/SVG/PPT/Figma等多格式,大幅提升架构图、流程图等复杂图表制作效率,助力技术团队高效协作。

DDN:生成模型领域的突破性进展——ICLR 2025接收的全新路径

生成式AI主流模型长期受采样慢、条件生成需额外训练等瓶颈制约,新型离散分布网络(DDN)被ICLR 2025接收,以“单次前向多输出”机制实现采样速度提升近30倍,支持零样本条件生成且小数据集适应性强,为边缘设备、医疗影像等领域提供高效生成新方案。

YouTube 20周年:AI驱动下一个“大爆炸”

YouTube成立20周年:从2005年前PayPal员工创立的视频分享平台,凭UGC模式崛起,2006年被Google以16.5亿美元收购,如今估值达5500亿美元。当前押注AI为“下一个大爆炸”,推出AI创作工具矩阵,涵盖生成视频、智能剪辑与个性化推荐,提升创作效率10倍,驱动内容生产革命,重塑数字媒体行业规则。

Markup AI完成2750万美元A轮融资,深耕AI内容合规与治理

生成式AI推动内容产量激增,企业内容合规压力几何级增长。专注AI内容合规治理的Markup AI近日完成2750万美元A轮融资,远超行业平均水平。其通过“品牌声纹”技术解决AI内容错误率高、品牌风格不一致等痛点,满足金融、医疗等行业法规审查与品牌统一需求,成企业刚需,引资本关注AI合规赛道。

Wan2.2视频模型发布:AI视频生成迈入电影级美学与720P高效输出新阶段

2025年9月,Wan-AI团队发布Wan2.2基础视频模型,采用MoE架构解决"高质量与高效率"核心矛盾,结合电影级美学数据集与50亿参数模型,将720P@24fps高清视频生成带入消费级硬件时代。支持角色动画、音频驱动,开源生态完善,重新定义AI视频创作边界。

《时代》2024年度最佳发明NotebookLM:从标签页过载到三面板架构的演进之路

Google Labs孵化的NotebookLM入选《时代》2024年度最佳发明,以创新三面板架构解决创作者“标签页过载”痛点,整合材料收集、AI分析、内容输出于一站式工作台,降低认知负荷,提升创作效率,重新定义AI辅助知识工作流程。

B站开源IndexTTS-2.0:零样本TTS迈入情感与时长双维度精准控制新时代

B站Index团队开源新一代文本转语音模型IndexTTS-2.0,创新“时间编码”机制实现情感与时长双维度精准控制,支持零样本多情感、跨语言合成及自然语言描述引导情绪,性能指标超越现有SOTA,已在B站AI视频创作大规模应用,为开发者提供先进TTS研究实践平台。

李飞飞团队研发Marble模型:自动化生成超大规模3D虚拟世界

李飞飞团队Marble 3D世界生成模型,可通过文本或图像提示生成超大规模、细节丰富且空间连贯的虚拟环境,为3D AIGC领域带来新突破。该模型融合扩散模型、NeRF及大型语言模型技术,有望赋能游戏开发、元宇宙构建及自动驾驶模拟训练等场景,引发业界对其计算效率与可控性的关注。

腾讯混元革新AI绘画微调范式:全扩散轨迹优化技术实现人工评估分数超300%跃升

腾讯混元AI绘画技术实现重大突破,融合Direct-Align全扩散轨迹优化与SRPO语义相对偏好优化,解决传统微调奖励作弊、效率低等瓶颈。人工评估显示真实感与美学质量提升300%,仅需10分钟即可完成模型训练,支持灵活风格控制,推动AI绘画向高质量、个性化应用迈进。

快手可灵AI数字人技术公开:从对口型到全身表演,数字人迈入“会表演”时代

快手可灵AI推出Kling-Avatar数字人技术,突破传统数字人僵硬局限,通过多模态大语言模型实现"全身自然表演"。支持文本/音频/图像输入,生成含表情、肢体、情绪的流畅视频,口型精准、动作连贯。技术已开放公测,助力虚拟主播、动画制作等内容创作,重新定义数字人表演边界。