AIGC^[23]

新代码图表工具：代码+拖拽+AI，一站式生成与定制

产品速递

新代码图表工具：代码+拖拽+AI，一站式生成与定制

DiagramPro是一款融合AI生成、代码驱动与拖拽编辑的图表工具，解决传统工具效率与定制难题。支持自然语言生成图表初稿，代码与拖拽双向协同，可导出代码/SVG/PPT/Figma等多格式，大幅提升架构图、流程图等复杂图表制作效率，助力技术团队高效协作。

2025-10-26

DDN：生成模型领域的突破性进展——ICLR 2025接收的全新路径

前沿资讯

DDN：生成模型领域的突破性进展——ICLR 2025接收的全新路径

生成式AI主流模型长期受采样慢、条件生成需额外训练等瓶颈制约，新型离散分布网络（DDN）被ICLR 2025接收，以“单次前向多输出”机制实现采样速度提升近30倍，支持零样本条件生成且小数据集适应性强，为边缘设备、医疗影像等领域提供高效生成新方案。

2025-10-11

YouTube 20周年：AI驱动下一个“大爆炸”

前沿资讯

YouTube 20周年：AI驱动下一个“大爆炸”

YouTube成立20周年：从2005年前PayPal员工创立的视频分享平台，凭UGC模式崛起，2006年被Google以16.5亿美元收购，如今估值达5500亿美元。当前押注AI为“下一个大爆炸”，推出AI创作工具矩阵，涵盖生成视频、智能剪辑与个性化推荐，提升创作效率10倍，驱动内容生产革命，重塑数字媒体行业规则。

2025-09-23

Markup AI完成2750万美元A轮融资，深耕AI内容合规与治理

市场动态

Markup AI完成2750万美元A轮融资，深耕AI内容合规与治理

生成式AI推动内容产量激增，企业内容合规压力几何级增长。专注AI内容合规治理的Markup AI近日完成2750万美元A轮融资，远超行业平均水平。其通过“品牌声纹”技术解决AI内容错误率高、品牌风格不一致等痛点，满足金融、医疗等行业法规审查与品牌统一需求，成企业刚需，引资本关注AI合规赛道。

2025-09-22

Wan2.2视频模型发布：AI视频生成迈入电影级美学与720P高效输出新阶段

前沿资讯

Wan2.2视频模型发布：AI视频生成迈入电影级美学与720P高效输出新阶段

2025年9月，Wan-AI团队发布Wan2.2基础视频模型，采用MoE架构解决"高质量与高效率"核心矛盾，结合电影级美学数据集与50亿参数模型，将720P@24fps高清视频生成带入消费级硬件时代。支持角色动画、音频驱动，开源生态完善，重新定义AI视频创作边界。

2025-09-22

《时代》2024年度最佳发明NotebookLM：从标签页过载到三面板架构的演进之路

产品速递

《时代》2024年度最佳发明NotebookLM：从标签页过载到三面板架构的演进之路

Google Labs孵化的NotebookLM入选《时代》2024年度最佳发明，以创新三面板架构解决创作者“标签页过载”痛点，整合材料收集、AI分析、内容输出于一站式工作台，降低认知负荷，提升创作效率，重新定义AI辅助知识工作流程。

2025-09-21

B站开源IndexTTS-2.0：零样本TTS迈入情感与时长双维度精准控制新时代

前沿资讯

B站开源IndexTTS-2.0：零样本TTS迈入情感与时长双维度精准控制新时代

B站Index团队开源新一代文本转语音模型IndexTTS-2.0，创新“时间编码”机制实现情感与时长双维度精准控制，支持零样本多情感、跨语言合成及自然语言描述引导情绪，性能指标超越现有SOTA，已在B站AI视频创作大规模应用，为开发者提供先进TTS研究实践平台。

2025-09-19

李飞飞团队研发Marble模型：自动化生成超大规模3D虚拟世界

前沿资讯

李飞飞团队研发Marble模型：自动化生成超大规模3D虚拟世界

李飞飞团队Marble 3D世界生成模型，可通过文本或图像提示生成超大规模、细节丰富且空间连贯的虚拟环境，为3D AIGC领域带来新突破。该模型融合扩散模型、NeRF及大型语言模型技术，有望赋能游戏开发、元宇宙构建及自动驾驶模拟训练等场景，引发业界对其计算效率与可控性的关注。

2025-09-17

腾讯混元革新AI绘画微调范式：全扩散轨迹优化技术实现人工评估分数超300%跃升

学术论文

腾讯混元革新AI绘画微调范式：全扩散轨迹优化技术实现人工评估分数超300%跃升

腾讯混元AI绘画技术实现重大突破，融合Direct-Align全扩散轨迹优化与SRPO语义相对偏好优化，解决传统微调奖励作弊、效率低等瓶颈。人工评估显示真实感与美学质量提升300%，仅需10分钟即可完成模型训练，支持灵活风格控制，推动AI绘画向高质量、个性化应用迈进。

2025-09-16

快手可灵AI数字人技术公开：从对口型到全身表演，数字人迈入“会表演”时代

产品速递

快手可灵AI数字人技术公开：从对口型到全身表演，数字人迈入“会表演”时代

快手可灵AI推出Kling-Avatar数字人技术，突破传统数字人僵硬局限，通过多模态大语言模型实现"全身自然表演"。支持文本/音频/图像输入，生成含表情、肢体、情绪的流畅视频，口型精准、动作连贯。技术已开放公测，助力虚拟主播、动画制作等内容创作，重新定义数字人表演边界。

2025-09-16