Logo Logo
  • 首页
  • 文章归档
    • 分类
    • 标签
    • 时间轴
  • AI前沿资讯
    • 前沿资讯
    • 学术论文
    • 产品速递
    • 市场动态
    • 技术更新
    • 圈内热议
  • 关于
    • 关于本站
    • 团队介绍
    • 站长博客

微软亚洲研究院DELT范式:优化数据顺序,让大模型效能跃升无需扩容参数

Lyra
Lyra
2025-09-07
小模型 数据质量 大语言模型 AI
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系aipmgo@163.com删除。
英伟达15亿美元租Lambda H...
OpenAI开放ChatGPT对话...

推荐阅读

学术论文

《AI 2030》报告:2030年成AI分水岭,算力千亿级与科学突破重塑多领域

《AI 2030》报告由谷歌DeepMind委托Epoch发布,勾勒2030年AI发展分水岭,聚焦算力、数据、经济回报与科学突破。预测前沿算力集群成本将破千亿美元,2027年公开文本数据或枯竭,合成数据成新引擎;头部企业营收激增支撑投入,能源压力推动数据中心革新。马斯克认可趋势,报告揭示AI从工具向协作者蜕变的机遇与挑战。
Lyra
Lyra
1 0

AI助力发现流体动力学不稳定奇点家族 为纳维-斯托克斯方程千禧年难题带来新曙光

Google DeepMind联合纽约大学、斯坦福大学等机构,通过技术革新的物理信息神经网络(PINN),系统性发现流体动力学方程中的不稳定奇点家族。这一突破为百年未解的纳维-斯托克斯方程(千禧年难题)提供关键线索,更重新定义AI角色——从计算工具进化为辅助探索数学边界的“智能伙伴”。
Lyra
Lyra
1 0

阿拉伯语AI模型新突破:Hala项目以创新管线与Slerp技术引领指令与翻译领域

阿拉伯语AI长期受低资源困境制约,Hala模型家族通过FP8压缩、Slerp合并及“翻译-调优”技术管线,实现阿拉伯语指令遵循与翻译任务SOTA性能,为低资源语言AI提供可复制范式,推动政务、教育等场景落地。
Lyra
Lyra
1 0

全新基准SWE-rebench发布:标准化、透明化评估软件工程LLM

大型语言模型(LLM)正重塑软件工程,GitHub Copilot、ChatGPT等成开发者工具,但现有评估存数据污染、脚手架差异等痛点。全新基准SWE-rebench通过去污染数据集、统一ReAct框架、透明化流程等,解决评估不公问题,为LLM软件工程能力提供标准化衡量方案,推动行业从"指标优化"转向核心能力提升。
Lyra
Lyra
1 0

评论

热门文章

生数科技完成数亿元A轮融资 Vidu多模态大模型加速全球布局
2025-09-20
《AI 2030》报告:2030年成AI分水岭,算力千亿级与科学突破重塑多领域
2025-09-20
AWS Bedrock集成国产顶级大模型Qwen3与DeepSeek-V3.1全球上线
2025-09-20
AI助力发现流体动力学不稳定奇点家族 为纳维-斯托克斯方程千禧年难题带来新曙光
2025-09-20
英伟达50亿美元入股英特尔 联手打造CPU+GPU融合芯片重塑计算格局
2025-09-20

分类目录

  • 技术更新 14
  • 竞品分析
  • 圈内热议 9
  • 学术论文 53
  • 资源工具
  • 产品拆解
  • AI应用Demo
  • 市场动态 17
  • 自然语言处理
  • 交互设计
  • 产品思维
  • 解决方案案例
  • 编程实践
  • 政策信息 2
  • AI电子书
  • 需求分析
  • PRD编写
  • 开源项目 1
  • 产品设计与原型
  • 大模型与智能体
  • 产品速递 49
  • 网站推荐 0
  • 前沿资讯 90

标签

  • #推理优化 1
  • #物流 1
  • #边缘计算 6
  • #OpenRouter 0
  • #FP8 0
  • #遗传病 0
  • #Chain-of-Agents 0
  • #AIGC 17
  • #扩散模型 8
  • #MCP 1
  • #OpenAI 7
  • #Anthropic 2
  • #智能眼镜 1
  • #数字化转型 4
  • #AI芯片 5
  • #AI人才 5
  • #MoE 10
  • #工具调用 14
  • #微LED 0
  • #提示词工程 1
  • #半导体 3
  • #移动开发 1
  • #LM Studio 0
  • #模型压缩 6
  • #网络安全 2
  • #推理能力 0
  • #游戏AI 2
  • #深度伪造 1
  • #图像生成 7
  • #视频生成 11
  • #数学 0
  • #教育普惠 1
  • #核聚变 0
  • #工业机器人 1
  • #合成数据 2
  • #人工智能 37
  • #月球基地 0
  • #Jetson Thor 0
  • #向量存储 1
  • #决策模型 0
  • #通用大模型 0
  • #强化学习 5
  • #传感器 0
  • #AGI 4
  • #LLVM 1
  • #大型语言模型 0
  • #差分隐私 1
  • #浏览器 0
  • #远程医疗 1
  • #幻觉 0
复制链接
QQ
微博
  • 首页
  • 文章归档
    • 分类
    • 标签
    • 时间轴
  • AI前沿资讯
    • 前沿资讯
    • 学术论文
    • 产品速递
    • 市场动态
    • 技术更新
    • 圈内热议
  • 关于
    • 关于本站
    • 团队介绍
    • 站长博客
© 2025 AI产品狗. All Rights Reserved.