大语言模型[94]
AWS Bedrock集成国产顶级大模型Qwen3与DeepSeek-V3.1全球上线
AWS旗下AI服务平台Amazon Bedrock正式集成中国顶尖大语言模型——阿里Qwen3与深度求索DeepSeek-V3.1。此举标志中国AI技术获国际主流云计算平台认可,为全球开发者和企业带来更多元化AI解决方案。两款模型已在全球多个区域同步上线,用户可灵活选用。
阿拉伯语AI模型新突破:Hala项目以创新管线与Slerp技术引领指令与翻译领域
阿拉伯语AI长期受低资源困境制约,Hala模型家族通过FP8压缩、Slerp合并及“翻译-调优”技术管线,实现阿拉伯语指令遵循与翻译任务SOTA性能,为低资源语言AI提供可复制范式,推动政务、教育等场景落地。
全新基准SWE-rebench发布:标准化、透明化评估软件工程LLM
大型语言模型(LLM)正重塑软件工程,GitHub Copilot、ChatGPT等成开发者工具,但现有评估存数据污染、脚手架差异等痛点。全新基准SWE-rebench通过去污染数据集、统一ReAct框架、透明化流程等,解决评估不公问题,为LLM软件工程能力提供标准化衡量方案,推动行业从"指标优化"转向核心能力提升。
Google SLED:融合所有层信息提升LLM事实准确性,无需外部数据或微调的创新解码策略
大型语言模型(LLM)常因“幻觉”输出错误信息,源于解码时仅依赖最后一层判断。2024年NeurIPS大会上,Google Research发布的SLED解码策略,通过融合所有层logits激活模型“集体智慧”,无需外部数据或微调,显著提升事实准确性,为LLM去幻觉提供低成本新思路。
xAI发布Grok 4 Fast:2M上下文窗口与统一架构重塑AI成本与智能边界
2025年9月xAI推出多模态大模型Grok 4 Fast,以200万token上下文窗口与统一架构实现98%成本削减,性能接近顶级模型,支持原生工具调用与实时搜索,适配企业级长文档处理、消费级信息整合等全场景,重新定义AI“高性能-低成本”平衡,推动行业普惠化进程。
中国大模型首次登《Nature》封面:DeepSeek R1以208万元低成本突破全球AI壁垒
DeepSeek R1成首个登《Nature》封面中国大模型,660B参数训练成本仅208万元,不足国际同级别1/50。纯强化学习技术突破传统依赖,AIME测试推理能力达86.7%,开源模型下载量破千万次,推动全球AI研发降本增效,重塑行业竞争格局。
ICPC 2025:OpenAI与Gemini双双登顶金牌 AI编程能力首次全面超越人类顶尖团队
2025年9月阿塞拜疆巴库ICPC世界总决赛,OpenAI的AI系统首次超越人类团队,以解决全部12道题、零错误提交(最难题目除外)的满分成绩夺冠,Google Gemini解决10题跻身金牌。突破源于AI通用推理能力跃升,未专项训练(“裸奔挑战”),标志AI通用推理正式迈入“人类顶尖水平”,改写ICPC 40余年历史,为编程教育、算法研究等领域带来变革。
mlx-lm库重大更新:Apple芯片本地AI推理新增多款模型,性能显著提升
Apple芯片本地AI推理能力迎重磅升级,mlx-lm库重大更新!新增Qwen3 Next、MobileLLM等热门模型,覆盖通用大模型及移动端轻量场景,推理速度与并发处理效率显著提升,支持批量生成及SSM/GPT-OSS加速。助力开发者依托本地算力部署,提升终端用户隐私安全,为Apple设备AI应用开辟新可能。
Google发布“Learn Your Way”:生成式AI驱动个性化教材,重塑学习体验
Google推出“Learn Your Way”实验项目,以生成式AI打破传统教材“一刀切”困境,通过年级定制(适配认知水平)与兴趣驱动(绑定生活场景)实现双重个性化,结合双重编码理论与LearnLM、Gemini模型,生成多模态学习内容,降低理解门槛,提升效率,助力教育公平,让教材从标准化产品变为“千人千面”的动态学习伙伴。
Llama-Factory发布:推动大模型微调标准化 百余开源模型实现零代码定制
Llama-Factory是获ACL 2024认可的开源大模型微调工具,支持超百种LLMs与VLMs,零代码CLI/Web UI降低操作门槛,集成LoRA等高效训练策略,已被Amazon、NVIDIA等企业采用,助力快速定制适配特定场景的AI模型。