数学推理[2]

腾讯AI Lab提出Parallel-R1框架:强化学习赋能大模型并行思维,数学推理AIME25测试性能提升42.9%

腾讯AI Lab联合高校发布Parallel-R1强化学习框架,首次以RL技术为大模型注入“并行思维”,解决传统SFT泛化差、数据成本高难题。该框架在通用数学推理任务平均准确率提升8.4%,高难度AIME25测试性能跃升42.9%,刷新AI复杂推理天花板,开创大模型能力培养新范式。

全球最快开源大模型K2 Think推出:推理速度突破2000 tokens/秒,刷新性能纪录

K2 Think开源大模型发布,推理速度突破2000 tokens/秒(最高2730.4),成已知最快开源大模型之一。基于通义千问Qwen 2.5-32B架构,数学推理表现优异(AIME’24得分90.83),依托六大技术创新支撑高速与精准。基于通义千问架构,已在HuggingFace等开源平台发布,助力AI技术普及。