李飞飞团队“50好意思元”复刻DeepSeek 一文读透背后逻辑
2025-02-11当地时刻2月6日,据外媒报谈,李飞飞等斯坦福大学和华盛顿大学的参谋东谈主员以不到50好意思元的用度,使用了16张英伟达H100GPU,耗时26分钟就完成了纯属,得胜“打造”出了一个名为s1-32B的东谈主工智能推理模子。 说明李飞飞等东谈主的参谋论文《s1:Simple test- time scaling》,该模子在数学和编码能力测试中的发达,与OpenAI的o1和DeepSeek的R1等顶端推理模子不相高下,在竞赛数知识题上的发达更是比o1-preview进步27%。 凭借低本钱、高效力,