【美今诗歌集】【作者:童驿采】1999年~2020年 |访问首页|

【墨聯字畫】

 找回密碼
 立即註冊
搜索
查看: 13|回復: 0

DeepSeek前脚发新论文,奥特曼立马跟上

[複製鏈接]

25

主題

0

回帖

114

積分

註冊會員

Rank: 2

積分
114
發表於 2025-4-5 17:44:10 | 顯示全部樓層 |閱讀模式
这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛,引得大家纷纷联想是不是R2马上要来了。
然鹅……奥特曼这边却发了一条“变卦”的消息:
现在真的是DeepSeek这边一有点声响,OpenAI那边就得有点动作来紧跟一下了。
在这个小插曲之后呢,我们还是把目光聚焦在DeepSeek这篇新论文身上。
这篇论文的名字叫做Inference-Time Scaling for Generalist Reward Modeling,由DeepSeek和清华大学共同提出黑料网-独家爆料

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|小黑屋|【墨聯字畫】

GMT+8, 2025-4-16 12:41 , Processed in 0.112316 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表