DeepSeek前脚发新论文,奥特曼立马跟上
这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛,引得大家纷纷联想是不是R2马上要来了。然鹅……奥特曼这边却发了一条“变卦”的消息:现在真的是DeepSeek这边一有点声响,OpenAI那边就得有点动作来紧跟一下了。DeepSeek新论文吃瓜爆料黑料不打烊在这个小插曲之后呢,我们还是把目光聚焦在DeepSeek这篇新论文身上。这篇论文的名字叫做Inference-Time Scaling for Generalist Reward Modeling,由DeepSeek和清华大学共同提出黑料网-独家爆料
頁:
[1]