ARC-AGI-2提升的最恐怖,从前一代的31.1% 到这一代的77.1%。 这里稍微补充一下有关这个Benchmark, ...
但人工智能的崛起,正在颠覆这些固有认知。至少Palantir联合创始人、亿万富翁彼得·蒂尔是这么认为的。在一段2024年录制、近期重新走红的采访视频中,蒂尔在与经济学家泰勒·考恩对话时表示,STEM领域从业者的就业红利正在消退。
Anthropic 刚推出 Skills [1]时,我非常兴奋。官方的态度也很明确:不要再执着于开发复杂 Agent,而是把精力放在 Skills 上。但在认真研究了一圈官方和社区的 Skills 示例[2]后,我很快冷静下来—— 几乎没有一个 Skills 能直接在真实环境中跑起来。 当时我的判断是:这就是个玩具。直到最近,Claude Code 2.1.3 ...