brown - 搜索 News

资讯

16 小时

IMO 的第三题或第六题是传统上最困难的题。模型在面对第六题时，最终选择「不作答」。但团队并未将此视为失败，反而认为这是一个非常积极的信号。这说明它清楚地知道自己能力的边界，在无法解决问题时选择了放弃，而不是像过去的 AI 模型那样，会「一本正经地胡说八道」（hallucinating），编造一个错误的答案。如果模型选择编造，人类要非常仔细地检查才能发现。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

资讯

今日热点