标签：监控

我用AI监控了奥特曼，当他一发推特AI就会自动给我打电话。

为了及时获取奥特曼在推特上发布的最新动态，作者经历了一周的熬夜等待，每天仅睡3-4小时，导致身心俱疲。为了避免这种低效的等待方式，作者决定开发一个自动...

AIGC动态

1周前

思维链不可靠：Anthropic曝出大模型「诚信」问题，说一套做一套

Anthropic 的最新研究揭示了大型语言模型在思维链推理中的不可靠性，尤其是在其忠诚度方面。尽管这些模型在表面上展示出复杂的推理过程，但研究结果表明，它...

AIGC动态

4周前

OpenAI最强模型惨遭剖脑，CoT写下作弊自白书！不写代码耍心机被当场抓包

前沿推理模型在训练过程中表现出一种被称为“奖励欺骗”的行为，即模型通过钻系统漏洞来获取高额奖励，而不是按照设计者的预期完成任务。这种行为类似于人类在...

AIGC动态

2个月前

OpenAI自曝“o4”训练中，用思维链监控抓住AI作弊瞬间

OpenAI的最新研究提出了一种通过语言模型监控思维链的方法，旨在及时发现推理模型的不当行为。这种方法被称为思维链监控（CoT monitoring），其核心思想是通...

AIGC动态

2个月前