标签:模型对齐

2030 年 AGI 到来?谷歌 DeepMind 写了份「人类自保指南」

对于通用人工智能(AGI)的发展,硅谷巨头们正面临着一系列复杂的挑战和风险。谷歌 DeepMind 在近期发布的一份报告中,系统阐述了其对 AGI 安全的态度,并预...

模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分

上海交通大学生成式人工智能实验室(GAIR)发布了一项新研究成果,深入分析了人类用户与32种流行大语言模型的偏好。研究通过真实用户-模型对话数据,分场景建...