预训练 | 第 2 页

3个月砸1000万美元肝出“最强”大模型？黑马Databricks：我们完虐Grok、Llama，还更开放

美国AI初创公司Databricks近日宣布，其Mosaic Research团队开发的通用大模型DBRX将开源。DBRX的设计灵感来源于OpenAI的ChatGPT，Databricks表示，它花费了大...

AIGC动态

11个月前

本文报道了Stability AI 公司开源的小体量预训练模型 Stable Code Instruct 3B，该模型是一个基于 Stable Code 3B 的指令调整编码语言模型，能够处理各种任务...

AIGC动态

11个月前

新智元报道了Google Research的研究人员提出了一个时序预测基础模型TimesFM，该模型针对时序数据设计，输出序列长于输入序列。TimesFM在1000亿时间点数据上进...

AIGC动态

11个月前

本文探讨了大模型性能与训练数据规模、模型架构等设计要素之间的关系，即Scaling Law。研究者们主要关注了迁移学习中的Scaling Law，即预训练数据集大小与任...

AIGC动态

12个月前