大模型

LLM,VLM,模型

比肩GPT-4,商汤日日新大幅升级4.0,多模态能力领先一步

商汤科技近日发布了其大模型体系「日日新 SenseNova」的4.0版本,该版本在语言能力、文生图能力等方面进行了全面升级,并提供了低门槛的落地工具。新一代Sens...

Mixtral 8×7B模型调研

本文主要介绍了Mistral AI在2023年年底推出的以混合专家网络(MoE)为架构的大语言模型Mixtral 8x7B。该模型以其创新的网络架构和在总参数量更少的情况下性能...

5 款不错的 AI 工具:小红书做号神器、漫画生成、AI 学术、文本转语音等

文章介绍了五款 AI 工具,分别是 Postnitro、TTS-Online、AI Comic Factory、MyLens 和 Aminer。1. Postnitro 是一款专为社交媒体内容创作者、品牌和个人博主...

媲美Llama 2,第一个正真开源的大模型OLMo发布

文章主要介绍了艾伦人工智能研究所(AI2)发布的全新开源大型语言模型(LLM)OLMo 7B。OLMo 7B 是一个先进且完全开源的 LLM,其配套提供了预训练数据和训练代...

梭哈大模型的公司,给自己找了条退路

面壁智能最近发布了其旗舰端侧AI大模型MiniCPM-2B,这是一个拥有20亿参数的模型,它使用了1TB的精选数据进行训练。在多项主流评测榜单上,MiniCPM-2B的表现超...

大语言模型 vs 大模型

本文主要介绍了大模型的概念、分类以及与大语言模型的关系。大模型是基于神经网络的一种模型,由多个神经元组成,通过权重连接形成层次结构。神经网络通过学...

谁能想到,一款3D建模AI工具成了Ins网红的视频创作利器

文章总结了近期热议的话题——《幻兽帕鲁》AI抄袭事件。尽管该事件尚无定论,但3D内容制作确实变得越来越简单。Luma AI的文生3D模型Genie将3D模型生成时间降至1...

清华系2B模型杀出,性能吊打LLaMA-13B,170万tokens仅需1块钱!

文章主要介绍了面壁智能与清华大学自然语言处理实验室共同开源的端侧语言大模型MiniCPM系列。MiniCPM-2B模型仅有24亿非词嵌入参数量,但在综合榜单上表现出色...

推荐 3 个火火火火的 AI 开源项目

本期推荐的开源项目包括大模型微调框架LLaMA-Factory、用于角色扮演的AI agent框架CrewAI以及用于生成数字形象的工具FaceChain。LLaMA-Factory是一个易于使用...

Baichuan3中文基准评测出炉!总分77.4分,位列国内第二|SuperCLUE

百川智能最近发布了其超千亿参数的大语言模型Baichuan3,该模型在多个英文评测上展现了接近GPT-4的性能,并通过迭代式强化学习技术进一步提升了语义理解和生...
1 481 482 483 484 485 492