大模型
LLM,VLM,模型
没发布任何产品,SSI以200亿美元估值,洽谈新融资
由前OpenAI首席科学家Ilya Sutskever联合创立的AI公司SSI,近期正以200亿美元估值洽谈新一轮融资。这一估值较其2023年9月10亿美元融资时的水平飙升4倍,但值...
如何优化测试时计算?解决「元强化学习」问题
当前改进大型语言模型的主流方法依赖于增加高质量数据的监督微调或强化学习,但数据扩展面临瓶颈。研究预测,用于训练的高质量文本可能在2028年耗尽,而复杂...
DeepSeek:现代中国文化亚稳态的一个缩影
中国南方与北方在认知方式上的差异源于千年农业传统。研究表明,南方水稻种植区居民更倾向于整体思维和社会协作,这种特质与密集型农业对风险规避和精细化管...
诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步
近期,全球AI领域围绕中国公司DeepSeek的技术突破性引发激烈讨论。谷歌DeepMind首席执行官Demis Hassabis在肯定其工程实现能力的同时,明确指出「DeepSeek未...
Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型
Meta GenAI团队提出的VideoJAM框架通过技术创新显著提升了视频生成中的运动一致性。该框架基于扩散变换器(DiT)架构,在动态效果上超越了Sora、Gen3等主流模...
飞书接入DeepSeek-R1后,用一次顶一万次,而且再也不「服务器繁忙」了
DeepSeek-R1模型因用户需求激增导致服务器持续处于高负载状态,巨大的访问量已引发第三方客户端和API服务的涌现。为应对这一趋势,DeepSeek在GitHub创建了集...
DeepSeek上线国家超算平台!671B满血版,三大运营商接入,玄铁芯片适配
近期,DeepSeek技术生态呈现多维度扩展态势。国家超算互联网平台正式上线支持DeepSeek-R1模型,最高可运行671B参数的满血版本,标志着其算力基础设施的深度整...
马克龙豪掷1090亿开欧洲「星际之门」,Mistral狂飙登顶法国APP榜首!
法国人工智能初创公司Mistral AI推出的超级助手Le Chat近日登顶法国免费应用效率榜首位,超越ChatGPT和DeepSeek。这一突破标志着欧洲在AI领域首次实现本土产...
清华大学刘知远详解DeepSeek:OpenAI引爆o1藏秘方,但R1造出原子弹也能公开方法|钛媒体AGI
清华大学刘知远副教授在CCF青年论坛直播中深入剖析了DeepSeek R1模型的技术突破与行业影响。该模型通过开源方式完整复现OpenAI o1的深度推理能力,成为全球首...
Sam Altman最新博客:AGI很快会来,你需要拥抱变化。
Sam Altman近期发表的思考聚焦于人工智能通用智能(AGI)的演进路径及其对社会经济的深远影响。他提出,尽管短期内生活形态保持稳定,但AGI带来的长期变革将...