图像生成
图像,绘画
OpenAI深夜上线o3满血版和o4 mini – 依旧领先。
OpenAI在直播中正式发布了o3和o4-mini模型,取代了之前的o1、o3-mini和o3-mini-high。ChatGPT Plus、Pro和Team用户从即日起可以在模型选择器中看到这些新模型...
刚刚,o4-mini发布!OpenAI史上最强、最智能模型
OpenAI在技术直播中发布了其最新的多模态模型o4-mini和满血版o3,这两款模型能够同时处理文本、图像和音频,并具备调用外部工具的能力。这一创新使得模型能够...
OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表
OpenAI最新发布的满血版o3和o4-mini模型在多个领域展现了卓越的性能,尤其是在视觉推理和工具调用方面实现了重大突破。o3模型首次将图像推理融入思维链,能够...
“字节暗示我太穷”:Seed团队1000张H100训练7B模型,发布全球首个25秒AI视频,验证视觉生成Scaling Law?
字节跳动近日发布了全球首个由AI生成的25秒视频,这一成果由Seaweed-7B模型完成。该模型参数量仅为70亿,但在核心任务上的表现超越了参数量为其两倍的主流模...
何恺明的ResNet,成为21世纪被引量最多论文,Nature最新统计
《自然》杂志通过分析五个数据库(Web of Science、Scopus、OpenAlex、Dimensions、Google Scholar)的数据,发布了21世纪被引用次数最多的论文Top 25排名。...
CVPR 2025 | 单张图片生成物理真实的可控视频
PhysGen3D 是由清华大学、伊利诺伊大学香槟分校和哥伦比亚大学的研究团队提出的一个创新框架,旨在从单张静态图像中构建可交互的物理3D世界。该框架通过整合...
可灵 AI 开启视频生成 2.0 时代!全球用户数已突破 2200 万
可灵 AI 于 4 月 15 日在北京中关村国际创新中心举行了「灵感成真」2.0 模型发布会,正式面向全球发布了可灵 2.0 视频生成模型和可图 2.0 图像生成模型。自去...
超越Sora!谷歌推出Veo 2,生成8秒超逼真视频
谷歌DeepMind最新发布的Veo 2视频生成技术已整合至GeminiApp应用中,全面开放使用。Veo 2能够生成最高8秒的720P电影级视频,在运镜、文本语义还原、物理模拟...
用于生成4D城市的大模型—CityDreamer4D
大模型的出现显著提升了3D场景生成的效率,但生成包含时间和空间维度的4D城市场景仍然面临巨大挑战。4D城市生成不仅需要处理结构复杂、视觉多样化的物体,如...
可灵2.0成“最强视觉生成模型”?自称遥遥领先OpenAI、谷歌,技术创新细节大揭秘!
可灵 AI 正式发布了可灵 2.0 视频生成模型和可图 2.0 图像生成模型,标志着其在视觉生成技术领域的重大突破。可灵 2.0 被描述为“世界上最强大的视觉生成模型”...