图像生成

图像,绘画

基座大模型「六进二」:南阶跃,北智谱

2024年中国大模型领域的竞争格局因阶跃星辰完成数亿美元B轮融资而发生变化。此次融资由国资、战略和财务投资人参与,核心投资方包括上海国有资本投资有限公司...

AI工具 | AI商品图工具合集

在商品视觉呈现领域,AI技术的应用正逐渐改变传统的商品图制作流程,提升效率和创意。AI商品图工具通过简化设计流程,确保视觉效果与品牌风格的融合,助力企...

全球首个AI圣彼得大教堂上线,40万照片毫米级3D还原文艺复兴巅峰!

梵蒂冈与Iconem和微软合作,利用40万张照片和人工智能技术,在不到一个月的时间内完成了对圣彼得大教堂的3D复刻,创建了这座拥有400多年历史的地标的数字双胞...

数据即将耗尽?大型 AI 公司中没有人会感到恐慌

人工智能(AI)的发展在过去十年中取得了爆炸性的进展,这主要归功于神经网络规模的扩大和对大量数据的训练。然而,随着对数据的需求不断增长,AI研究人员正...

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

多模态大模型(MLLM)在视觉理解领域取得了显著进展,其中视觉指令调整方法因其数据和计算效率而被广泛应用。Meta和纽约大学的合作论文探讨了大型语言模型(L...

全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

智源研究院于2024年12月19日发布了下半年大模型综合评测结果,涉及100余个开源和商业闭源模型,覆盖文本、语音、图像和视频等多个领域。此次评测在5月的基础...

免费o1替代品来了!谷歌新发“王炸”推理大模型:思考速度碾压其他大模型,水平堪比理科博士

谷歌在其“Gemini 2.0 Flash Thinking”模型上取得了新进展,该模型以其卓越的推理能力而受到关注,能够通过“明确地展示自己的思维”来解决复杂问题,其水平与物...

豆包升级了“眼睛”,看APP截图就能写代码了!超低价让多模态AI普惠

豆包最新发布的“豆包·视觉理解模型”展示了其在图像识别和代码生成方面的强大能力。该模型能够识别APP截图,并迅速生成相应的代码,包括菜单栏、播放列表框架...

历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物

CMU联合20多所研究实验室开源发布了名为Genesis的生成式物理引擎,标志着我们向构建一个综合生成文本、图像、音频、视频和3D对象的世界迈出了重要一步。Genes...

GitHub Copilot扛不住Cursor的竞争,终于推出了免费版本

GitHub Copilot 近日宣布对所有 VS Code 用户提供免费计划,用户只需拥有 GitHub 账户即可享受服务,无需试用、订阅或信用卡信息。该平台开发者数量已突破1.5...
1 7 8 9 10 11 103