工具 | 智趣AI甄选

阿里发布Qwen3-Max-Thinking推理模型，多项性能达国际领先水平

没等来GPT-5.3、Gemini 3.5，这周的大模型发布潮先被阿里“抢跑”了！昨晚，阿里推出了Qwen3-Max-Thinking，这是阿里千问系列目前能力最强的旗舰级推理模型，在19项权威基准...

工具 # 阿里千问

文心5.0正式版发布，霸榜LMArena的“最强文科生”到底强在哪？

近日，在文心Moment大会上，文心大模型5.0正式版上线。据称，该模型参数量达2.4万亿，采用原生全模态统一建模技术，具备全模态理解与生成能力，支持文本、图像、音频、视频等多种信息的输入与输出。 ...

工具 # 百度

苹果开源新模型SHARP! 一秒钟让照片变3D世界

12月11日，苹果发表论文介绍了3D生成模型SHARP，宣称在标准GPU上，该模型能够以不到1秒的时间将单张图像重建为逼真的3D场景。目前，该模型已开源。用户仅需输入一张普通照片，该模型即可通过神经...

工具 # 3D生成 # 苹果

Gemini 3 Flash重磅登场：速度超快智力反超Pro，开启AI新篇章

刚刚，谷歌发布最新模型 Gemini 3 Flash，据介绍，它拥有前沿智能，专为速度而生，可以帮助每个人更快地学习、构建和规划任何事物。早在模型发布前，Google AI Studio 开发者平台...

工具

OpenAI十周年推出其迄今最强模型GPT-5.2，奥特曼：十年后将构建出超级智能

今日凌晨，正值OpenAI十周年生日，OpenAI正式推出其迄今最强模型GPT-5.2，并同步上线ChatGPT与API体系。本次更新包含GPT-5.2 Instant、Thinking与Pro三个...

工具 # OpenAI

6天狂飙200万，这个AI应用为何全网爆火？

“灵光”，彻底火了。上周，蚂蚁集团发布的全模态通用AI助手灵光，或许是2025年底AI应用赛道中最大的惊喜之一。灵光的下载量呈现加速增长的态势，上线首日，灵光的下载量便突破20万，第四天突破100...

工具 # AI助手

谷歌Gemini 3发布即登顶：碾压竞品获马斯克点赞，训练依托TPU显实力

今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称，这是全球最先进的多模态理解模型、谷歌最强大的Agent编程和氛...

工具 # 谷歌

英伟达OmniVinci：9B模型开源下载即破万，引爆AI多模态新浪潮

今年以来，开源大模型战场硝烟弥漫。各路人马在此全力投入，试图在AI的下一个时代抢占生态位。而一个无法被忽略的趋势是：中国大模型，正在强势统治开源基础模型的「名人堂」。从DeepSeek在代码与数学...

工具 # 开源 # 英伟达

腾讯ima2.0发布，一句话搜索上百万知识库、2亿条知识

10月23日，在腾讯AI工作台ima发布一周年活动现场，ima2.0版本更新内容正式公布，包括了以Agent能力为基础的“任务模式”，以及知识库“AI要点”等功能，将于24日启动内测，27日正式上线...

工具 # 腾讯

OpenAI发布AI浏览器ChatGPT Atlas，挑战Chrome霸主地位

当地时间10月21日，OpenAI通过在线直播正式发布独立AI驱动网页浏览器ChatGPT Atlas。这款以ChatGPT为核心的浏览器，不仅是OpenAI首次涉足互联网终端工具领域、布局用户访问网...

工具 # OpenAI

百度新开源模型PaddleOCR-VL一夜登顶，识别109种语言，综合分全球第一

百度10月16日开源的多语言文档解析模型PaddleOCR-VL，连续三天霸榜Hugging Face趋势榜第一。 PaddleOCR-VL能识别109种语言的文本、表格、公式和图表等复杂元素，包括全...

工具 # 百度

谷歌 Veo 3.1 视频生成模型发布：新增音频支持、对象添加等功能

今天，谷歌宣布推出全新的Veo 3.1视频生成模型，新版本提升了画面真实感与叙事控制能力，同时具备更强大的提示词理解力和音画同步生成能力。依托Veo 3.1的能力，谷歌同步升级了旗下AI影视创作平台...

工具

OpenAI重磅推出Sora 2，AI生成视频再升级，“AI版抖音”开启创意新体验

10月1日凌晨，OpenAI发布了旗舰视频和音频生成模型Sora 2，并推出“AI版抖音”——Sora应用程序。 OpenAI将Sora 2称作“正直奔视频领域的GPT-3.5时刻”。相比之前的Sor...

工具 # OpenAI # Sora

Claude Sonnet 4.5强势登场：编程能力再升级，自主写代码超30小时

今天，Claude Sonnet 4.5正式发布，该模型能持续专注处理复杂多步骤任务超过30小时，在编程能力、计算机操作能力榜单中占据榜首，在推理、数学、智能体编程等多方面超越GPT-5。 Claud...

工具 # 编程

腾讯混元3D-Omni、混元3D-Part发布并开源：3D生成迈入精准可控时代

9 月 26 日，腾讯宣布，混元3D生成模型家族又添新成员——混元3D-Omni、混元3D-Part发布并开源。这也是腾讯混元在可控3D生成上的新突破，让AI 3D建模更具实用性，加速3D生成模型在游...

工具 # 3D生成

全新MoE架构！阿里开源Qwen3-Next，训练成本直降九成

大语言模型（LLM），正在进入Next Level。周五凌晨，阿里通义团队正式发布、开源了下一代基础模型架构Qwen3-Next。总参数80B的模型仅激活 3B，性能就可媲美千问3旗舰版235B模型...

工具 # Qwen3

阿里端出最强语音模型Qwen3-ASR-Flash：听得清，识得准！

9月8日，阿里发布最新语音识别模型Qwen3-ASR-Flash，该模型基于Qwen3基座模型训练，支持11种语言和多种口音。用户可以通过ModelScope、HuggingFace和阿里云百炼API...

工具 # 语音识别

阿里通义千问发布迄今最大模型——Qwen3-Max-Preview，参数量超1万亿

9月5日，阿里上线Qwen3系列最强模型Qwen3-Max的Preview版本，这也是阿里迄今为止最大的模型，参数量超1万亿。该模型目前已登陆阿里百炼平台，且在通义千问应用及Qwen Chat上免费可...