腾讯ima2.0发布,一句话搜索上百万知识库、2亿条知识 10月23日,在腾讯AI工作台ima发布一周年活动现场,ima2.0版本更新内容正式公布,包括了以Agent能力为基础的“任务模式”,以及知识库“AI要点”等功能,将于24日启动内测,27日正式上线... 工具# 腾讯
谷歌重磅出击!Gemini 2.5 Deep Think模型碾压OpenAI o3与Grok 4 8月1日晚,谷歌宣布向 Google AI Ultra 订阅用户推出 Deep Think 功能,Gemini 2.5 Deep Think 模型在今年的国际数学奥林匹克竞赛 (IMO) 上夺得金牌... 工具# Gemini 2.5
OpenAI发布AI浏览器ChatGPT Atlas,挑战Chrome霸主地位 当地时间10月21日,OpenAI通过在线直播正式发布独立AI驱动网页浏览器ChatGPT Atlas。这款以ChatGPT为核心的浏览器,不仅是OpenAI首次涉足互联网终端工具领域、布局用户访问网... 工具# OpenAI
谷歌”世界模拟器”Genie3惊艳登场!一句话生成3D世界,支持分钟级超长记忆 只需一句话,就能生成可实时交互的3D世界。 刚刚,谷歌DeepMind发布了新一代通用世界模型Genie 3。 性能上,Genie 3相比上一代大幅升级,支持720P画质,每秒24帧实时导航,以及分钟... 工具# DeepMind# Genie 3
谷歌推出超小型AI模型Gemma 3 270M!手机能跑,智能设备离线运行新突破 谷歌推出史上最小Gemma 3开源模型,一个拥有2.7亿个参数的轻量级模型,底层设计以特定任务微调为目标,具备强大的指令跟踪和文本能力。 在指令执行能力测试中,如IFEval基准测试所示,Gemma ... 工具# Gemma 3
钉钉颠覆式产品重构,一口气发布超10款重磅AI产品 8月25日,钉钉召开发布会,发布8.0版本,标志着移动互联网时代用户规模最大的协同办公APP正式走向AI原生。钉钉CEO无招表示:“钉钉8.0也是AI钉钉的1.0,我们决心清空过去,以归零的心态,为A... 工具# 钉钉
免费使用Sora!微软发布Bing Video Creator 今天凌晨1点,微软在官网发布了Bing搜索引擎全新功能——Bing Video Creator。 Bing Video Creator由OpenAI的文生视频模型Sora提供技术支持,通过自然语言就能... 工具
阿里端出最强语音模型Qwen3-ASR-Flash:听得清,识得准! 9月8日,阿里发布最新语音识别模型Qwen3-ASR-Flash,该模型基于Qwen3基座模型训练,支持11种语言和多种口音。用户可以通过ModelScope、HuggingFace和阿里云百炼API... 工具# 语音识别
Claude Sonnet 4.5强势登场:编程能力再升级,自主写代码超30小时 今天,Claude Sonnet 4.5正式发布,该模型能持续专注处理复杂多步骤任务超过30小时,在编程能力、计算机操作能力榜单中占据榜首,在推理、数学、智能体编程等多方面超越GPT-5。 Claud... 工具# 编程
Cursor 1.0首个大版本来袭!自动捉bug,秒改屎山代码,AI编程分水岭已至 备受期待的Cursor 1.0终于重磅发布! 这是Cursor首个整数的版本号,可见他们对此次产品的更新非常有信心。 通过这次更新,BugBot能自动揪出代码漏洞、后台智能体全员开放、Jupyter ... 工具# Cursor
免费、开源!谷歌推出AI编程王炸Gemini CLI,硬刚Claude Code 一夜之间,谷歌 Gemini CLI 彻底火了。 这是一款开源的、能够运行在终端的 AI 智能体,用户以自然语言命令的形式就可以直接在终端上执行。它还具备谷歌 Gemini Pro 2.5 的强大功能... 工具# Gemini CLI# 谷歌
Midjourney发布首个视频生成模型V1:最长支持21秒,每月10美元 今日凌晨,AI图像生成顶流Midjourney发布其首款AI视频生成模型V1。V1支持用户上传Midjourney生成的或外部图像进行视频生成,有手动、自动生成动作提示词两个选项,可设置镜头移动更快的... 工具# Midjourney
国产视频生成再突破!从影视级短片到远洋亲情连线,AI让天涯变咫尺 起猛了,AI现在都能生成武打戏了,还是人虎搏斗的那种! 近日,一条名为《风入松》的AI短片,在年度AI盛会WAIC期间亮相,吸引了不少眼球。这部影片以现代废土风,重新演绎了经典的“武松打虎”故事。 画... 工具# AI视频生成# TeleAI
百度新开源模型PaddleOCR-VL一夜登顶,识别109种语言,综合分全球第一 百度10月16日开源的多语言文档解析模型PaddleOCR-VL,连续三天霸榜Hugging Face趋势榜第一。 PaddleOCR-VL能识别109种语言的文本、表格、公式和图表等复杂元素,包括全... 工具# 百度
全新MoE架构!阿里开源Qwen3-Next,训练成本直降九成 大语言模型(LLM),正在进入Next Level。 周五凌晨,阿里通义团队正式发布、开源了下一代基础模型架构Qwen3-Next。总参数80B的模型仅激活 3B,性能就可媲美千问3旗舰版235B模型... 工具# Qwen3
6天狂飙200万,这个AI应用为何全网爆火? “灵光”,彻底火了。 上周,蚂蚁集团发布的全模态通用AI助手灵光,或许是2025年底AI应用赛道中最大的惊喜之一。 灵光的下载量呈现加速增长的态势,上线首日,灵光的下载量便突破20万,第四天突破100... 工具# AI助手
谷歌 Veo 3.1 视频生成模型发布:新增音频支持、对象添加等功能 今天,谷歌宣布推出全新的Veo 3.1视频生成模型,新版本提升了画面真实感与叙事控制能力,同时具备更强大的提示词理解力和音画同步生成能力。 依托Veo 3.1的能力,谷歌同步升级了旗下AI影视创作平台... 工具
苹果开源新模型SHARP! 一秒钟让照片变3D世界 12月11日,苹果发表论文介绍了3D生成模型SHARP,宣称在标准GPU上,该模型能够以不到1秒的时间将单张图像重建为逼真的3D场景。目前,该模型已开源。 用户仅需输入一张普通照片,该模型即可通过神经... 工具# 3D生成# 苹果
谷歌Gemini 3发布即登顶:碾压竞品获马斯克点赞,训练依托TPU显实力 今天凌晨,谷歌最强推理模型Gemini 3终于亮相,一个模型囊括了原生多模态、推理、Agent多种能力。 谷歌DeepMind研究团队称,这是全球最先进的多模态理解模型、谷歌最强大的Agent编程和氛... 工具# 谷歌
OpenAI十周年推出其迄今最强模型GPT-5.2,奥特曼:十年后将构建出超级智能 今日凌晨,正值OpenAI十周年生日,OpenAI正式推出其迄今最强模型GPT-5.2,并同步上线ChatGPT与API体系。 本次更新包含GPT-5.2 Instant、Thinking与Pro三个... 工具# OpenAI