腾讯ima2.0发布,一句话搜索上百万知识库、2亿条知识 10月23日,在腾讯AI工作台ima发布一周年活动现场,ima2.0版本更新内容正式公布,包括了以Agent能力为基础的“任务模式”,以及知识库“AI要点”等功能,将于24日启动内测,27日正式上线... 工具# 腾讯
OpenAI发布AI浏览器ChatGPT Atlas,挑战Chrome霸主地位 当地时间10月21日,OpenAI通过在线直播正式发布独立AI驱动网页浏览器ChatGPT Atlas。这款以ChatGPT为核心的浏览器,不仅是OpenAI首次涉足互联网终端工具领域、布局用户访问网... 工具# OpenAI
百度新开源模型PaddleOCR-VL一夜登顶,识别109种语言,综合分全球第一 百度10月16日开源的多语言文档解析模型PaddleOCR-VL,连续三天霸榜Hugging Face趋势榜第一。 PaddleOCR-VL能识别109种语言的文本、表格、公式和图表等复杂元素,包括全... 工具# 百度
谷歌 Veo 3.1 视频生成模型发布:新增音频支持、对象添加等功能 今天,谷歌宣布推出全新的Veo 3.1视频生成模型,新版本提升了画面真实感与叙事控制能力,同时具备更强大的提示词理解力和音画同步生成能力。 依托Veo 3.1的能力,谷歌同步升级了旗下AI影视创作平台... 工具
OpenAI重磅推出Sora 2,AI生成视频再升级,“AI版抖音”开启创意新体验 10月1日凌晨,OpenAI发布了旗舰视频和音频生成模型Sora 2,并推出“AI版抖音”——Sora应用程序。 OpenAI将Sora 2称作“正直奔视频领域的GPT-3.5时刻”。相比之前的Sor... 工具# OpenAI# Sora
Claude Sonnet 4.5强势登场:编程能力再升级,自主写代码超30小时 今天,Claude Sonnet 4.5正式发布,该模型能持续专注处理复杂多步骤任务超过30小时,在编程能力、计算机操作能力榜单中占据榜首,在推理、数学、智能体编程等多方面超越GPT-5。 Claud... 工具# 编程
腾讯混元3D-Omni、混元3D-Part发布并开源:3D生成迈入精准可控时代 9 月 26 日,腾讯宣布,混元3D生成模型家族又添新成员——混元3D-Omni、混元3D-Part发布并开源。这也是腾讯混元在可控3D生成上的新突破,让AI 3D建模更具实用性,加速3D生成模型在游... 工具# 3D生成
全新MoE架构!阿里开源Qwen3-Next,训练成本直降九成 大语言模型(LLM),正在进入Next Level。 周五凌晨,阿里通义团队正式发布、开源了下一代基础模型架构Qwen3-Next。总参数80B的模型仅激活 3B,性能就可媲美千问3旗舰版235B模型... 工具# Qwen3
阿里端出最强语音模型Qwen3-ASR-Flash:听得清,识得准! 9月8日,阿里发布最新语音识别模型Qwen3-ASR-Flash,该模型基于Qwen3基座模型训练,支持11种语言和多种口音。用户可以通过ModelScope、HuggingFace和阿里云百炼API... 工具# 语音识别
阿里通义千问发布迄今最大模型——Qwen3-Max-Preview,参数量超1万亿 9月5日,阿里上线Qwen3系列最强模型Qwen3-Max的Preview版本,这也是阿里迄今为止最大的模型,参数量超1万亿。该模型目前已登陆阿里百炼平台,且在通义千问应用及Qwen Chat上免费可... 工具# Qwen3
钉钉颠覆式产品重构,一口气发布超10款重磅AI产品 8月25日,钉钉召开发布会,发布8.0版本,标志着移动互联网时代用户规模最大的协同办公APP正式走向AI原生。钉钉CEO无招表示:“钉钉8.0也是AI钉钉的1.0,我们决心清空过去,以归零的心态,为A... 工具# 钉钉
企业微信5.0发布:重磅推出十大AI功能,办公体验新升级 企业微信 5.0 正式发布,新版本重点更新了智能搜索、智能总结、智能机器人、表格协作、服务记录整理、企业名片等功能,还在邮箱、国际化和私有部署方面做了扩展。 一、AI 助力办公提效 智能总结 工作中的... 工具# 企业微信
谷歌推出超小型AI模型Gemma 3 270M!手机能跑,智能设备离线运行新突破 谷歌推出史上最小Gemma 3开源模型,一个拥有2.7亿个参数的轻量级模型,底层设计以特定任务微调为目标,具备强大的指令跟踪和文本能力。 在指令执行能力测试中,如IFEval基准测试所示,Gemma ... 工具# Gemma 3
谷歌”世界模拟器”Genie3惊艳登场!一句话生成3D世界,支持分钟级超长记忆 只需一句话,就能生成可实时交互的3D世界。 刚刚,谷歌DeepMind发布了新一代通用世界模型Genie 3。 性能上,Genie 3相比上一代大幅升级,支持720P画质,每秒24帧实时导航,以及分钟... 工具# DeepMind# Genie 3
阿里开源首个图像生成基础模型Qwen-Image,支持中文高保真输出,登顶全球开源榜首 国产SOTA(最佳表现)级开源图像生成模型,来了! 8月5日,阿里开源了Qwen-Image,通义千问系列中首个图像生成基础模型。Qwen-Image主打复杂文本渲染能力,能在不同场景中,准确地生成不... 工具# Qwen-Image
谷歌重磅出击!Gemini 2.5 Deep Think模型碾压OpenAI o3与Grok 4 8月1日晚,谷歌宣布向 Google AI Ultra 订阅用户推出 Deep Think 功能,Gemini 2.5 Deep Think 模型在今年的国际数学奥林匹克竞赛 (IMO) 上夺得金牌... 工具# Gemini 2.5
国产视频生成再突破!从影视级短片到远洋亲情连线,AI让天涯变咫尺 起猛了,AI现在都能生成武打戏了,还是人虎搏斗的那种! 近日,一条名为《风入松》的AI短片,在年度AI盛会WAIC期间亮相,吸引了不少眼球。这部影片以现代废土风,重新演绎了经典的“武松打虎”故事。 画... 工具# AI视频生成# TeleAI
阿里开源Qwen3-Coder:4800亿参数,Agent分数碾Kimi K2,训练细节公开 就在刚刚,阿里巴巴Qwen团队开源了其最新一代旗舰编程模型Qwen3-Coder-480B-A35B-Instruct。Qwen团队称,这是该团队迄今为止最强大的开源智能体编程模型,拥有480B参数... 工具# Qwen
免费、开源!谷歌推出AI编程王炸Gemini CLI,硬刚Claude Code 一夜之间,谷歌 Gemini CLI 彻底火了。 这是一款开源的、能够运行在终端的 AI 智能体,用户以自然语言命令的形式就可以直接在终端上执行。它还具备谷歌 Gemini Pro 2.5 的强大功能... 工具# Gemini CLI# 谷歌
Midjourney发布首个视频生成模型V1:最长支持21秒,每月10美元 今日凌晨,AI图像生成顶流Midjourney发布其首款AI视频生成模型V1。V1支持用户上传Midjourney生成的或外部图像进行视频生成,有手动、自动生成动作提示词两个选项,可设置镜头移动更快的... 工具# Midjourney