DeepSeek V3低调更新:编程能力大幅提升,R2模型也要来了?
没有发布会,没有铺天盖地的宣传,3月24日 DeepSeek V3-0324 版本静悄悄地上线了。 https://huggingface.co/deepseek-ai/DeepSeek-V3-032...
英伟达最新芯片路线图:未来三年推出Rubin GPU、Rubin Ultra以及新一代GPU产品Feynman
Blackwell还未大规模交付,英伟达已布局两代后继产品。 当地时间3月18日周二,英伟达CEO黄仁勋在GTC25大会上发表主题演讲,公布了2026-2027年数据中心GPU路线图,Rubin和Ru...
提前免费!百度文心大模型4.5和文心大模型X1官网上线
3 月 16 日,百度正式发布文心大模型4.5 及文心大模型X1,在文心一言官网即可免费使用。据介绍,文心大模型 4.5 是百度首个原生多模态大模型,其多模态理解、文本和逻辑推理能力显著提升,在多项测...
AI进入推理模型时代,一文带你读懂思维链
近段时间,推理模型 DeepSeek-R1 可说是 AI 领域的头号话题。用过的都知道,该模型在输出最终回答之前,会先输出一段思维链内容。这样做可以提升最终答案的准确性。 今天这篇文章将带你了解思维链...
谷歌开源Gemma-3多模态大模型,支持128K输入并免费商用
Gemma系列大模型是Google开源的一系列轻量级的大模型。就在刚才(2025年3月12日),Google开源了第三代Gemma系列大模型,共包含4个不同参数规模版本,第三代的Gemma 3系列是多...
至顶智库 | “DeepSeek+政务”全国部署图表:多地政府加快AI+政务落地进程
当前,大模型在政务领域的应用已成为政府提升服务水平的重要抓手,DeepSeek在我国各地政务领域的部署及应用正以前所未有的速度推进。DeepSeek系列模型凭借其在成本和性能方面的优势,在政务服务、公...
Manus:中国团队发布全球首款通用AI Agent炸裂科技圈
3月6日凌晨,是DeepSeek 之后科技圈又一个不眠之夜,所有人都被一个名为Manus的产品刷屏了。AI圈沸腾了,AI智能体板块大涨。Manus的发布,让中国AI科技再一次震撼全世界。 据其团队介绍...
一文了解大模型关键参数:Token、上下文长度与输出限制
随着人工智能技术的飞速发展,大型语言模型(LLM)已成为推动这一领域前进的关键力量。为了更好地掌握和利用LLM技术,对其核心参数的理解显得尤为重要。本文将深入探讨大型语言模型中的三大关键参数:Toke...
一文了解DeepSeek私有化部署成本:企业如何选择?
在当今人工智能快速发展的时代,DeepSeek作为一款领先的AI模型,其强大的功能和广泛的应用领域使其成为众多企业的首选。一方面,R1、V3等版本模型凭借“性能对标GPT-4、成本仅10%”的标签,推...
DeepSeek“开源周”五连炸:以软件之力,重塑AI算力版图
“OpenAI不Open,DeepSeek真Deep”。 本周,“开源周”活动如火如荼地展开,DeepSeek每天不定时上新“黑科技”,让全球程序员直呼:这波简直在大气层! 从计算到通信再到存储,De...