提前免费!百度文心大模型4.5和文心大模型X1官网上线
3 月 16 日,百度正式发布文心大模型4.5 及文心大模型X1,在文心一言官网即可免费使用。据介绍,文心大模型 4.5 是百度首个原生多模态大模型,其多模态理解、文本和逻辑推理能力显著提升,在多项测...
AI进入推理模型时代,一文带你读懂思维链
近段时间,推理模型 DeepSeek-R1 可说是 AI 领域的头号话题。用过的都知道,该模型在输出最终回答之前,会先输出一段思维链内容。这样做可以提升最终答案的准确性。 今天这篇文章将带你了解思维链...
谷歌开源Gemma-3多模态大模型,支持128K输入并免费商用
Gemma系列大模型是Google开源的一系列轻量级的大模型。就在刚才(2025年3月12日),Google开源了第三代Gemma系列大模型,共包含4个不同参数规模版本,第三代的Gemma 3系列是多...
至顶智库 | “DeepSeek+政务”全国部署图表:多地政府加快AI+政务落地进程
当前,大模型在政务领域的应用已成为政府提升服务水平的重要抓手,DeepSeek在我国各地政务领域的部署及应用正以前所未有的速度推进。DeepSeek系列模型凭借其在成本和性能方面的优势,在政务服务、公...
Manus:中国团队发布全球首款通用AI Agent炸裂科技圈
3月6日凌晨,是DeepSeek 之后科技圈又一个不眠之夜,所有人都被一个名为Manus的产品刷屏了。AI圈沸腾了,AI智能体板块大涨。Manus的发布,让中国AI科技再一次震撼全世界。 据其团队介绍...
一文了解大模型关键参数:Token、上下文长度与输出限制
随着人工智能技术的飞速发展,大型语言模型(LLM)已成为推动这一领域前进的关键力量。为了更好地掌握和利用LLM技术,对其核心参数的理解显得尤为重要。本文将深入探讨大型语言模型中的三大关键参数:Toke...
一文了解DeepSeek私有化部署成本:企业如何选择?
在当今人工智能快速发展的时代,DeepSeek作为一款领先的AI模型,其强大的功能和广泛的应用领域使其成为众多企业的首选。一方面,R1、V3等版本模型凭借“性能对标GPT-4、成本仅10%”的标签,推...
DeepSeek“开源周”五连炸:以软件之力,重塑AI算力版图
“OpenAI不Open,DeepSeek真Deep”。 本周,“开源周”活动如火如荼地展开,DeepSeek每天不定时上新“黑科技”,让全球程序员直呼:这波简直在大气层! 从计算到通信再到存储,De...
腾讯混元新一代快思考模型 Turbo S 发布,支持“秒回”
混元Turbo S是什么 混元Turbo S是腾讯混元自研的新一代快思考模型,于2025年2月27日正式发布。该模型旨在解决慢思考模型在响应速度上的不足,通过技术创新实现“秒回”能力,吐字速度提升一倍...
通义万相2.1:阿里旗下强大开源视频生成大模型实测
25日晚,阿里巴巴宣布全面开源旗下视频生成模型万相2.1模型,此举引发了全球AI开发者的广泛关注。通义万相2.1模型基于Apache2.0协议,开放了14B和1.3B两个参数规格的全部推理代码和权重...