在人工智能发展史上,2024年注定是一个值得铭记的年份。这一年,中国AI企业上演了一场惊心动魄的追赶与超越之战。从年初紧追GPT-4的步伐,到年中直面GPT-4o的冲击,再到年末与OpenAI的o1系列针锋相对,中国企业展现出了惊人的执行力和创新潜力。
这是一个群雄并起的时代。智谱AI、月之暗面、MiniMax、百川智能、零一万物、阶跃星辰等”AI六小龙”,与BAT等互联网巨头展开了激烈角逐。资本的青睐、人才的流动、技术的突破交织在一起,构成了这个行业最动人心魄的篇章。当年末的钟声敲响时,中国AI企业已经在某些赛道上实现了对国际巨头的真正超越。
在这场无声的竞赛中,每一次OpenAI的创新都会激起一波追赶浪潮。然而,中国企业并非简单模仿,而是逐渐走出了自己的特色。从智谱的全栈布局到月之暗面的极致体验,从MiniMax的效率追求到DeepSeek的垂直突破,每家企业都在寻找着独特的发展路径。
这是一个充满戏剧性的故事,也是一个关于创新与坚持的传奇。让我们走进2024,重温这场改变中国AI行业格局的精彩角逐…
一月群雄逐鹿:开年竞逐
2024年的第一场雪还未在北京落尽,AI行业的竞争已经白热化。在这个行业里,人们早已习惯了连轴转的工作节奏——毕竟,OpenAI从不给对手喘息的机会。
此时距离GPT-4发布已有9个月,这个横亘在所有企业面前的丰碑依然让人望而生畏。尽管百度在2023年10月就宣称文心一言4.0已经”毫不逊色”于GPT-4,但市场和用户显然还在等待更多的挑战者登场。
1月16日,这个看似平常的工作日,注定要载入中国AI发展史册。清华大学计算机系教授唐杰创立的智谱AI,在这一天推出了新一代基座大模型GLM-4。当测试数据出炉时,整个行业都为之振奋:在MMLU、GSM8K等多个权威评测中,GLM-4均达到GPT-4 90%以上的水平。更令人瞩目的是,在中文对齐能力上,GLM-4首次实现了对GPT-4的超越。
巧合的是,被业内称为”AI六小龙”之一的MiniMax选择在同一天亮剑。他们发布了国内首个MoE(混合专家模型)大语言模型ABAB6,这个创新的混合专家架构在处理复杂任务和提升计算效率方面表现出独特优势。
仅仅两周后,MiniMax又一次出手,推出能在6秒内完成音色复刻的语音大模型abab-speech-01,用数百万小时的音频数据训练成果,展示了他们在多模态领域的实力。
从此,声音复刻也成为国内AI聊天机器人的标配功能。
1月22日,一个重量级人物带着他的新作品加入战局。李开复领导的零一万物发布了Yi-VL多模态语言模型,这款产品一经推出就在MMMU和CMMMU数据集上创造佳绩,展现出强大的跨学科知识理解能力,让这家低调的公司一举成为全球开源社区的焦点。
仅仅四天后,被誉为”最懂AI”的团队月之暗面展示了他们对产品打磨的极致追求。Kimi Chat的重大更新不仅全面提升了基础模型能力,更在用户体验上实现突破:回复速度翻倍,联网搜索、上下文学习、多场景能力一应俱全。特别是小程序版本新增的语音输入功能,让这个产品在用户友好度上遥遥领先。
这些创新功能的完美呈现,让这家一向低调的企业迅速成为业界瞩目的新秀。在2024年上半年,Kimi一跃成为最受欢迎的AI应用之一,吸引了大量原本专注使用ChatGPT的用户转投旗下。其影响力之大,甚至在资本市场掀起了”Kimi概念股”的投资热潮。
就在这个波澜壮阔的一月即将结束时,1月29日,一个重磅消息引爆全场。被业内称为”中国最特立独行的AI独角兽”的百川智能推出了超千亿参数的Baichuan 3。这个庞然大物不负众望,在医疗评测中展现出最佳性能,更在中文任务上超越了GPT-4,同时在自然语言处理和代码生成领域也表现不俗。
至此,新年第一个月的角力渐入尾声。五家”AI六小龙”已经悉数亮相,每家都展现出独特的技术路线和产品特色,而另外一家六小龙此刻还在继续蓄力,他将在几个月以后才首次亮相。
然而,就在一片欢呼声中,一个令人深思的声音从另一个科技巨头传来。
1月30日,字节跳动CEO梁汝波在年度全员会上罕见地流露出强烈的危机感。这家移动互联网时代的佼佼者,在AI时代似乎迷失了方向。”直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司都是在2018年至2021年创立的。”
这番话像一记惊雷,在科技圈久久回荡。当AI创业公司在你追我赶的时候,这家曾以敏锐闻名的互联网巨头,终于意识到自己在这场空前的技术变革中落后了。字节跳动的自我反思,某种程度上也折射出整个中国科技行业在AI领域的尴尬:曾经的创新者,如今却不得不重新找寻追赶的勇气。
这场波澜壮阔的竞赛,才刚刚拉开序幕。没有人知道,在春节即将来临之际,一个名为Sora的风暴正在大洋彼岸酝酿…
春节惊雷:Sora引发的震动
2024年的除夕还未到来,美国硅谷已经给中国AI圈送来了一份”特别的新年礼物”。
2月10日,农历大年初一,OpenAI在社交媒体上低调发布了文生视频产品Sora。这个以冰岛语”故事”命名的模型,能将文本描述转化为长达60秒的高质量视频,支持多角度镜头转换,甚至能准确还原复杂的物理运动规律。
一时间,原本应该享受团圆的中国工程师们,纷纷被迫中断休假,钉在电脑前研究Sora的演示视频。
这个突如其来的”春节礼物”,让整个中国AI圈陷入沉思。视频生成这个全新赛道的出现,意味着又一次技术范式的转变。一位不愿透露姓名的AI创业公司CTO感叹:”当我们还在研究如何追赶GPT-4时,OpenAI已经在开辟下一个赛道了。”
3月:暗流涌动
就在各家企业还在消化Sora带来的冲击时,资本市场率先做出了反应。二月底,月之暗面以超10亿美元的融资为春季融资大战打响第一枪,其豪华的投资方阵容——阿里、红杉中国、小红书、美团和砺思资本等的加入,展现出资本市场对中国AI企业的坚定信心。
3月6日,MiniMax也获得了阿里领投的6亿美元融资,估值一举突破25亿美元。资本的青睐似乎在为即将到来的技术竞赛做准备
几乎是同一时间,零一万物发布并开源了Yi-9B模型。这个在代码和数学能力上表现卓越的模型,以其优异的中英文处理能力和低成本的部署优势,很快在开源社区引起轰动。
产品战场上,阿里云率先发力。3月14日,通义千问展示了令人瞩目的场景创新能力,其一键速读万页文档的解析功能,以及随后推出的6小时超长音视频转写能力,展现出在垂直领域的深耕成果。
几天后,月之暗面再传捷报,Kimi智能助手将无损上下文长度提升至200万字,这一远超OpenAI的成就,为行业树立了新的标杆。
在这个充满变数的三月,一个重磅消息让整个行业为之振奋。
3月19日,英伟达在GTC 2024大会上发布新一代AI芯片GB200。这颗搭载2080亿晶体管的”超级芯片”,以其四倍于H100的训练算力和更低的能耗,重新定义了AI计算的极限。
这个消息让中国AI圈既看到了希望,又感受到了压力,获取这些顶级算力的难度和成本,可能会让行业分化加剧。
3月23日,最低调的”AI六小龙”阶跃星辰终于揭开了神秘的面纱。他们的Step系列通用大模型矩阵——包括千亿参数语言大模型Step-1、多模态大模型Step-1V及万亿参数MoE语言大模型Step-2预览版的同时亮相。
月末,阿里又一次展现了技术创新实力。3月29日推出的首个开源MoE模型Qwen1.5-MoE-A2.7B,用27亿参数就能匹敌70亿参数的传统模型,不仅大幅降低了训练成本,更为行业探索出一条提升效率的新路径。这是继春节前推出Qwen1.5系列后,阿里在模型架构创新上的又一重要突破。
从春节的Sora震撼,到三月英伟达GB200的发布,再到各家企业匆忙的技术布局,这个春天注定是不平静的。中国AI企业在视频生成领域的暂时”失语”,以及对顶级算力的迫切需求,都预示着行业格局可能发生剧变。而随着四月的到来,一场涉及技术、资本、人才的多维度竞争,正在悄然展开……
4月:百舸争流
进入4月,行业竞争进一步白热化。4月3日,阿里云推出AI编程工具”通义灵码”,支持200多种编程语言,展现出在垂直领域的野心。3个月后,这个产品被WAIC(世界人工智能大会)评为镇馆之宝之一。
一周后,他们又推出320亿参数的通义千问(Qwen1.5-32B),这个在性能、效率和内存占用间达到平衡的模型,为行业提供了一个更高效、经济的解决方案。
4月17日,MiniMax发布abab 6.5系列模型,包含万亿参数的abab 6.5和更高效的abab 6.5s。这两款模型支持200k tokens上下文长度,能在1秒内处理近3万字文本,展现出惊人的处理效率。更具战略意义的是,4月29日,MiniMax宣布开放平台API服务全面升级,降价超过50%,处理速度翻倍,向着普惠AI迈出重要一步。
4月18日,Kimi智能助手迎来重大更新,包括模型能力提升、新增常用语功能、语音输入/播报以及搜索引用溯源,旨在提高用户体验和效率。新版Kimi在逻辑推理、数学编程、中英翻译等方面表现更优,同时支持个性化常用语设置和语音交互,让信息获取更便捷。搜索结果新增引用溯源功能,确保回答的严谨性。
4月30日,一个重要的评测结果引发业界关注:百川智能的Baichuan 3在SuperCLUE中文大模型评测中以73.32分位居国内第一,超越GPT-4-Turbo等32个大模型。特别是在知识百科(82分)和逻辑推理(68.60分)两个关键维度上的出色表现,让业界看到了中国模型的真实实力。
5月鏖战:巨头觉醒与价格风暴
五月,人工智能赛道上的竞争骤然加速。5月9日,阿里云发布通义千问2.5版本,并开源1100亿参数模型Qwen1.5-110B。这个版本在理解、逻辑推理等方面显著提升,中文能力领先业界。在多个基准测评中,Qwen1.5-110B成功超越Meta的Llama-3-70B模型,标志着通义大模型首次赶上GPT-4水准。
5月13日,OpenAI发布GPT-4o(“Omni”),这个全能型模型不仅能够分析和生成文本、图像和声音,其速度是GPT-4 Turbo的两倍,成本仅为后者的一半。一时间,中国企业好不容易拉近的技术差距,再次被拉大。
李开复领导的零一万物同样不甘示弱。5月13日,他们发布千亿参数AI模型Yi-Large,并宣布开源闭源双轨战略,展现出清晰而审慎的商业路线。
5月15日,MiniMax推出AI聊天APP”小海螺AI”,这款基于多模态大模型的应用能快速处理大量文本,理解情绪,支持多种文件格式和语音交互。
在行业治理方面,智谱AI选择了独特的切入点。5月21日,他们与OpenAI、谷歌、微软等15家顶级AI公司共同签署前沿人工智能安全承诺,以平等者的姿态加入全球AI治理对话。同日,百川智能的Baichuan 4在SuperCLUE综合基准评测中以80.64分刷新国内记录,超越GPT-4 Turbo,展现出中国企业在技术追赶上的坚定决心。
紧随其后,百川智能在5月22日推出新一代大模型Baichuan 4和首款AI助手”百小应”。这款助手在通用能力、数学和代码能力上显著提升,国内评测中能力位居首位。
两家沉睡已久的科技巨头也在这个月醒来。
5月15日,字节跳动发布豆包大模型,公布了足以搅动行业的使用价格。豆包通用模型pro-32k版,模型推理输入价格仅为0.0008元/千Tokens,而市面上同规格模型的定价一般为0.12元/千Tokens,是豆包模型价格的150倍。pro-128k版模型推理输入价格为0.005元/千Tokens,比行业价格低95.8%。
月末,腾讯也加入战局。腾讯元宝AI产品基于腾讯混元大模型开发,具备多模态能力,旨在提供即时答案、创意灵感和新鲜资讯,覆盖知识学习、生活百科、职场办公和趣味创作等多个场景。
然而,这场激烈竞争中并非完全一片光明。遗憾的是,百川智能在2024年4月的这次重磅发布后,随后半年多时间内未见类似跟进,年末更传出联合创始人、商业化负责人洪涛离职的消息,为这个季度蒙上了一层阴影。
随着五月的硝烟渐渐散去,六月的阳光将照进这个充满期待与不确定的赛道。谁能在这场没有硝烟的战争中脱颖而出,依然是悬而未决的谜题。
谁打响了价格战的第一枪?
在人工智能的激烈赛道上,字节跳动这个曾经的睡巨人终于苏醒,却发现世界已经面目全非。如果说DeepSeek用那一枚价格子弹打响了价格战的第一枪,那么字节则如同重炮手,瞬间引爆了全面的价格战争。
5月初,私募巨头幻方旗下的深度求索犹如一匹黑马,以DeepSeek-V2模型的性价比率先发起降价突袭。这款在数学、编程、中英文能力上已逼近GPT-4的模型,使用价格仅为GPT-4o的1/35,瞬间点燃了行业敏感的神经。
字节跳动随即加入战局,以其一贯的激进风格,将豆包通用模型Pro-32k的输入价格狠狠砍至0.8元/百万tokens。火山引擎总裁谭待更是豪言:”大模型从此以厘计价。“这一举动,无异于向整个行业发出了价格战的总动员令。
阿里云、百度紧随其后,纷纷大幅下调价格,甚至直接推出免费模型。科大讯飞和腾讯也不甘示弱,星火Lite API和混元大模型lite 256k相继宣布免费。短短数日间,国内AI大模型市场已然陷入了一场全面的价格厮杀。
然而,这场看似激烈的价格战实质上暴露了国内AI企业的深层焦虑。价格战犹如饮鸩止渴,看似痛快,实则危机四伏。企业们试图用低价换取市场份额,背后却是对商业模式的迷茫和对未来的不确定性。
字节跳动的这一招,表面上看似凌厉,实则透露出其在AI赛道上的无奈。作为一家习惯了通过规模和流量取胜的互联网巨头,他们似乎尚未找到在AI领域真正的制胜之道。价格战,不过是他们手中为数不多的武器之一。
这场没有硝烟的价格大战,正将所有参与者拖入一个越来越窄的通道。技术创新被价格的漩涡淹没,商业价值被无序的竞争稀释。谁能在这场看似激烈实则内耗的竞争中保持理性和长远眼光,谁就可能最终站在这个新兴赛道的制高点。
当价格战硝烟散去,留下的或许只有一地鸡毛和对未来的迷茫。在AI这个注定要改变世界的赛道上,价格从来都不应是最终的制胜法宝。
六、七月暗涌:人才、资本与算力的博弈
价格战的硝烟刚刚散去,AI行业并未迎来平静,反而进入了一个更为残酷的角逐场——人才、资本与算力的白热化战场。如果说五月是巨头觉醒和价格风暴的舞台,那么六月则预示着更为深层次的竞争即将展开。
6月,资本的嗅觉异常灵敏。6月3日,智谱AI率先收获国际资本的青睐,获得沙特阿美旗下基金Prosperity7的4亿美元融资,估值突破30亿美元,这无疑是对其技术实力和发展前景的有力背书。
紧接着,6月17日,杭州DeepSeek宣布DeepSeek Coder V2开源,该模型在代码和数学能力上直逼GPT-4-Turbo,总参数达2360亿,位居全球前列。模型、代码和论文的全面开源,为业界树立了开放共享的标杆,也加速了中国AI生态的繁荣。DeepSeek的开源举动,不仅展现了其技术自信,也吸引了更多开发者和研究者的关注,为后续的人才争夺战埋下了伏笔。
如果说资本的流动是暗流涌动,那么人才的争夺则是一场公开的博弈。7月,人才争夺战进入白热化。字节跳动展现出令人震撼的进攻性,以高规格待遇挖来了“最懂阿里大模型的人”——前通义大模型负责人周畅及其团队,更网罗了零一万物前算法副总裁黄文灏、面壁智能原核心成员等多位AI领域顶尖人才。
这一连串的重磅引援,瞬间改写了字节在AI人才版图上的位置,也预示着这家互联网巨头将在AI领域发起更猛烈的攻势。这种“挖角”行为,虽然在商业竞争中司空见惯,但也反映出AI领域人才的极度稀缺和企业对顶尖人才的渴求。
与此同时,零一万物的处境却显得格外艰难。继技术联创黄文灏出走后,联合创始人李先刚也选择回归房产交易平台贝壳,产品负责人曹大鹏紧随其后离职。
这家成立仅一年多的AI新贵,在估值一度达到200亿人民币之际,却面临核心团队的持续瓦解。下半年几乎没有重磅产品发布,为这家明星公司的发展蒙上了一层阴影,也引发了业界对AI创业公司人才稳定性的担忧。
资本的狂热并未因人才的流动而减退。7月底,百川智能完成50亿元人民币的A轮融资,阿里、小米、腾讯、中金等顶级投资者倾巢而出,再次证明了资本市场对AI赛道的持续看好。8月,月之暗面再获超3亿美元融资,估值直线攀升至33亿美元,巩固了其在AI领域的领先地位。
8月,阶跃星辰迎来重量级人物——ResNet四位作者之一的张祥雨。这位90后AI大牛的加盟,随后吸引了腾讯研究总监俞刚、微软亚研院段楠的跟进。这一连串的人才进账,不仅为公司带来技术提振,更向业界传递出一个关键信号:在追赶的道路上,原创性技术创新或许才是留住人才的真正法宝。与其高薪挖角,不如构建更有吸引力的技术平台和研究氛围。
年底,小米这个在AI领域一向相对“保守”的企业,也开始发力,以千万级年薪挖来了DeepSeek V2的核心开发者之一、95后天才少女罗福莉,打破了外界对其在AI领域投入不足的刻板印象。
与此同时,在全球资本市场上,另一个震撼人心的故事正在上演。6月5日,英伟达股价大涨,市值首次突破3万亿美元,超越苹果成为全球市值第二高的公司。
到6月19日,更是以3.34万亿美元的市值超越微软,成为全球最有价值的公司。过去五年,其股价飙升3477.31%,远远超越微软和苹果,成为AI时代当之无愧的算力霸主,也凸显了算力在AI发展中的关键作用。
人才的流动、资本的涌入、以及算力霸主的崛起,共同构成了六月AI行业的主旋律。而即将到来的七月,则将是技术展示和行业交流的重要舞台。
七月盛会:WAIC群星闪耀,DeepSeek声名鹊起
如果说六月是暗流涌动,那么七月则是在聚光灯下展示实力和交流思想的舞台。每年在上海召开的世界人工智能大会(WAIC),是国内规格最高的AI盛会,2024年的大会更是规模空前,吸引了全球目光。
大会前夕,6月13日,阶跃星辰的跃问App正式推出,集成拍照问答、智能搜索等功能,旨在提升工作学习效率,简化生活。这款基于阶跃星辰Step系列大模型打造的应用,优化了联网搜索和文档解析能力,支持拍照识图和语音输入,以及多种格式文档分析,为用户提供了一个便捷的AI助手。
7月4日,在2024年WAIC大会上,阶跃星辰公司发布了三款Step系列大模型新品,包括万亿参数语言模型、多模态大模型和图像生成大模型,实现了从千亿到万亿参数的跨越,并在多模态领域取得突破。
第二天,国务院总理李强亲临2024世界人工智能大会并巡馆,特别到访阶跃星辰展台。阶跃星辰向总理展示了其Step系列通用大模型的最新进展,包括万亿参数语言大模型和多模态理解生成技术。
7月5日,智谱AI也在世界人工智能大会上发布了CodeGeeX第四代模型,并宣布开源。CodeGeeX4-ALL-9B模型集合了代码补全、问答、解释器等多项功能,成为百亿参数以下性能最强的全能代码模型。
此外,7月30日,Kimi智能助手推出了PPT制作工具,提升了办公效率。此后,PPT生成功能逐渐成为国产AI工具的标配。Kimi的这一举动,也反映了AI技术在办公领域的渗透和普及。
WAIC的成功举办,不仅展示了中国AI技术的最新进展,也促进了国内外AI领域的交流与合作。而就在WAIC之后不久,来自国际权威评测机构的消息,则进一步肯定了中国AI技术的实力。
7月16日(美国时间),LMSYS组织的大模型竞技场更新结果显示,DeepSeek-V2-0628超越多个顶尖模型,荣登全球开源模型榜首。这一成绩证明了中国开源大模型在全球舞台上的竞争力,也为中国AI行业赢得了国际声誉。
8月:蓄势待发——技术创新与应用拓展
七月的WAIC大会余热未消,AI领域的竞争并未因此停歇,反而随着深秋的到来,进入了更加激烈的博弈阶段。如果说此前是各方势力初步试探和布局的阶段,那么深秋时节,则意味着真刀真枪的较量正式拉开帷幕。人才的流动仍在继续,技术上的突破也层出不穷,各家企业都在努力寻找自己的立足点。
八月,资本的目光依然聚焦于AI赛道。月之暗面再获超3亿美元融资,估值升至33亿美元。这笔巨额融资,无疑为这家公司未来的发展注入了强大的信心和资金支持,也预示着他们将在接下来的竞争中扮演更重要的角色。
与此同时,技术上的突破也开始涌现。8月6日,智谱AI在视频生成领域实现重要突破,开源CogVideoX视频生成模型。这个仅需18GB显存就能实现6秒视频生成的轻量级模型,大大降低了开发者的使用门槛,让更多人能够参与到AI视频创作中来。
更令人惊喜的是,仅仅过了不到一个月,8月28日,参数规模更大、性能更强的CogVideoX-5B模型也宣布开源,显存需求更是降低到最低仅为11.4GB。智谱AI在视频生成领域的连续突破,不仅展现了其在该领域的强大技术实力,也加速了AI视频生成技术的普及。
不仅如此,字节跳动也在8月6日推出了一款名为“即梦 AI”的一站式 AI 创作平台,直接对标快手的可灵和Sora,进一步拓展其在AI创作领域的布局,试图在这一新兴市场占据更有利的位置。
在技术层面,DeepSeek也在8月2日通过创新的硬盘缓存技术,显著降低了API服务延迟和成本,大幅提升了用户体验,也为后续更大规模的应用奠定了基础。
总而言之,八月是技术创新和应用拓展并进的一个月,为接下来的竞争蓄力。
九月:百花齐放——多领域突破与格局演变
进入九月,各家企业在技术和应用层面都展开了更加积极的探索,竞争也变得更加白热化,呈现出百花齐放的态势。
9月6日,智谱宣布,其AI产品“清言”的视频通话功能现已全面开放,并提供限时免费体验。这项新功能突破了传统的打字和语音交互限制,使AI能够“看”世界,理解用户表情和情绪,从而提供更自然流畅的交互体验,无疑将用户体验提升到了一个新的高度。这标志着智谱的大模型在多模态交互方面取得了重要进展,也成功追赶上了OpenAI五月份发布的GPT-4o的水平,展现了中国AI企业在技术追赶上的速度。
同样在9月6日,DeepSeek发布了V2.5模型,该模型不仅融合了通用对话和代码处理能力,还在人类偏好对齐、写作和指令跟随等方面进行了显著优化,并继续保持了Function Calling、FIM补全、Json Output等实用功能,提升了模型的综合性能。
DeepSeek V2.5不负众望,在后续的全球大模型竞技场中一举夺魁,位列国内第一,甚至超越了国内最强闭源模型,并在8个单项能力上领跑国内模型,再次向世界证明了其强大的技术实力,也为中国开源模型赢得了国际声誉。
9月10日,Kimi API开始支持联网搜索功能,成为第一家推出类似OpenAI Search功能的中国AI公司,为用户提供了更便捷、更智能的对话体验,也为其他企业树立了新的标杆,推动了AI应用的发展。
更重要的是,同日,苹果在秋季新品发布会上正式推出了“Apple Intelligence”,这一事件具有划时代的意义,它标志着AI正式进入了手机操作系统层面,开启了AI手机的新时代。Apple Intelligence深度整合到iOS系统中,为用户带来了前所未有的智能体验,例如智能通知摘要、邮件自动回复、照片智能编辑等。
这一举动迅速引发了整个手机行业的震动,并在接下来的几个月里,引发了中国手机厂商的集体跟进,纷纷推出了对标Apple Intelligence的AI OS,试图在新的赛道上抢占先机。Apple Intelligence的发布,无疑是2024年手机行业最重要的事件之一,它不仅改变了用户与手机的交互方式,也为AI技术的发展开辟了新的应用场景。
9月12日,OpenAI推出o1-preview和更快更便宜的o1-mini,再次为行业指明新的方向,这两款产品都更加强调在回答前投入更多“思考时间”来提升解决复杂问题的能力,为大模型的发展提供了新的思路。
更重要的是,OpenAI o1的推出,标志着AI的发展正式进入到了“推理者”阶段。此前的AI更多是“执行者”,能够根据指令完成任务,而o1则开始展现出一定的推理能力,能够更好地理解问题、分析信息、并给出更合理的答案。
再一次,中国公司看到了新的目标,并开始积极探索在“推理”方向上的技术突破,力图在下一代AI技术浪潮中占据领先地位。
九月也是视频生成赛道的关键月份。MiniMax发布的海螺视频生成模型abab-video-1在海内外都赚足了眼球,不仅获得国内网友的追捧,在国外用户中也收获了极高评价,展现了中国AI在视频生成领域的潜力。
然而,令人惋惜的是,MiniMax产品负责人、”星野”和”Talkie”的掌舵人张前川也于本月因个人原因淡出公司事务,改任产品顾问一职,这无疑给MiniMax的未来发展增添了一丝不确定性,也引发了业界对AI创业公司人才稳定性的思考。
9月19日,阿里云的通义万相在云栖大会上正式亮相,并在国风、3D动画及CG厚涂等多种风格上展现出独特优势,吸引了众多关注,也为AI艺术创作提供了更多可能性。
在同一大会上,阿里云更是宣布Qwen2.5-72B模型全球开源,并宣布其性能超越了Llama 405B,支持128K tokens,生成8K tokens内容,充分展现了AI在编程、多模态能力上的巨大突破,也进一步推动了开源生态的发展。
9月20日,腾讯元器AI智能体正式发布,为公众号创作带来了新的可能,也标志着AI在内容创作领域的应用进一步深入,预示着内容生产方式的变革。
9月24日,字节跳动也发布了豆包视频生成大模型,并声称其突破了多主体互动难关,支持多风格多比例一致性多镜头生成,适用于电商营销、动画教育等多个领域,无疑将进一步加剧视频生成赛道的竞争,推动该领域的技术进步和应用创新。
9月25日,百度AI的文心快码在沙利文和SuperCLUE两大权威评测报告中均荣获第一名,以87.55的总分在国内AI代码产品中独占鳌头。
九月,可谓是百花齐放的一个月,各家企业在不同方向上都取得了令人瞩目的进展。
从八月到九月,中国AI行业在技术创新、应用拓展和人才流动等方面都呈现出蓬勃发展的态势。各家企业都在积极探索自身的优势和突破口,共同推动着中国AI行业的进步。接下来的几个月,又将有哪些新的故事发生?
视频生成:从追赶到超越——中国AI的突围之路
在众多AI技术分支中,视频生成无疑是近年来最受瞩目的焦点之一。在这个充满挑战和机遇的赛道上,中国AI企业经历了一段从追赶到超越的历程。
春节期间,OpenAI的Sora震撼发布,给全球AI界带来了巨大冲击,也一度让中国AI企业倍感压力。然而,这种压力反而激发了中国企业的创新热情和追赶速度。
仅仅几个月后,中国企业就用实际行动证明了自己的实力。6月6日,快手率先低调上线了自研的视频生成大模型“可灵”。这款产品一经推出就展现出令人惊艳的实力:1080p的超高清分辨率、长达2分钟的视频生成能力、自由的宽高比调节——这些关键指标都大幅领先于当时的行业水平,甚至超越了当时尚未正式发布的Sora。
“可灵”的发展轨迹可谓稳扎稳打:6月推出图生视频,7月开放网页端,12月推出“AI导演共创计划”和1.6版本。其生成的AI爆改影视剧等内容在各大社交平台刷屏,牢牢占据着视频生成领域的领头羊位置。
9月,MiniMax的海螺视频生成模型abab-video-1异军突起,不仅在国内收获好评,更在海外用户中获得了极高的认可度。与此同时,Vidu、Pixverse等创业公司也展现出卓越的技术实力。腾讯开源的混元视频模型在效果上甚至超越了Sora。
而当OpenAI在等待近10个月后终于正式发布Sora时,却给市场带来了意外的失望。由于各种原因,Sora的实际效果与最初的演示视频相比相去甚远,不仅落后于Google的Veo2,更是被众多中国产品甩在了身后。这标志着中国企业在视频生成赛道上,首次实现了对OpenAI的真正超越。
在这个赛道上的成功,给了中国AI企业极大的信心。7月,智谱AI发布“清影”,上线6天就创造了百万级的生成量。为了保持竞争优势,智谱在8月迅速开源了CogVideoX模型。11月,“清影”升级支持4K、60帧超高清视频生成,并加入了CogSound音效模型。9月,阿里云的通义万相则选择在国风、3D动画等垂直领域寻求突破。
视频生成赛道的成功,不仅证明了中国AI企业在细分领域具备超越国际巨头的实力,更重要的是,它打破了“永远追赶”的魔咒,为中国AI产业注入了新的信心,并预示着中国AI将走向自主创新和引领的新阶段。
在价格战的余波中,中国AI企业开始步入一个更为深层的角逐:技术创新与全球竞争的赛道。11月,这场没有硝烟的较量悄然升温,每一个微小的突破都可能重新定义行业生态。
11月:技术创新的加速期
随着年关将近,中国AI企业展开了2024年的最后冲刺。
11月19日,阶跃星辰的Step-2在国际权威榜单LiveBench中位列全球第五,仅次于OpenAI的o1-mini,这一成绩标志着中国AI企业在国际舞台上的实力正逐步提升。同期,其Step-1V在Chatbot Arena最新榜单中位列中国第一,与Gemini-1.5-Flash并驾齐驱,展现出令人瞩目的技术实力。
在模型开源与多模态应用方面,腾讯率先发起进攻。11月5日,腾讯混元大语言模型和3D模型正式开源。其最新MoE模型”混元Large”参数规模达389B,在多学科评测中处于领先地位。
“Hunyuan3D-1.0″支持文字图像生成3D,为开发者和研究者提供了强大的工具。11月14日,腾讯元宝2.0全面升级,新增AI应用专属板块,混元模型架构支持多模态理解和生成,进一步拓展了应用边界。
然而,技术创新的道路并非一帆风顺。11月19日,腾讯混元大模型技术负责人刘威选择离职,这一人事变动引发业界对人才流动的关注。
与此同时,百度在其世界大会上展示了新的技术突破。李彦宏宣布推出检索增强的文生图技术iRAG和无代码工具”秒哒”,iRAG致力于解决AI图像生成中的幻觉问题,”秒哒”则让非程序员能轻松实现创意,标志着AI应用正走向大众化。
在数学和推理能力方面,Kimi智能助手于11月17日发布新一代数学推理模型k0-math,其数学解题能力对标OpenAI o1系列。同时推出的Kimi探索版增强了搜索意图、信源分析和链式思考能力,为用户提供更智能的问题解决方案。
11月20日,DeepSeek全新推理模型DeepSeek-R1-Lite预览版发布,用户可通过官网体验。模型在数学、编程等领域表现出色,推理过程包含反思和验证,思维链长度可达数万字,展现了超越GPT-4o等模型的推理性能。目前仅支持网页使用,未来将开源并提供API服务。
整个11月,中国AI企业的共同目标似乎非常明确:在春节前赶上OpenAI 9月发布的o1版本。百度文心一言用户规模已达4.3亿,阿里云的QVQ-72B-Preview在视觉理解和推理能力上首次与OpenAI o1和Claude3.5 Sonnet相媲美,这些进展都印证了国内企业追赶的決心。
从技术评测到模型开源,从多模态应用到推理能力,11月的中国AI场景呈现出前所未有的活跃和竞争态势。企业们正在以前所未有的速度缩小与国际巨头的差距,展现出令人振奋的创新潜力。
这个月的种种迹象昭示着:中国AI企业已不再满足于模仿,而是开始在全球舞台上主动发声。12月,这场竞争将进入更为激烈的阶段。
12月:创新的全面突破
如果说11月是中国AI企业加速追赶的序章,那么12月就是全面突破的关键篇章。这个月,中国AI企业在技术创新、模型开发和商业布局上展现出前所未有的进攻性。
阶跃星辰成为这个月的焦点。12月13日,公司推出国内首个千亿参数端到端语音大模型Step-1o,这款模型不仅支持语音和文本混合输入输出,更具备高智商和情商,能理解情绪信息,提供专业建议和情感陪伴。
Step-1o的推出标志着这家后来者已经完全对标OpenAI 5月发布的GPT-4o,并在语音交互领域实现重大突破。紧随其后,公司完成数亿美元B轮融资,投资方阵容包括腾讯投资、五源资本和启明创投,凸显资本市场对其技术潜力的信心。
Kimi智能助手在12月16日发布视觉思考模型k1,这是一个基于强化学习技术的突破性模型。k1支持端到端图像理解和思维链技术,覆盖数学、物理、化学等基础科学领域。在多项基准测试中,k1模型超越全球标杆模型,为Kimi在视觉思考领域插上腾飞的翅膀。
DeepSeek在12月密集推出一系列重磅模型。12月10日,V2.5最终版微调模型发布,通过Post-Training提升了数学、代码、写作等多个维度的能力。12月13日,DeepSeek-VL2正式亮相,引入动态切图策略和MoE架构,视觉能力实现大幅提升。12月26日,DeepSeek-V3横空出世,拥有671B参数,在多个领域评测中表现优异,尤其是数学和中文能力,生成速度提升至3倍。
字节跳动在这个月持续发力AI生态。12月4日,豆包AI助手新增图片理解功能,允许用户上传图片并获得内容解析。12月11日,公司提升即梦产品优先级,致力于打造”AI时代的抖音”。12月19日,更传出与苹果公司正在洽谈,计划将其AI模型整合到中国市场的iPhone中,这一消息若成真,将是跨界合作的重大突破。
智谱科技在2024年的最后一天交出了一份令人惊艳的答卷。GLM-Zero预览版不仅仅是追赶OpenAI的o1,更在推理方法上进行了创新尝试。这款基于扩展强化学习技术的模型,与o1-preview在多个评测中旗鼓相当,标志着中国AI企业正从”追随者”转变为”创新者”。
整个12月,中国AI企业似乎找到了一个微妙的平衡点:在追赶OpenAI的同时,开始建立自己的技术特色和创新路径。从语音交互到视觉思考,从多模态模型到推理技术,这些突破不仅仅是技术的迭代,更是一种全新的技术范式的探索。
当2024年的最后一天落下帷幕,中国AI企业已经站在了一个全新的起点。2025年,这场没有硝烟的全球AI竞争,将会更加扑朔迷离。
2024:追赶者的困境与突围
回望2024年,中国AI企业走过了一段充满起伏的征程。从年初就开始的追赶之旅,经历了Sora的冲击、GPT-4o的挑战,以及o1系列带来的新目标。在这场无休止的追赶中,中国企业展现出了惊人的执行力和快速迭代能力,每一次OpenAI的创新都能换来中国企业的迅速响应。
然而,这种”你出招我跟招”的模式,也暴露出了原创性突破的不足。在基础模型和产品创新上,中国企业更多扮演着”追赶者”的角色。如果说2024年有谁打破了这个循环,或许要数DeepSeek的几次原创性尝试。这家低调的公司不仅培养出了如罗福莉这样的AI奇才,更在基础研究上持续发力,展现出了不一样的创新路径。
展望2025年,中国AI企业面临着更大的挑战:如何在保持快速追赶能力的同时,培育出真正的创新土壤。字节跳动和小米在人才市场的大手笔布局,阶跃星辰对顶级科研人才的引进,智谱AI在推理技术上的创新尝试,都预示着行业正在经历转型阵痛。从”追赶”到”超越”,这条路或许还很长,但方向已经愈发清晰。
原文转自:AI范儿,原标题:《2024年中国AI都发生了什么?| 追赶与超越之路》
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...