公司概况
Scale AI 是一家总部位于美国旧金山的人工智能公司,成立于 2016 年,专注于为企业和科研机构提供高质量的数据标注、清洗和管理服务,以支持机器学习模型的训练与优化。
公司由前 MIT 学生 Alexandr Wang 和前 Carnegie Mellon 学生 Lucy Guo 联合创立。Wang 在 MIT 学习计算机科学时,意识到人工智能和机器学习将会改变世界,随后他辍学,专注于创业。Guo 则是 Thiel Fellowship 的获得者。
Scale AI 的核心产品包括 Scale Data Engine、Scale Nucleus 和 Scale GenAI Platform,涵盖图像、视频、文本和 LiDAR 数据标注与审核,帮助企业高效构建大规模训练数据集。公司客户涵盖 OpenAI、Meta、Amazon、Google 等科技巨头,以及美国国防部等政府机构,体现其在数据服务领域的领先地位。
在 2025 年 6 月,Meta Platforms 以 14.3 亿美元收购了 Scale AI 49% 的股份,反映出市场对其在 AI 数据基础设施领域的高度认可。然而,Google 宣布将与 Scale AI 断绝合作关系,原因是 Meta 的收购引发了对数据安全和竞争的担忧。
尽管面临挑战,Scale AI 计划继续扩展其产品和服务,提升 AI 模型的训练和评估效率,推动人工智能技术的普及和应用。
核心业务与产品
- Scale Data Engine:这是 Scale AI 的旗舰产品,提供高质量的数据标注、收集和管理服务,支持文本、图像、视频、3D LiDAR 等多种数据类型。该平台结合人工智能与人工监督,确保数据质量,适用于从低量实验到大规模生产项目的各种机器学习任务。
- Scale Nucleus:这是一个数据可视化和分析平台,帮助开发人员更有效地理解和管理数据集,解决数据质量问题,修复模型失败模式,加速模型开发过程。
- Scale GenAI Platform (SGP):该平台使 AI 团队能够构建、评估和控制智能解决方案,处理企业数据,执行操作,并通过人机交互持续改进。它支持生成式 AI 应用的开发,帮助企业构建智能代理系统。
- Scale Evaluation:这是一个用于测试大型语言模型(LLMs)的平台,通过基准测试识别模型的弱点,并指出需要额外训练数据的领域,支持模型的评估和优化。
核心优势
- 高质量数据标注:Scale AI 结合人工智能与人工监督,确保数据标注的高质量,适用于敏感领域,如医疗保健和自动驾驶。
- 多模态支持:支持文本、图像、视频、3D LiDAR 等多种数据类型,满足不同 AI 应用的需求。
- 可扩展性:Scale 的平台支持从低量实验到大规模生产项目的各种机器学习任务,具有良好的可扩展性。
- 企业级整合能力:Scale 的平台能够与企业现有的机器学习数据管道集成,提供灵活的工作流选项,满足不同企业的需求。
目标用户
- 生成式 AI 公司:如 OpenAI、Meta、Cohere 和 Adept,依赖高质量的标注数据来训练和优化其大型语言模型。
- 企业客户:涵盖医疗、金融、汽车、零售等行业,利用 Scale AI 的数据平台进行模型微调、文档处理和自动化工作流构建。
- 政府机构:如美国国防部,使用 Scale AI 的数据服务进行安全性验证和关键任务系统的训练。
- 研究机构:例如哈佛医学院的 Datta 实验室,利用 Scale AI 的数据平台加速研究进展。
发展前景
Scale AI 正在从传统的数据标注服务商,转型为企业级生成式 AI 基础设施的关键提供商。
- 收入增长:预计 2025 年收入将达到 20 亿美元,较 2024 年的 8.7 亿美元增长超过 130%。
- 战略投资:Meta 于 2025 年 6 月以 143 亿美元投资 Scale AI,获得公司 49% 的非投票股份,进一步巩固其在 AI 生态系统中的地位。
- 市场定位:Scale AI 的全栈 GenAI 平台和数据引擎(Scale Data Engine)使其在企业级 AI 应用中占据重要位置,支持从模型训练到推理的全过程。