Fireworks AI公司概况
Fireworks AI是一家成立于2022年的美国生成式AI初创公司,专注于为企业和开发者提供大模型微调、推理、部署等服务。其创始团队成员多来自Meta、Google等大厂,创始人兼CEO乔琳毕业于复旦大学,是加利福利亚大学圣巴巴拉分校的计算机科学博士,曾担任Meta PyTorch的负责人,在LinkedIn及IBM也有过技术工作经验。团队凭借在Meta多年积累的经验和技术实力,致力于帮助企业快速实现AI转型。Fireworks AI开发了定制FireAttention推理引擎,与开源的vLLM相比,推理时间缩短12倍,降低使用成本,获得了众多资本青睐,2024年B轮融资后估值达5.52亿美元。
核心业务与技术
- 大模型服务:提供超过100种先进的文本、图像、音频和多模态大模型,涵盖大型语言模型、图像生成模型、音频生成模型、视频生成模型、嵌入式模型等,在延迟、吞吐量和成本方面进行了大幅度优化。
- 模型微调:通过超快的LoRA微调技术,帮助开发者快速定制模型,从数据集准备到查询微调模型仅需几分钟,微调后的模型可无缝部署到现有业务流程中。
- 推理优化:实现语义缓存,避免重复计算,专门捕获应用程序工作负载模式并构建到推理堆栈中,能够自动调整以适应开发者或企业工作负载。
- 成本与效率:与传统方法相比,推理时间减少12倍,与GPT-4相比减少40倍;每天处理1400亿tokens数据,API正常运行时间达99.99%;RAG速度比Groq高9倍,SDXL图像生成速度比其他提供商平均水平高6倍,推测解码速度达1000个令牌/秒;与开源原始模型相比,成本降低五倍,进一步微调情况下降低三十倍。
市场表现与客户
- 融资情况:2024年7月完成5200万美元B轮融资,由红杉资本领投,英伟达、AMD、MongoDB等参投,估值达5.52亿美元,融资总额达7700万美元。
- 客户群体:包括Cresta、Cursor、Liner、DoorDash、Quora、Upwork等企业,以及Cursor、Superhuman等个别客户,根据具体用例定制量化方案。
团队与背景
- 创始人背景:创始人兼CEO乔琳毕业于复旦大学,是加利福利亚大学圣巴巴拉分校的计算机科学博士,曾是Meta PyTorch的负责人,在LinkedIn及IBM有过技术工作经验。团队成员大多来自Meta、Google等大厂,华人成员超1/3。
- 技术积累:团队凭借在Meta多年积累的经验和技术实力,致力于帮助企业快速实现AI转型。
未来愿景
- 构建全面知识访问API:致力于创建一个功能强大的API,精确调用不同模型和API,实现对全部知识的访问。
- 扩大团队与合作伙伴关系:计划利用新资金扩大团队,并计划扩大与人工智能公司的合作伙伴关系,推动行业向复合AI系统转变。