公司概况
Etched是一家成立于2022年的美国AI芯片初创公司,总部位于加利福尼亚州圣何塞,由三位哈佛大学辍学生(Gavin Uberti、Chris Zhu、Robert Wachen)联合创立。公司核心团队汇聚了芯片设计、AI算法和硬件工程领域的顶尖人才,包括前Cypress Semiconductor CTO Mark Ross、英伟达22年老将Brian Loiler等。截至2026年1月,Etched已完成累计近10亿美元融资,估值达50亿美元,投资方包括Peter Thiel、Stripes Group等知名机构。
产品与服务
核心产品:Sohu芯片
Sohu是Etched推出的全球首款专为Transformer架构优化的ASIC(专用集成电路)芯片,主要面向AI大模型推理场景。其核心参数如下:
- 制程工艺:台积电4nm
- 算力:FP16精度下达2000 TFLOPS(单卡性能相当于20张英伟达H100 GPU)
- 内存带宽:144GB HBM3e显存,支持高吞吐量数据传输
- 能效比:功耗仅10瓦,运行GPT-3等模型时吞吐量是H100的20倍,功耗仅增加35%
- 应用场景:自然语言处理、智能客服、代码生成、实时视频生成等需要低延迟的AI任务
核心技术
- 硬件级Transformer优化
- Sohu通过定制化架构将Transformer的注意力机制、矩阵乘法等核心运算硬化到芯片中,避免了传统GPU在处理这些任务时的并行计算瓶颈。
- 芯片仅支持Transformer模型,舍弃了图形渲染单元(GPU)和CNN/RNN等传统AI模型的支持,从而大幅简化设计,提升硬件利用率至90%(通用GPU平均仅30%)。
- 创新内存与计算架构
- 采用分层内存设计,结合HBM3e显存和本地缓存,减少数据搬运延迟。
- 通过创新的内存带宽分配方案,在批量处理128个并发请求时,延迟降低至H100的1/8。
- 软件生态协同
- 自研编程框架支持ONNX等开放模型格式,降低开发者迁移成本。
- 与云服务商合作提供算力租赁服务,用户可通过云端直接使用Sohu芯片。
市场竞争力
- 性能碾压通用GPU
- 实测数据显示,Sohu在运行Llama 70B模型时,每秒可处理超过50万个token,是英伟达H100的20倍、Blackwell B200的10倍。
- 一台搭载8张Sohu芯片的服务器可替代160张H100 GPU,硬件采购成本降低60%,能效比提升1个数量级。
- 精准定位垂直市场
- 专注于Transformer模型推理,避开与英伟达在通用GPU领域的正面竞争,形成差异化优势。
- 目标客户包括AI大模型公司、云服务商、自动驾驶企业等对推理性能和成本敏感的场景。
- 生态挑战与应对
- CUDA生态壁垒:当前95%的AI开发市场基于英伟达CUDA框架,Etched需重建开发者社区。
- 供应链风险:依赖台积电4nm制程,需应对全球芯片产能分配和地缘政治风险。
- 应对策略:通过开放硬件接口、支持ONNX格式、提供云服务等方式降低用户迁移成本。
发展前景
- 行业趋势红利
- AI模型参数规模持续扩大(如GPT-4达到1.8万亿参数),推理成本占AI总成本的比重将超过70%,专用芯片需求激增。
- 多模态大模型(如文本、图像、视频融合)的发展将推动AI芯片向场景专用化演进,Sohu的技术路线符合这一趋势。
- 商业化落地加速
- 已获得“数千万美元”硬件预购订单,并与Decart合作推出AI生成游戏《Oasis》,验证了芯片在实时渲染场景的实用性。
- 计划通过Sohu Developer Cloud提供在线算力服务,拓展收入来源。
- 长期战略布局
- 未来计划扩展至图像生成、蛋白质折叠模拟等领域,为不同AI模型开发专用芯片。
- 目标成为AI硬件领域的“垂直巨头”,与英伟达通用GPU形成互补市场格局。
Etched凭借其专用化芯片设计、显著的性能与成本优势,在AI芯片领域展现出强大竞争力。尽管面临生态构建与量产挑战,但在AI模型架构趋同、算力需求激增的背景下,公司有望成为专用AI芯片市场的领导者,并推动行业向场景专用化方向演进。其发展路径为AI硬件创新提供了新范式,即通过垂直领域突破实现与通用GPU的互补共存。