什么是Arcee AI?
Arcee AI是一家美国模型实验室,专注于构建针对每参数性能而非原始规模优化的开放权重基础模型。其旗舰Trinity模型家族——涵盖Nano、Mini和Large变体——在从边缘硬件到云基础设施的各种设备尺寸上提供一致的能力。所有模型都在Apache-2.0许可下发布,支持多轮对话、工具使用和结构化输出。Arcee还提供SLM适配系统,使企业能够完全在自己的虚拟私有云(VPC)内训练、微调和部署更小的、特定领域的语言模型,确保完全的数据所有权且无第三方暴露。
主要功能
Trinity模型家族
一系列开放权重的MoE模型(Nano 6B、Mini 26B、Large 400B),具有一致的能力——工具使用、结构化输出和多轮对话连贯性——使工作负载能够在边缘和云端之间无缝迁移,无需重新设计提示。
完全VPC部署
所有训练和推理完全在客户自己的云环境中运行。数据永远不会离开客户的基础设施,生成的模型完全归客户所有。
SLM适配系统
端到端流水线,涵盖领域自适应预训练、对齐和检索增强生成——将通用开源基础模型转化为专业的、生产就绪的SLM,成本仅为从头训练的一小部分。
长上下文和Agent可靠性
Trinity模型支持高达512K token的上下文窗口,采用稀疏MoE注意力机制,实现准确的函数选择、符合模式的JSON输出,以及在扩展会话中连贯的多步Agent工作流。
灵活的部署选项
模型可通过托管的OpenAI兼容API、Hugging Face上的可下载开放权重,或企业专用部署获得——兼容vLLM、SGLang、llama.cpp等。
1. 什么是Arcee AI?⌄
Arcee AI是一家美国模型实验室,构建针对效率和可部署性优化的开放权重语言模型。其Trinity模型家族和SLM适配系统让公司能够在自己的基础设施上运行强大的语言模型,而无需依赖闭源提供商。
2. 什么是Trinity模型家族?⌄
Trinity是Arcee的旗舰开放权重MoE模型系列,有三种规格——Nano(6B)、Mini(26B)和Large(400B)。所有变体都具有相同的能力(工具使用、结构化输出、多轮对话连贯性),并在Apache-2.0许可下发布。
3. 我拥有使用Arcee构建的模型吗?⌄
是的。模型完全在您自己的VPC内训练和部署。您拥有完全所有权——Arcee永远不会保留对您的数据或生成模型的访问权限。
4. Arcee是否从头训练模型?⌄
默认情况下不是。Arcee使用领域自适应持续预训练——从强大的开源基础模型(如Mistral或Llama)开始,注入您的领域数据。这以远低于完全预训练的成本产生更强大的专业模型。
5. 为什么使用小型语言模型而不是大型模型?⌄
更小的专业模型更快、服务成本更低、更容易拥有。它们在特定领域任务上优于通用LLM,并消除了对可能失败、限流或暴露您数据的第三方API的依赖。
6. 如何开始使用Trinity?⌄
三种选择:使用托管API(OpenAI兼容)、从Hugging Face下载开放权重,或联系Arcee进行企业部署。免费API密钥可立即开始使用。
7. Arcee支持哪些云提供商?⌄
完全支持AWS。对其他云提供商的支持在路线图中——如果您在其他平台上有特定用例,请联系Arcee。
