什么是Layercode?
Layercode是一个云基础设施平台,使开发者能够构建生产就绪的语音AI Agent,而无需管理实时音频系统的复杂性。它处理完整的语音管道——包括语音转文本、文本转语音、对话轮换和音频流——并通过简单的webhook连接到您自己的后端逻辑。开发者完全控制其LLM、Agent逻辑和工具调用,而Layercode通过覆盖330多个位置的全球边缘网络提供语音层,实现低于50毫秒的音频处理。它支持跨Web、移动端和电话渠道的部署,采用基于使用量的定价,仅对活跃通话时间收费。
主要功能
托管语音管道
处理完整的实时音频技术栈——语音转文本、文本转语音、对话轮换和低延迟音频流——开发者只需专注于Agent逻辑。
基于Webhook的后端集成
通过单个webhook连接任何LLM、Agent框架或自定义后端逻辑。不绑定特定技术栈——可在任何地方部署后端。
全球边缘网络
音频在全球330多个边缘节点处理,为服务任何地区用户的语音Agent提供低于50毫秒的延迟。
多提供商语音模型支持
支持包括Deepgram、ElevenLabs、Cartesia和Rime在内的领先STT和TTS提供商,可在不更改代码的情况下热切换提供商。
CLI和SDK工具
单个CLI命令即可搭建完整的语音Agent项目,内置隧道、示例后端和仪表板配置。提供Node.js、Python、React和原生JS的SDK。
会话录制和分析
内置延迟分析、会话录制、对话回放和转录导出,用于调试、质量保证和性能监控。
1. Layercode实际处理什么,我需要自己构建什么?⌄
Layercode处理整个语音基础设施:音频流、语音转文本、文本转语音和对话轮换。您构建并拥有Agent逻辑——LLM调用、提示和工具定义——并通过webhook公开。
2. 我需要使用特定的LLM或Agent框架吗?⌄
不需要。Layercode与LLM无关。您可以使用OpenAI、Anthropic或任何其他模型,并与LangChain等框架或完全自定义的后端集成。
3. 如何开始使用?⌄
在终端中运行 npx @layercode/cli init。它会搭建项目、设置本地隧道,并在几分钟内连接到Layercode的仪表板。
4. Layercode如何定价?⌄
基于使用量计费,仅按活跃语音的秒数收费。静音时间不收费。
5. Layercode支持哪些语音提供商?⌄
对于STT,目前支持Deepgram(包括Flux),更多提供商即将推出。对于TTS,提供ElevenLabs、Cartesia和Rime。您可以使用自己的API密钥或使用Layercode托管的凭据。
6. 我可以将语音Agent部署到电话号码吗?⌄
可以。Layercode支持Web、移动端和电话渠道,因此您可以直接将电话号码连接到语音Agent。
7. Layercode如何在全球范围内实现低延迟?⌄
其云服务运行在330多个边缘节点上,无论终端用户的地理位置如何,都能在约50毫秒内处理音频。
