什么是TwelveLabs?
TwelveLabs 是一个面向视频的原生智能平台,专为需要从海量视频中提取真实含义的组织打造。它不依赖人工标签或简单的抽帧采样,而是对视频的完整时间轴——画面、音频和语言——进行联合处理,让每一个瞬间都可搜索、可分析、可落地执行。平台核心是两款自研模型:用于搜索与发现的多模态嵌入模型 Marengo,以及用于深度分析与文本生成的视频语言模型 Pegasus。可通过 API、SDK 和 MCP 接入,并支持公有云、私有云或本地化部署。
主要功能
多模态视频搜索
使用自然语言在整个视频库中搜索,覆盖画面、音频、对话乃至人物情绪,无需人工打标签。由 Marengo 驱动,在 47 种语言上实现 78.5% 的综合准确率。
深度视频分析(Pegasus)
Pegasus 能够对长达两小时的视频进行全时间线连续推理,追踪实体、因果关系与叙事脉络,自动生成摘要、章节、问答、元数据与事件报告。
高速索引基础设施
通过统一的多模态管线以约 60 倍实时速度摄取和索引视频——一小时视频可在一分钟内完成索引,每日处理能力超过 10,000 小时。
内容分段与精彩片段生成
自动识别长视频中的场景切换、节奏变化和自然断点,并根据描述性提示词生成定向的高光集锦或短片。
合规性与品牌安全监控
大规模识别敏感内容、违规行为和品牌安全风险,并提供可解释的输出结果,从而加速内容审核流程并提升审核可信度。
灵活部署与自定义模型训练
支持公有云、私有云和本地化部署。可基于专有数据对模型进行微调,打造贴合企业场景的领域化视频智能。
1. TwelveLabs 与 Gemini、GPT-4V 等通用 AI 模型有何不同?⌄
TwelveLabs 是视频原生的——它会对视频完整的时间轴进行推理,而不只是采样几帧。这意味着它能够捕捉到抽帧模型所遗漏的动作、因果关系与叙事连贯性。
2. Marengo 和 Pegasus 是什么?⌄
Marengo 是 TwelveLabs 的多模态嵌入模型,用于在视频、音频和图像中进行搜索与发现。Pegasus 是其视频语言模型,用于深度分析,可生成摘要、章节、元数据与报告。
3. TwelveLabs 索引视频内容的速度有多快?⌄
该平台可在一分钟内索引一小时的视频,每天处理超过 10,000 小时,速度约为实时的 60 倍。
4. TwelveLabs 除了英文外还支持其他语言吗?⌄
支持。Marengo 在多模态搜索与分析中支持 47 种语言。
5. 如何将 TwelveLabs 集成到我的产品中?⌄
TwelveLabs 提供 REST API、Python 与 Node SDK,以及 MCP 服务器。完整文档和示例应用可在开发者门户中获取。
6. TwelveLabs 的模型能否基于我自己的数据进行训练?⌄
可以。您可以基于自有视频数据对模型进行微调,打造领域专属的智能能力——适用于体育、安防、法律或任何垂直行业。
7. TwelveLabs 可以部署在哪些环境中?⌄
支持公有云、私有云和本地化部署。平台通过 SOC 2 Type II 认证,并对数据进行加密处理。
