Katanemo Plano 深度分析
概述
Plano 是面向 agentic 应用的 AI-native 代理与数据平面,目标是把“路由、编排、观测、护栏”等交付型基础能力从业务代码中抽离出来,形成统一、可复用的外置能力层。其核心定位是“交付基础设施”,通过集中化配置与可观测性,让多代理系统更易扩展与治理。Plano 采用 out-of-process 架构,并基于 Envoy 的能力构建,便于在不同语言与框架间复用。
核心概念
工作原理
- 请求进入数据平面:Plano 作为代理层接收请求,统一处理入口连接与基础路由(可作为边缘或内部网关使用)。
- 外层编排(Outer Loop):当多 agent 可用时,Plano 使用编排层进行意图分析与 agent 选择,并管理调用顺序与策略。
- 过滤链处理:通过 Filter Chains 统一应用护栏、内容策略、上下文补全或重写等治理逻辑。
- 模型路由:按模型名/别名/偏好策略进行路由,支持多模型切换与弹性策略。
- 可观测性与信号:通过 OpenTelemetry 记录跨组件的 trace、指标与信号,提供端到端诊断能力。
示例
示例场景: 统一管理多个 agent + 多模型路由
- 入口流量进入 Plano
- 外层编排选择 weather_agent 或 flight_agent
- Filter Chain 做输入校验与内容策略
- LLM 路由策略将请求分配到成本/质量最合适的模型
- Trace 记录全链路(入口 → 编排 → 过滤 → agent → LLM)
公开案例与线索
- 官方 Quickstart 提供 travel assistant(flight_agent + hotel_agent)的多代理编排示例:
https://docs.planoai.dev/get_started/quickstart - 官方博客给出 weather_agent + flight_agent 的 travel_assistant 配置示例,用于说明 Outer Loop 与过滤链:
https://planoai.dev/blog/the-two-agentic-loops-how-to-design-and-scale-agentic-apps - 当前尚未看到官方发布的真实客户/应用案例列表,更多信息需要后续跟踪或等待官方披露。
最佳实践
- 先启用基础路由 + 观测,再逐步引入过滤链与高级策略
- 用配置而不是代码固化路由策略,避免各 agent 内重复逻辑
- 在关键节点补齐 trace,确保跨服务可定位性能与质量问题
- 将护栏策略集中化管理,减少治理成本
常见陷阱
- 过早引入复杂策略导致配置膨胀,难以维护
- 只做路由但不做观测,导致问题无法定位
- 过滤链缺少版本管理/回滚机制
- 让 agent 自己处理策略与路由,违背数据平面设计初衷
参考资源
- 官网:Plano - Delivery Infrastructure for Agentic Apps
https://planoai.dev/ - Docs - Intro to Plano
https://docs.planoai.dev/get_started/intro_to_plano.html - Docs - LLM Routing
https://docs.planoai.dev/guides/llm_router.html - Docs - Observability / Tracing
https://docs.planoai.dev/guides/observability/tracing.html - Docs - Guardrails (Filter Chains)
https://docs.planoai.dev/guides/prompt_guard.html - Docs - Quickstart
https://docs.planoai.dev/get_started/quickstart