Katanemo Plano 深度分析

概述

Plano 是面向 agentic 应用的 AI-native 代理与数据平面，目标是把“路由、编排、观测、护栏”等交付型基础能力从业务代码中抽离出来，形成统一、可复用的外置能力层。其核心定位是“交付基础设施”，通过集中化配置与可观测性，让多代理系统更易扩展与治理。Plano 采用 out-of-process 架构，并基于 Envoy 的能力构建，便于在不同语言与框架间复用。

核心概念

工作原理

请求进入数据平面：Plano 作为代理层接收请求，统一处理入口连接与基础路由（可作为边缘或内部网关使用）。
外层编排（Outer Loop）：当多 agent 可用时，Plano 使用编排层进行意图分析与 agent 选择，并管理调用顺序与策略。
过滤链处理：通过 Filter Chains 统一应用护栏、内容策略、上下文补全或重写等治理逻辑。
模型路由：按模型名/别名/偏好策略进行路由，支持多模型切换与弹性策略。
可观测性与信号：通过 OpenTelemetry 记录跨组件的 trace、指标与信号，提供端到端诊断能力。

示例

示例场景： 统一管理多个 agent + 多模型路由

入口流量进入 Plano
外层编排选择 weather_agent 或 flight_agent
Filter Chain 做输入校验与内容策略
LLM 路由策略将请求分配到成本/质量最合适的模型
Trace 记录全链路（入口 → 编排 → 过滤 → agent → LLM）

公开案例与线索

官方 Quickstart 提供 travel assistant（flight_agent + hotel_agent）的多代理编排示例：
https://docs.planoai.dev/get_started/quickstart
官方博客给出 weather_agent + flight_agent 的 travel_assistant 配置示例，用于说明 Outer Loop 与过滤链：
https://planoai.dev/blog/the-two-agentic-loops-how-to-design-and-scale-agentic-apps
当前尚未看到官方发布的真实客户/应用案例列表，更多信息需要后续跟踪或等待官方披露。

最佳实践

先启用基础路由 + 观测，再逐步引入过滤链与高级策略
用配置而不是代码固化路由策略，避免各 agent 内重复逻辑
在关键节点补齐 trace，确保跨服务可定位性能与质量问题
将护栏策略集中化管理，减少治理成本

常见陷阱

过早引入复杂策略导致配置膨胀，难以维护
只做路由但不做观测，导致问题无法定位
过滤链缺少版本管理/回滚机制
让 agent 自己处理策略与路由，违背数据平面设计初衷

参考资源

官网：Plano - Delivery Infrastructure for Agentic Apps
https://planoai.dev/
Docs - Intro to Plano
https://docs.planoai.dev/get_started/intro_to_plano.html
Docs - LLM Routing
https://docs.planoai.dev/guides/llm_router.html
Docs - Observability / Tracing
https://docs.planoai.dev/guides/observability/tracing.html
Docs - Guardrails (Filter Chains)
https://docs.planoai.dev/guides/prompt_guard.html
Docs - Quickstart
https://docs.planoai.dev/get_started/quickstart