可观测与计费/用量分析

追踪 Token 消耗、请求量、提供商性能和模型效率,用于优化决策。

用量分析

UniGateway 提供全面的用量分析功能,帮助你实时监控和分析 API 调用、服务提供商性能及模型效率。通过用量分析,你可以深入了解 Token 消耗、API 请求量和响应时间等关键指标——从而优化应用性能并控制成本。

用量概览

Usage 选项卡中,你可以查看整体资源消耗,包括 Token 用量和 API 请求次数。

筛选选项:

筛选器说明
时间范围按月、周或日粒度筛选数据
API Key按特定 API Key 筛选(所有 Key 或单个 Key)
模型选择所有模型或指定特定模型进行分析

关键指标

指标说明
Total Token Usage所有模型的总 Token 用量(输入 + 输出)
Input Token Usage所有请求的输入 Token 总数
Output Token Usage所有响应的输出 Token 总数
Total API Requests指定时间段内的 API 调用总数

多维度分析

按模型的用量

以图表或表格形式查看不同模型的 Token 用量分布,识别高消耗模型。

此视图可用于:

  • 识别哪些模型消耗最多 Token
  • 比较各模型的输入/输出 Token 比率
  • 评估高消耗模型是否提供了相应的价值

按 Token 类型的用量

分别跟踪输入和输出 Token 用量,便于评估请求和响应的成本结构。

Token 类型说明
输入 Token提示词中发送的总 Token(包括系统、用户和助手消息)
输出 Token模型生成响应中的总 Token
缓存读取 Token从缓存提供的 Token(成本更低)
缓存写入 Token写入缓存以供后续复用的 Token

按 API Key 的用量

查看不同 API Key 的 Token 和请求用量,适用于多用户或多项目场景下的用量隔离和审计。

网页搜索用量

查看启用网页搜索的请求的 Token 消耗和调用次数,评估增强检索功能的使用频率和成本。

提供商分析

切换到 Provider 选项卡,查看不同 AI 服务提供商的性能表现。

关键指标

指标说明
Primary Provider当前使用的主要 AI 服务提供商
Provider Count使用的服务提供商总数
Average Success Rate所有请求的平均成功率,反映服务可靠性
Fastest Response Provider响应时间最短的服务提供商

分析维度

维度说明
按提供商的 Token 分布各提供商的 Token 用量分布,评估资源分配效率
按提供商的请求分布各提供商的 API 请求次数分布,反映各提供商的调用负载

性能分析

Performance 选项卡中,查看 API 调用的性能指标,评估模型响应效率和服务质量。

关键指标

指标说明
Average Latency平均响应延迟(毫秒);越低表示响应越快
Average Throughput平均吞吐量(每秒 Token 数),反映单位时间的处理能力
Fastest / Slowest Model最快和最慢的模型响应记录,帮助识别性能瓶颈
Highest / Lowest Throughput吞吐量最高和最低的模型,辅助负载均衡优化

按模型的首次 Token 延迟

查看不同模型生成第一个 Token 的延迟。

首次 Token 延迟是关键的用户体验指标;越低表示响应越灵敏。这对流式应用尤为重要。

按模型的吞吐量

查看不同模型的吞吐量(每秒 Token 数)。值越高表示性能越好。

此视图可用于:

  • 在给定时间范围内比较各模型的处理效率
  • 选择高吞吐量模型提升整体系统响应速度
  • 识别吞吐量异常低的模型进行调查

利用分析数据优化

降低延迟

  1. Performance 选项卡中识别高延迟模型
  2. 考虑切换到更快的模型变体(如 gpt-5.4-nano 替代 gpt-5.4
  3. 为交互式应用启用流式输出——参见流式输出

提升吞吐量

  1. 在 Performance 选项卡中识别低吞吐量模型
  2. 尽可能减少提示词长度以降低处理时间

平衡成本与性能

  1. 使用 Usage 选项卡识别高消耗模型
  2. 与 Cost 选项卡交叉参考,了解支出效率

常见问题

Q:用量数据多久更新一次? A:用量数据近实时更新。高流量期间可能会有短暂延迟。

Q:可以导出用量数据吗? A:可以。在用量分析页面使用导出按钮,将选定时间范围的数据下载为 CSV。

Q:如何按 API Key 追踪用量用于团队计费? A:为每个团队或项目创建单独的 API Key,然后在用量分析页面按 API Key 筛选。参见账户与 API Key了解 Key 管理最佳实践。