用量分析
UniGateway 提供全面的用量分析功能,帮助你实时监控和分析 API 调用、服务提供商性能及模型效率。通过用量分析,你可以深入了解 Token 消耗、API 请求量和响应时间等关键指标——从而优化应用性能并控制成本。
用量概览
在 Usage 选项卡中,你可以查看整体资源消耗,包括 Token 用量和 API 请求次数。
筛选选项:
| 筛选器 | 说明 |
|---|---|
| 时间范围 | 按月、周或日粒度筛选数据 |
| API Key | 按特定 API Key 筛选(所有 Key 或单个 Key) |
| 模型 | 选择所有模型或指定特定模型进行分析 |
关键指标
| 指标 | 说明 |
|---|---|
| Total Token Usage | 所有模型的总 Token 用量(输入 + 输出) |
| Input Token Usage | 所有请求的输入 Token 总数 |
| Output Token Usage | 所有响应的输出 Token 总数 |
| Total API Requests | 指定时间段内的 API 调用总数 |
多维度分析
按模型的用量
以图表或表格形式查看不同模型的 Token 用量分布,识别高消耗模型。
此视图可用于:
- 识别哪些模型消耗最多 Token
- 比较各模型的输入/输出 Token 比率
- 评估高消耗模型是否提供了相应的价值
按 Token 类型的用量
分别跟踪输入和输出 Token 用量,便于评估请求和响应的成本结构。
| Token 类型 | 说明 |
|---|---|
| 输入 Token | 提示词中发送的总 Token(包括系统、用户和助手消息) |
| 输出 Token | 模型生成响应中的总 Token |
| 缓存读取 Token | 从缓存提供的 Token(成本更低) |
| 缓存写入 Token | 写入缓存以供后续复用的 Token |
按 API Key 的用量
查看不同 API Key 的 Token 和请求用量,适用于多用户或多项目场景下的用量隔离和审计。
网页搜索用量
查看启用网页搜索的请求的 Token 消耗和调用次数,评估增强检索功能的使用频率和成本。
提供商分析
切换到 Provider 选项卡,查看不同 AI 服务提供商的性能表现。
关键指标
| 指标 | 说明 |
|---|---|
| Primary Provider | 当前使用的主要 AI 服务提供商 |
| Provider Count | 使用的服务提供商总数 |
| Average Success Rate | 所有请求的平均成功率,反映服务可靠性 |
| Fastest Response Provider | 响应时间最短的服务提供商 |
分析维度
| 维度 | 说明 |
|---|---|
| 按提供商的 Token 分布 | 各提供商的 Token 用量分布,评估资源分配效率 |
| 按提供商的请求分布 | 各提供商的 API 请求次数分布,反映各提供商的调用负载 |
性能分析
在 Performance 选项卡中,查看 API 调用的性能指标,评估模型响应效率和服务质量。
关键指标
| 指标 | 说明 |
|---|---|
| Average Latency | 平均响应延迟(毫秒);越低表示响应越快 |
| Average Throughput | 平均吞吐量(每秒 Token 数),反映单位时间的处理能力 |
| Fastest / Slowest Model | 最快和最慢的模型响应记录,帮助识别性能瓶颈 |
| Highest / Lowest Throughput | 吞吐量最高和最低的模型,辅助负载均衡优化 |
按模型的首次 Token 延迟
查看不同模型生成第一个 Token 的延迟。
首次 Token 延迟是关键的用户体验指标;越低表示响应越灵敏。这对流式应用尤为重要。
按模型的吞吐量
查看不同模型的吞吐量(每秒 Token 数)。值越高表示性能越好。
此视图可用于:
- 在给定时间范围内比较各模型的处理效率
- 选择高吞吐量模型提升整体系统响应速度
- 识别吞吐量异常低的模型进行调查
利用分析数据优化
降低延迟
- 在 Performance 选项卡中识别高延迟模型
- 考虑切换到更快的模型变体(如
gpt-5.4-nano替代gpt-5.4) - 为交互式应用启用流式输出——参见流式输出
提升吞吐量
- 在 Performance 选项卡中识别低吞吐量模型
- 尽可能减少提示词长度以降低处理时间
平衡成本与性能
- 使用 Usage 选项卡识别高消耗模型
- 与 Cost 选项卡交叉参考,了解支出效率
常见问题
Q:用量数据多久更新一次? A:用量数据近实时更新。高流量期间可能会有短暂延迟。
Q:可以导出用量数据吗? A:可以。在用量分析页面使用导出按钮,将选定时间范围的数据下载为 CSV。
Q:如何按 API Key 追踪用量用于团队计费? A:为每个团队或项目创建单独的 API Key,然后在用量分析页面按 API Key 筛选。参见账户与 API Key了解 Key 管理最佳实践。