可观测与计费/成本分析

按模型、API Key、提供商和计费项目类型监控和分析 API 费用,提供优化策略。

成本分析

UniGateway 提供成本分析功能,帮助你实时监控和分析 API 使用费用。通过成本分析页面,你可以按模型、API Key、服务提供商等维度查看详细的费用分布——从而优化使用策略并控制开支。

成本概览

在成本分析页面顶部,关键费用指标卡片提供当前时间段整体支出的快速概览。

筛选选项:

筛选器说明
时间粒度按月、日或小时查看数据
时间范围默认显示 UTC 时间最近期间;可手动选择特定日期或范围
API Key按特定 API Key 筛选费用
模型分析所有模型或指定特定模型(如 gpt-5.4

关键指标

指标说明
Total Cost总支出金额,包括所有输入、输出及其他相关费用
Input Cost输入 Token 产生的费用
Output Cost输出 Token 产生的费用
Other Cost其他非 Token 相关费用(如延迟补偿、系统资源消耗等)
Average Cost Per Request每请求平均费用
Average Cost Per Million Tokens每百万 Token 平均费用

多维度分析

按模型的成本

以图表形式查看各模型的消费分布,识别主要成本驱动模型。

提示:定期查看此部分,调整高成本、低效率模型的使用频率。

按类型的成本明细

查看不同类型的费用分配:

类型说明
Input tokens处理输入提示词的费用
Output tokens模型生成输出的费用
Other tokens附加费用(如网页搜索、图像处理)

按 API Key 的成本

查看每个 API Key 的消费金额,便于团队多账户场景下的费用归属。

按提供商的成本

切换到 Provider 选项卡,查看每个服务提供商的详细费用明细:

视图说明
按提供商费用不同提供商的总支出(如 OpenAI、Anthropic、Google)
提供商详情该提供商下所有模型的调用详情——模型名称、调用次数、输入/输出 Token 数、单次费用和总费用

成本优化策略

1. 使用 Prompt 缓存

对于具有一致前缀的重复提示词,Prompt 缓存可显著降低输入 Token 成本:

策略节省
使用一致的系统提示词缓存读取比完整提示词处理更便宜
保持对话前缀稳定缓存在相关请求间持续有效
选择合适的缓存 TTL5 分钟适用于短会话,1 小时适用于长时间运行的工作流

2. 设置预算告警

在控制台中配置支出告警,当费用超过阈值时接收通知。

3. 监控高成本模式

定期查看按模型和按 API Key 的费用视图,尽早发现异常支出模式。

常见问题

Q:费用数据多久更新一次? A:费用数据近实时更新。高流量期间可能会有短暂延迟。

Q:可以设置支出上限吗? A:可以。在控制台中配置预算告警,当支出达到指定阈值时接收通知。

Q:如何了解单次调用的计费详情? A:在请求日志中将鼠标悬停在 Cost 列上查看计费详情弹窗,或查看任意调用的详细费率明细。