成本分析
UniGateway 提供成本分析功能,帮助你实时监控和分析 API 使用费用。通过成本分析页面,你可以按模型、API Key、服务提供商等维度查看详细的费用分布——从而优化使用策略并控制开支。
成本概览
在成本分析页面顶部,关键费用指标卡片提供当前时间段整体支出的快速概览。
筛选选项:
| 筛选器 | 说明 |
|---|---|
| 时间粒度 | 按月、日或小时查看数据 |
| 时间范围 | 默认显示 UTC 时间最近期间;可手动选择特定日期或范围 |
| API Key | 按特定 API Key 筛选费用 |
| 模型 | 分析所有模型或指定特定模型(如 gpt-5.4) |
关键指标
| 指标 | 说明 |
|---|---|
| Total Cost | 总支出金额,包括所有输入、输出及其他相关费用 |
| Input Cost | 输入 Token 产生的费用 |
| Output Cost | 输出 Token 产生的费用 |
| Other Cost | 其他非 Token 相关费用(如延迟补偿、系统资源消耗等) |
| Average Cost Per Request | 每请求平均费用 |
| Average Cost Per Million Tokens | 每百万 Token 平均费用 |
多维度分析
按模型的成本
以图表形式查看各模型的消费分布,识别主要成本驱动模型。
提示:定期查看此部分,调整高成本、低效率模型的使用频率。
按类型的成本明细
查看不同类型的费用分配:
| 类型 | 说明 |
|---|---|
| Input tokens | 处理输入提示词的费用 |
| Output tokens | 模型生成输出的费用 |
| Other tokens | 附加费用(如网页搜索、图像处理) |
按 API Key 的成本
查看每个 API Key 的消费金额,便于团队多账户场景下的费用归属。
按提供商的成本
切换到 Provider 选项卡,查看每个服务提供商的详细费用明细:
| 视图 | 说明 |
|---|---|
| 按提供商费用 | 不同提供商的总支出(如 OpenAI、Anthropic、Google) |
| 提供商详情 | 该提供商下所有模型的调用详情——模型名称、调用次数、输入/输出 Token 数、单次费用和总费用 |
成本优化策略
1. 使用 Prompt 缓存
对于具有一致前缀的重复提示词,Prompt 缓存可显著降低输入 Token 成本:
| 策略 | 节省 |
|---|---|
| 使用一致的系统提示词 | 缓存读取比完整提示词处理更便宜 |
| 保持对话前缀稳定 | 缓存在相关请求间持续有效 |
| 选择合适的缓存 TTL | 5 分钟适用于短会话,1 小时适用于长时间运行的工作流 |
2. 设置预算告警
在控制台中配置支出告警,当费用超过阈值时接收通知。
3. 监控高成本模式
定期查看按模型和按 API Key 的费用视图,尽早发现异常支出模式。
常见问题
Q:费用数据多久更新一次? A:费用数据近实时更新。高流量期间可能会有短暂延迟。
Q:可以设置支出上限吗? A:可以。在控制台中配置预算告警,当支出达到指定阈值时接收通知。
Q:如何了解单次调用的计费详情? A:在请求日志中将鼠标悬停在 Cost 列上查看计费详情弹窗,或查看任意调用的详细费率明细。