可观测与计费/请求日志

监控和分析所有 API 调用记录——Token 用量、费用、性能、路由决策和请求追踪。

请求日志

UniGateway 提供全面的日志系统,帮助你实时监控和分析所有 API 调用记录。通过请求日志,你可以查看每次请求的详细信息——包括 Token 用量、费用、性能指标等——从而更好地优化应用并控制成本。

查看日志

控制台日志页面

访问 UniGateway 控制台的 日志 页面,查看所有 API 调用的详细记录。

筛选条件:

筛选器说明
时间范围选择特定日期范围查看历史记录
API Key按不同 API Key 筛选日志,便于多项目管理
Request ID输入请求 ID 快速定位特定请求
Provider按服务提供商筛选(如 Anthropic、OpenAI、Google)
Model按模型筛选,快速查找特定模型的调用记录
完成原因按完成状态筛选(如 stopend_turnmax_tokens

日志列表字段

字段说明
Timestamp请求发起时间
Model使用的模型名称(如 gpt-5.4claude-sonnet-4-6
Input Tokens输入 Token 数;点击可查看详细 Token 明细
Output Tokens输出 Token 数
Cost本次调用费用(USD)
Latency请求延迟(ms)
Throughput每秒生成 Token 数(tokens/s)
Finish完成状态(如 end_turntool_usestopmax_tokenslength

Token 明细

点击 Input Tokens 列中的数字,查看详细的 Token 明细:

Token 类型说明
prompt基础输入 Token
input_cache_read从缓存读取的 Token
input_cache_write写入缓存的 Token
input_cache_write_5_min5 分钟缓存写入 Token
input_cache_write_1_h1 小时缓存写入 Token

通过此明细了解缓存利用情况,优化缓存策略。

计费详情

将鼠标悬停在 Cost 列上,查看特定调用的计费详情:

按量付费(Pay As You Go):

字段说明
Purchased Credits用户充值的资金;在奖励额度用尽后使用
Reward Credits充值赠送等奖励额度;优先扣减
状态结算状态(如 Settled

请求详情

点击任意日志条目的 Details,查看该次调用的完整信息。详情页分为两部分。

对话内容(左侧面板)

左侧面板显示完整的请求和响应内容:

部分包含
用户消息用户发送的输入
系统消息系统提示词(如有)
助手消息模型生成的响应
工具调用工具输入和输出(如使用了工具调用)

显示模式:

模式适用场景
Pretty 模式审查对话质量和交互流程
JSON 模式调试 API 集成或排查技术问题

在 JSON 模式下,可切换数据源查看不同阶段的请求/响应详情:

数据源说明
User → UniGateway用户发送给 UniGateway 的原始请求
UniGateway → OriginUniGateway 转发给上游提供商的请求
Origin → UniGateway上游提供商返回给 UniGateway 的原始响应
UniGateway → UserUniGateway 返回给用户的响应

指标与元数据(右侧面板)

右侧面板显示详细的技术指标和元数据。

模型信息:

字段说明
Model使用的模型名称
Provider模型提供商

性能指标:

指标说明
First Token Latency (ms)从发送请求到收到第一个 Token 的时间
Generation Time (ms)生成完整响应的时间
Throughput (tps)Token 生成速率(每秒 Token 数)

原始元数据:

以 JSON 格式查看完整请求元数据,支持一键复制。

使用 X-UniGateway-RequestId

每个 API 响应都包含 X-UniGateway-RequestId 响应头。使用此 ID 可以:

  1. 搜索日志 — 在日志页面的筛选器中输入请求 ID 查找特定调用
  2. 调试错误 — 将此 ID 提供给支持团队进行请求追踪
  3. 关联自有日志 — 将此 ID 与应用日志一起存储,实现端到端追踪
from openai import OpenAI

client = OpenAI(
    api_key="<YOUR_UNIGATEWAY_API_KEY>",
    base_url="https://api.unigateway.ai/v1",
)

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[{"role": "user", "content": "你好"}],
)

request_id = response._request_id
print(f"Request ID: {request_id}")

日志保留

方案保留期限
按量付费30 天

超过保留期限的日志将自动删除。请在过期前导出重要日志。

最佳实践

  1. 监控模型路由 — 检查日志中的 model 字段是否与请求模型不同
  2. 识别费用异常 — 按费用排序,发现意外昂贵的调用
  3. 识别费用异常 — 按费用排序,发现意外昂贵的调用
  4. 分析延迟模式 — 筛选高延迟请求,定位性能瓶颈
  5. 审计 API Key 使用 — 按 API Key 筛选,确保各 Key 仅用于预期用途

常见问题

Q:日志多久后可以看到? A:日志通常在请求完成后几秒内可用。高流量期间可能会有短暂延迟。

Q:可以导出日志吗? A:可以。在日志页面使用导出按钮,将选定时间范围的日志下载为 CSV。

Q:可以通过 API 访问日志吗? A:可以通过平台管理 API,使用 X-UniGateway-RequestId 查询生成详情。

Q:为什么有些日志显示的模型与我请求的不同? A:这发生在平台选择了不同模型时。日志中的 model 字段显示实际使用的模型。