AI Token 计费可视化

探索 PD 分离和 KV Cache 如何优化 AI 服务成本

🔄 PD 分离原理对比

PD 分离将系统提示和用户输入分离,系统提示不计入 Token 费用,显著降低成本。

传统模式

系统提示
80 tokens
用户输入
20 tokens
API 输出
50 tokens
$0.00375
总成本 (150 tokens)

PD 分离模式

系统提示
80 tokens 免费
用户输入
20 tokens
API 输出
50 tokens
$0.00105
总成本 (70 tokens) - 节省 72%

🎮 交互式 PD 分离演示

80 tokens
20 tokens
50 tokens

传统模式

$0.00375
150 tokens

PD 分离模式

$0.00105
70 tokens

💾 KV Cache 机制

KV Cache 通过缓存计算结果避免重复处理,显著降低 Token 使用量和响应时间。

缓存状态

缓存命中 缓存未命中 空闲
缓存命中率 0%
总请求数 0
缓存命中 0
节省的 tokens 0

🎮 KV Cache 模拟器

等待查询...

🚀 组合优化架构

结合 PD 分离和 KV Cache 实现多层优化,最大化成本节省。

📝
用户输入
等待中
🔄
PD 分离检查
等待中
💾
KV Cache 查询
等待中
🌐
API 调用
等待中
返回结果
等待中

💰 成本节省计算器

成本分析

📊
传统模式成本
$15.00
每月
优化后成本
$5.25
每月
💵
节省金额
$9.75
每月
📈
节省比例
65%
成本降低

🎮 组合优化模拟器

等待请求...