AI Token 计费可视化 | PD分离 & KV Cache

🔄 PD 分离原理对比

PD 分离将系统提示和用户输入分离，系统提示不计入 Token 费用，显著降低成本。

传统模式

系统提示

80 tokens

用户输入

20 tokens

API 输出

50 tokens

$0.00375

总成本 (150 tokens)

PD 分离模式

系统提示

80 tokens 免费

用户输入

20 tokens

API 输出

50 tokens

$0.00105

总成本 (70 tokens) - 节省 72%

🎮 交互式 PD 分离演示

系统提示长度 (tokens) 80 tokens

用户输入长度 (tokens) 20 tokens

输出长度 (tokens) 50 tokens

传统模式

$0.00375

150 tokens

PD 分离模式

$0.00105

70 tokens

💾 KV Cache 机制

KV Cache 通过缓存计算结果避免重复处理，显著降低 Token 使用量和响应时间。

缓存状态

● 缓存命中 ● 缓存未命中 ● 空闲

缓存命中率 0%

总请求数 0

缓存命中 0

节省的 tokens 0

🎮 KV Cache 模拟器

输入查询内容

缓存策略

等待查询...

🚀 组合优化架构

结合 PD 分离和 KV Cache 实现多层优化，最大化成本节省。

📝

用户输入

等待中

🔄

PD 分离检查

等待中

💾

KV Cache 查询

等待中

🌐

API 调用

等待中

✅

返回结果

等待中

💰 成本节省计算器

每日请求数

平均每请求 tokens

缓存命中率 (%)

成本分析

📊

传统模式成本

$15.00

每月

✨

优化后成本

$5.25

每月

💵

节省金额

$9.75

每月

📈

节省比例

65%

成本降低

🎮 组合优化模拟器

输入内容

内容类型

等待请求...