🔄 PD 分离原理对比
PD 分离将系统提示和用户输入分离,系统提示不计入 Token 费用,显著降低成本。
传统模式
$0.00375
总成本 (150 tokens)
PD 分离模式
$0.00105
总成本 (70 tokens) - 节省 72%
💾 KV Cache 机制
KV Cache 通过缓存计算结果避免重复处理,显著降低 Token 使用量和响应时间。
缓存命中率
0%
总请求数
0
缓存命中
0
节省的 tokens
0
🎮 KV Cache 模拟器
🚀 组合优化架构
结合 PD 分离和 KV Cache 实现多层优化,最大化成本节省。
🎮 组合优化模拟器