Live
?
未登入
本月節省費用
尚未產生資料
平均節省率
尚未產生資料
快取命中率
尚未產生資料
路由請求數
過去 30 天
每日費用對比 (est.)
— GPT-4o— GPT-4o-mini— Gemini Flash
複雜度分配
HIGH
MED
LOW
Cache hits
最新請求紀錄
時間領域複雜度Tokens路由至費用節省品質觸發規則延遲
緊急旁路:設定 CASCA_BYPASS=true 即可完全繞過閘道器,直連 AI Provider,5 秒生效,無需聯絡我方。
送出請求
路由決策
點擊「路由請求」查看決策
即時請求串流
ready等待請求...
HIGH 路由次數
過去 30 天
HIGH 占比
占總請求的比例
HIGH 使用模型
品質優先
送到 HIGH 的對話 這些對話因為複雜度高,Casca 選擇最高品質的模型而非最便宜的
時間 觸發規則 模型 語言 Tokens 費用 延遲
載入中…
為何需要 HIGH?
Casca 分類引擎會偵測下列情境,自動把請求路由到最高品質的模型:
HIGH法律/合規 — NDA 起草、GDPR 框架、合規政策設計
HIGH醫療急症 — 急性症狀判斷、處方建議
HIGH策略規劃 — Go-to-market、數位轉型路線圖、商業計畫
HIGH技術架構 — 微服務設計、Kubernetes 部署、可觀測性體系
HIGHDebug / 安全性分析 — 漏洞掃描、程式碼審查、安全稽核
HIGH多步驟分析 — 財報解讀、投資備忘錄、複雜對比
提示詞儲存
停用
Zero-log 模式
DPA 狀態
已簽署
2024-01-15
SOC 2 Type II
進行中
預計 2024-Q3
API 金鑰位置
客戶 Vault
我方不持有副本
資料存取控制
提示詞內容儲存
請求原文不落地於我方系統
停用
Debug 模式儲存
開啟後資料存至客戶自有 S3/GCS
停用
匿名化分析
僅記錄 token 數、模型、時間戳、費用
啟用
API 金鑰隔離架構
客戶應用程式
↓ HTTPS (TLS 1.3)
Casca Gateway (記憶體處理)
↓ 只傳 metadata → DB
↓ 請求原文直接轉發
AI Provider
提示詞內容:不落地 ✓
金鑰存放位置客戶 AWS Secrets Manager
存取方式Assume-Role 臨時授權
我方持有副本
API Server 狀態
檢查中…
使用中 Providers
目前啟用的 LLM Provider
計費服務
Stripe 整合狀態
SLA 條款
可用性 SLA 退款條款
月可用率 99.0–99.9%:退還 10%
月可用率 95.0–99.0%:退還 25%
月可用率 <95%:退還 50%
停機 15 分鐘內通報客戶
SLA 以實際 server 日誌為準。如有異常請聯絡 Casca@vastitw.com。
Provider 清單
— 已選
載入中…
複雜度分類邏輯Casca 如何決定使用哪個 Provider
LOW簡單查詢、定義、翻譯、一句話回應 → 選便宜 provider(Gemini Flash / Cache hit)
MED中等生成、摘要、Email 起草、分類 → GPT-4o-mini / Claude Haiku
HIGH深度推理、法律分析、複雜架構、多步驟任務 → GPT-4o / Claude Sonnet(品質優先)
建立新 API Key
現有 API Keys載入中…
名稱前綴狀態最後使用建立時間操作
請先登入以查看 API Keys
帳戶資訊
方案
Credit 餘額
本月用量
— / —
整合指南 / SDK
curl -X POST https://api.cascaio.com/api/route \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "prompt": "幫我分析 Q3 的客服 CSAT 下降原因",
    "uc": "support",
    "qualityTier": "default"
  }'
Response JSON 結構
{
  "cx":        "MED",          // 難度分級: LOW | MED | HIGH
  "model":     "GPT-4o-mini",  // 實際路由的模型
  "tokens":    148,            // 估算 token 數
  "costUsd":   0.0000222,      // 本次費用 (USD)
  "savingsPct":97,             // 相對 GPT-4o 基準節省 %
  "rule":      "R3: 生成任務 → MED",
  "lang":      "ZH",
  "latencyMs": 4
}
總請求數
本月費用
平均節省
Auto-Learn 標記
請求明細
時間難度模型Tokens費用節省語言Auto-Learn延遲
請先登入以查看紀錄
快取條目
總快取數
累計命中次數
自動節省呼叫
累計節省費用
USD
晉升門檻
3 次 / 24h
重複即自動快取
自動晉升機制:同一個 prompt 在 24 小時內出現 3 次,Casca 自動將 LLM 回答存入你的專屬快取。 下次相同問題 直接從快取回傳,延遲 <5ms,費用 $0.00,完全隔離其他租戶。 快取 TTL 為 7 天,到期自動清除。
快取條目清單
Prompt(標準化) 難度 模型 命中次數 節省費用 原始成本 最後命中 到期
請先登入並使用 API,快取條目會在達到門檻後自動出現
推算年化節省
基於過去 30 天推算
30 天節省
尚未產生資料
30 天請求數
實際費用
Casca 路由後
GPT-4o 基準
若全用 GPT-4o
節省率
月費用趨勢(基準 vs 實際)
— GPT-4o 基準— 實際
各用途費用明細按 use_case 分組
用途 (uc)請求數實際費用節省金額節省率
載入中…
Account Mode
loading…
Current Plan
loading…
用量
loading…
餘額 / 額度
loading…
帳號模式
你可以同時使用 Passthrough 和 Managed 模式,各自獨立計費
🔑 Passthrough
用你自己的 LLM Key(OpenAI / Anthropic / Google),Casca 負責路由分類,LLM 費用由你自付。
載入中…
⬡ Casca Managed
Casca 幫你管理所有 LLM,一張帳單。用你的 csk_ Key 就好。
載入中…
Available Plans
Loading plans…
Credit Top-up
Minimum $5 · Maximum $10,000 · Credits never expire
Pause Subscription
暫停 1-3 個月,期間不收費,所有設定保留
Resume anytime within 90 days. After 90 days the account is archived (reactivation still available).
Transaction History
DateTypeAmountStatusDescription
Loading…