代幣估算器整合 |Botpress Hub

# Tiktoken 估算器整合

使用 tiktoken 函式庫估算文字的 token 數量,為OpenAI 模型提供精確的 token 計數。

功能

  • ** 精確的代幣計數**:使用官方的 tiktoken 函式庫提供精確的代幣估算。
  • 支援多種模型**:支援多種OpenAI 模型 (gpt-3.5-turbo, gpt-4, 等等)。
  • 安全限制:可選擇安全限制檢查,以防止代幣超額
  • ** 零設定**:無需設定 - 開箱即可使用
  • 錯誤處理**:具有描述性訊息的優雅錯誤處理

使用方式

估計代幣動作

整合提供單一動作: estimateTokens.

輸入參數:

  • text (必填):要估算的文字
  • model`(可選):標記化要使用的OpenAI 模型 (預設為 "gpt-3.5-turbo")
  • safetyLimit (選用):令牌數量估計的安全限制。如果留空,則不會應用任何限制

輸出:

  • tokenCount`:文字中的標記估計數量
  • tokenizerName:使用的標記器名稱
  • model:標記化所依據的模型
  • limitExceeded:表示估計的標記數量是否超過安全限制 (僅在提供 safetyLimit 時出現)

使用範例

基本用法:

文字:「哈囉,世界!」
模型:"gpt-3.5-turbo"

結果:
- tokenCount:4
- tokenizerName:"tiktoken"
- model:"gpt-3.5-turbo"

具有安全限制:

文字:「這是一段較長的文字,可能會超過我們的安全限制......」
型號:"gpt-3.5-turbo"
安全限制: 10

結果:
- tokenCount:15
- tokenizerName:"tiktoken"
- model:"gpt-3.5-turbo"
- limitExceeded: true

支援的機型

  • gpt-3.5-turbo
  • `gpt-4
  • `gpt-4-turbo
  • text-davinci-003
  • 文字-davinci-002
  • code-davinci-002
  • 以及 tiktoken 支援的其他OpenAI 模型

建議安全限制

設定安全限制時,請考慮您的實際 API 呼叫將包含系統提示、對話歷史和回應產生的額外權標。以下是保守的建議:

GPT.5-Turbo (4,096 代碼限制)

  • 保守:2,500 個備份 (剩餘 ~1,600 個備份用於系統提示 + 回應)
  • 中度**:3,000 個備份 (剩餘 ~1,100 個備份用於系統提示 + 回應)
  • 進步:3,500 代幣(留下 ~600 用於系統提示 + 回應)

GPT(8,192 個符記限制)

  • 保守**:5,000 個符記 (剩餘 ~3,200 個符記用於系統提示 + 回應)
  • ** 中等**:6,000 個符記 (留下 ~2,200 個符記供系統提示 + 回應使用)
  • 進步:7,000 代幣 (留下 ~1,200 用於系統提示 + 回應)

GPT Turbo (128,000 令牌限制)

  • 保守**:100,000 個備份 (剩餘 ~28,000 個備份用於系統提示 + 回應)
  • ** 中等**:110,000 個備份 (剩餘 ~18,000 個備份用於系統提示 + 回應)
  • 進步:120,000 代幣(剩餘 ~8,000 用於系統提示 + 回應)

:這些建議假設典型的系統提示大小 (200-800 個字元) 和所需的回應長度 (500-2,000 個字元)。請根據您的特定使用情況進行調整。

錯誤處理

整合會處理各種錯誤情況:

  • ** 無效輸入**:對於遺失或無效的文字,會傳回清楚的錯誤訊息
  • 空文字:對於空字串,回傳 0 符記
  • 不支援的模型**:對於 tiktoken 不支援的模型,會傳回錯誤訊息。
  • Tokenization Errors:優雅地處理 tiktoken 函式庫錯誤
  • 安全限制警告**:令牌數量超過安全限制時會記錄警告

優點

  • ** 成本優化**:在進行 API 呼叫之前,先估算令牌成本
  • 速率限制**:管理代幣預算並使用安全限制防止超額
  • 工作流程邏輯**:根據代用幣數量和安全臨界值啟用條件邏輯
  • 透明度**:提供代幣使用模式的可見性
  • 主動監控**:設定安全限制,及早偵測可能的代幣超額情況