監控與分析

一旦您的 API 上線，您需要關注它。「在我的機器上可以運作」當客戶說 500 錯誤激增時並沒有幫助。

監控類型

API 是否可訪問？

健康檢查 (Health Checks)：一個 /health 端點，用於檢查資料庫連線。

合成監控 (Synthetic Monitoring)：自動化呼叫（像 Apidog 排程任務），每分鐘從全球不同地點執行，以驗證 API 是否正常。

API 有多快？

平均延遲：「200ms」。適合一般趨勢。

P95 / P99 延遲：「99% 的請求快於 500ms。」這比平均值更重要，因為它顯示了您最慢的使用者（通常是「最重度」和最有價值的客戶）的體驗。

API 如何被使用？

流量模式：「每天 100 萬次呼叫。」

頂級消費者：「使用者 A 佔了 30% 的流量。」

熱門端點：「/search 的使用量是 /profile 的 10 倍。」

要除錯為什麼某事失敗，您需要可觀察性。

日誌 (Logs)：「發生了什麼？」（帶有時間戳記的錯誤訊息）。

指標 (Metrics)：「現在正在發生什麼？」（CPU 使用率、每秒請求數）。

追蹤 (Traces)：「在哪裡發生？」（跨微服務的分散式追蹤）。

正常運作時間 != 健康：僅僅因為伺服器回應 ping 並不意味著資料庫已連線。使用深度健康檢查。

關注長尾：監控 P99 延遲以捕捉影響異常值的效能問題。

商業價值：使用分析來了解客戶行為並推動產品決策。

主動：設定警報，以便在您的客戶發推文之前就知道中斷。

繼續閱讀 → API 版本控制策略