kaeken(嘉永島健司)ブログ

Observability 概要

DevOps

Observability
特徴
分類
上位概念・下位概念
メリット
デメリット
既存との比較
競合
導入ポイント
注意点
今後
関連キーワード

Observability

Observability（オブザーバビリティ）とは、システムの外部出力から内部状態を推測する能力のことです。従来の監視・モニタリングとは異なり、システム全体の挙動を包括的に把握し、未知の問題に対しても迅速に対応できる点が特徴です。

特徴

システム全体の可視化： ログ、メトリクス、トレースなどのデータを統合し、システム全体の状況を可視化します。
根本原因の特定： 異常が発生した場合、根本原因を迅速に特定し、解決までの時間を短縮します。
未知の問題への対応： 既知の問題だけでなく、未知の問題に対しても、状況を把握し、適切な対応を行うことができます。
プロアクティブな対応： 異常が発生する前に、兆候を検知し、未然に問題を防止します。

分類

ログ（Logs）： システム内で発生したイベントの記録。
メトリクス（Metrics）： システムのパフォーマンスやリソース使用状況などの数値データ。
トレース（Traces）： リクエストがシステム内をどのように流れるかを追跡するデータ。

上位概念・下位概念

上位概念：システム監視、パフォーマンス管理
下位概念：分散トレーシング、ログ管理、メトリクス監視

メリット

システム全体の状況を把握し、問題解決を迅速化
未知の問題にも対応可能
プロアクティブな問題解決
システムの信頼性向上
開発・運用効率の向上

デメリット

導入・運用コスト
データの収集・分析・可視化に必要な技術的知識
大量のデータ管理

既存との比較

監視・モニタリング： 既知の問題を検知し、アラートを通知する。
Observability： システム全体の挙動を把握し、未知の問題にも対応する。

競合

Datadog
New Relic
Dynatrace
Splunk
Prometheus
Jaeger

導入ポイント

目的の明確化：何をObservabilityで実現したいのかを明確にする。
必要なデータの特定：ログ、メトリクス、トレースなど、必要なデータを特定する。
適切なツールの選定：目的に合ったツールを選定する。
段階的な導入：まずは一部のシステムから導入し、徐々に範囲を拡大する。
継続的な改善：導入後も、継続的にデータ分析や可視化を行い、改善を続ける。

注意点

データの過剰収集：必要なデータのみを収集し、過剰なデータ収集を避ける。
セキュリティ：機密情報を含むデータは、適切に保護する。
コスト：導入・運用コストを考慮し、費用対効果の高いObservabilityを実現する。

今後

AI・機械学習の活用：異常検知や根本原因分析の自動化
クラウドネイティブ環境への対応：コンテナやマイクロサービスなど、複雑な環境に対応
セキュリティObservability：セキュリティリスクの可視化と対応

関連キーワード

分散トレーシング
ログ管理
メトリクス監視
SLO（サービスレベル目標）
SLI（サービスレベル指標）
エラーバジェット
AIOps