11. ObservabilityとFeedback Loop

使ってみる・気づく・直す・もっとよくなる

なぜAI開発プロセスを観測するのか

AI駆動開発では、アプリケーションのログだけでなく、AIがどう作業したかも観測対象になります。

理由は、AIの失敗を次回のルールに変えるためです。

観測基盤の位置づけ

AI開発プロセスの観測基盤は、開発イベントを記録するツールです。

記録するもの:

複数軸イベントモデル

開発イベントを1つのログに流すだけでは「何が起きたか」しかわかりません。 誰が・どの工程で・何のルールに対しての3軸で記録すると、問題の原因を特定しやすくなります。

たとえば「テストが落ちた」だけでなく、「実装エージェントが、実装フェーズで、型安全ガードレイルに引っかかった」まで追跡できます。

記録する観点
Agent 誰が何をしたか session start/stop、エージェント起動/終了、コマンド実行
Process どの工程で起きたか ワークフロー境界、ファイル編集
Guardrail 何が検出・制御されたか ガードレイル検出、品質チェック、制御イベント

この3軸を掛け合わせることで、「どのエージェントが、どのフェーズで、どんな違反を起こしやすいか」をデータとして把握し、ルールやスキルの改善に直接つなげられます。

改善提案の役割

観測データと開発セッションの内容をもとに改善提案をします。

  1. 開発中の失敗
  2. 観測基盤に記録
  3. 分析
  4. 改善提案
  5. ルール / スキル / ガードレイル / DSL
  6. 次回から自動適用

改善例

観測された問題 改善先
同じコマンドミスが多い エディタ Hook
同じテスト漏れが多い テスト検査ルール
仕様漏れが多い 仕様テンプレート
特定の手順を毎回説明している スキル化
生成ファイル編集が多い Guardrailをwarnからblockへ
リリース後の手戻りが多い release gate追加

fail-openの考え方

観測基盤は大事ですが、観測基盤が止まっただけで開発が止まると困ります。
そのため、観測基盤は基本的にfail-openです。

つまり:

ランタイム観測との違い

観測対象 目的
ランタイム観測 本番アプリが正常に動いているか
AI開発プロセス観測 AI開発の進め方が改善しているか

両方が必要です。

結論

AI駆動開発は、導入して終わりではありません。
作業ログ、ガードレイル違反、検査結果をもとに、開発システム自体を育てていく必要があります。

開発を重ねるほど、AIが動くレールが強くなる。
これがFeedback Loopの狙いです。