11. ObservabilityとFeedback Loop

なぜAI開発プロセスを観測するのか

AI駆動開発では、アプリケーションのログだけでなく、AIがどう作業したかも観測対象になります。

理由は、AIの失敗を次回のルールに変えるためです。

AI開発プロセスの観測基盤は、開発イベントを記録するツールです。

記録するもの:

開発イベントを1つのログに流すだけでは「何が起きたか」しかわかりません。 誰が・どの工程で・何のルールに対しての3軸で記録すると、問題の原因を特定しやすくなります。

たとえば「テストが落ちた」だけでなく、「実装エージェントが、実装フェーズで、型安全ガードレイルに引っかかった」まで追跡できます。

軸	記録する観点	例
Agent	誰が何をしたか	session start/stop、エージェント起動/終了、コマンド実行
Process	どの工程で起きたか	ワークフロー境界、ファイル編集
Guardrail	何が検出・制御されたか	ガードレイル検出、品質チェック、制御イベント

この3軸を掛け合わせることで、「どのエージェントが、どのフェーズで、どんな違反を起こしやすいか」をデータとして把握し、ルールやスキルの改善に直接つなげられます。

観測データと開発セッションの内容をもとに改善提案をします。

観測基盤は大事ですが、観測基盤が止まっただけで開発が止まると困ります。
そのため、観測基盤は基本的にfail-openです。

つまり:

観測対象	目的
ランタイム観測	本番アプリが正常に動いているか
AI開発プロセス観測	AI開発の進め方が改善しているか

両方が必要です。

AI駆動開発は、導入して終わりではありません。
作業ログ、ガードレイル違反、検査結果をもとに、開発システム自体を育てていく必要があります。

開発を重ねるほど、AIが動くレールが強くなる。
これがFeedback Loopの狙いです。