entire.io — AI の思考プロセスを git に記録する時代
こんにちは、わさびーふです。
普段から Claude Code や Devin に PR を書かせて AI Review ツールにレビューさせる、という流れを試しているのですが、「AI が書いたコードを AI がレビューしているのに、なぜ表面的な指摘しか出ないのか」がずっと気になっていました。
entire.io とは
AI エージェントの「思考プロセス」を git に記録する開発者プラットフォームです。
- 創業者: Thomas Dohmke(元 GitHub CEO)
- 資金調達: Seed $60M(評価額 $300M)
- 発表日: 2026 年 2 月 10 日
- GitHub Stars: 3,000+
git は人間がコードを書く時代に設計されました。コミット履歴には「何を変えたか」は残りますが、AI エージェントが「なぜそう書いたか」は残りません。entire.io はこのギャップを埋めるツールです。
AI Review ツールの現状と共通課題
まず、現在の AI Review ツールの状況を整理します。
| ツール | 仕組み | 速度 |
|---|---|---|
| Greptile | コードベースをグラフ化 + Vector Embedding で意味検索 | 約 3 分 |
| Devin Review | 論理的な変更グルーピング + インタラクティブチャット | 5-10 分 |
| Copilot Review | Agentic Tool Calling + CodeQL/ESLint 統合 | 約 30 秒 |
3 ツールに共通する課題があります。
入力が diff + コードベースに限定されていて、AI がコードを書いた「理由」にアクセスできないということです。
レビューする側の AI も、diff という「最終結果」だけを見ているので、表面的な指摘に留まりがちです。実際にチームで使っていても「それはわかってるけど、なぜそう書いたかを見てほしい」と感じることが多いです。
entire.io で何が変わるか
現状の AI Review は「最終コード」しか見えません。entire.io を導入すると「なぜ」が見えるようになります。
現状
git diff(最終的なコード変更)← これだけ
❌ 誰が書いたか ❌ 何を頼んだか ❌ 途中の試行錯誤
entire.io 導入後
| 保存ファイル | 見えるようになること |
|---|---|
prompt.txt | 何を頼んだか — 元の指示内容 |
full.jsonl | AI がどう考えたか — 推論・試行錯誤の全記録 |
metadata.json | AI が何% 書いたか — attribution(人間 vs AI の比率) |
context.md | どんな文脈で作業したか — セッションの背景 |
この 4 ファイルは git orphan branch(entire/checkpoints/v1)に記録されるため、通常の履歴を汚さず、Review ツールが参照可能な形で永続化されます。
Entire CLI の基本
主要コマンド
$ entire enable # 既存リポジトリへシームレス統合
$ entire rewind # 任意のチェックポイントへ瞬時に非破壊復元
$ entire explain # AI による文脈解説
チェックポイント戦略
| 戦略 | トリガー | 推奨用途 |
|---|---|---|
manual-commit | git commit 時 | main ブランチで安全に運用 |
auto-commit | エージェント応答ごと | feature ブランチ推奨 |
対応エージェントは Claude Code、Gemini CLI、OpenCode の 3 つです。Codex は対応予定。
チェックポイントの構造
チェックポイントは git orphan branch 上でシャーディング(256 バケット)により格納されます。
entire/checkpoints/v1 branch:
<id[:2]>/<id[2:]>/ ← 12文字 hex ID の先頭2文字でシャード
│
├── metadata.json ← 集約統計
│
├── 0/ ← セッション 0
│ ├── metadata.json セッションメタデータ
│ ├── full.jsonl 完全な会話履歴
│ ├── context.md セッションコンテキスト
│ ├── prompt.txt プロンプト一覧
│ └── content_hash.txt コンテンツハッシュ
│
├── 1/ ← セッション 1(並行セッション時)
└── 2/ ← セッション 2 ...
metadata.json の中身
{
"cli_version": "0.4.7",
"checkpoint_id": "a3b2c4d5e6f7",
"strategy": "manual-commit",
"agent": "Claude Code",
"files_touched": ["auth.go", "auth_test.go"],
"token_usage": {
"input_tokens": 5000,
"output_tokens": 2000,
"cache_read_tokens": 3000,
"api_call_count": 10
},
"summary": {
"intent": "JWT 認証バグの修正",
"outcome": "期限切れトークンのバリデーション修正",
"friction": ["テストデータの不整合"],
"open_items": ["リフレッシュトークンの検討"]
},
"initial_attribution": {
"agent_lines": 146,
"human_added": 30,
"agent_percentage": 73.0
}
}
token_usage でセッション単位のコスト算出、summary で AI 生成のセッション要約、initial_attribution で行レベルの帰属情報が得られます。
コミットに刻まれる帰属情報
entire.io は git commit メッセージにもメタデータを埋め込みます。
commit 8a3f2b1e...
Author: developer <[email protected]>
fix: JWT トークン期限切れ時の認証バイパスを修正
Entire-Checkpoint: a3b2c4d5e6f7 ← セッション記録へのリンク
Entire-Attribution: 73% agent (146/200) ← AI/人間の貢献比率
これにより、AI 比率が高いコミットはセッション記録を重点レビュー、人間比率が高いコミットは従来の diff レビューで十分、という使い分けが可能になります。
各 AI Review ツール × entire.io のシナジー
4 ファイルが各ツールの精度をどう変えるかを考えてみます。
- Greptile —
full.jsonlで AI がどの順序で依存を辿ったかをグラフに補完。到達不能な暗黙的依存も検出可能に - Devin Review — AI-to-AI で「生成時の推論」を参照したレビュー。表面的な diff 指摘から意図レベルの深いレビューへ
- Copilot Review — コミットトレーラーの Checkpoint ID からセッションへ直接遷移。GitHub ネイティブで「コードの背景」まで一気通貫
チームレビューへの波及効果
- 「AI の使い方」自体をレビューできるようになる(プロンプトの品質管理)
- 効果的な AI 活用パターンをチーム内で共有・標準化できる
- 「AI が書いたから分からない」というブラックボックス問題を解消する
コードオーナーシップの再定義
AI が 73% 書いたコードの「オーナー」は誰でしょうか。
従来は「コードを書いた人 = オーナー = 責任者」でシンプルでした。AI 時代ではそう簡単にはいきません。entire.io の Attribution とセッション記録があることで「責任の分解」が可能になります。
| 責任レイヤー | 担当 | entire.io の証跡 |
|---|---|---|
| 意図の責任 | プロンプト作成者 | prompt.txt |
| 推論の妥当性 | AI + レビュアー | full.jsonl |
| 実装の品質 | AI + レビュアー | full.jsonl + diff |
| 最終承認 | レビュアー | PR approve + session |
| 運用責任 | チーム全体 | Attribution トレンド |
バグが発生したとき、「プロンプトが曖昧だったのか」「AI の推論が誤ったのか」「レビューで見落としたのか」をセッション記録から特定できます。entire.io なしでは「AI が書いたから分からない」で終わりますが、entire.io ありでは「Prompt 3 の指示が曖昧で AI が誤解した」と特定できるわけです。
AI 開発コストの可視化
metadata.json の token_usage を集計すれば、AI 開発コストが初めて「測れる」ようになります。
| 分析観点 | 具体例 |
|---|---|
| 機能あたりコスト | 「認証機能 = $12.30 / 決済機能 = $45」 |
| 開発者あたりコスト | 「A さん $80/月 / B さん $320/月」 |
| PR あたりコスト | 「PR #142 = $3.20(8 セッション)」 |
| rewind 率 | 「30% の rewind = プロンプト改善余地」 |
| cache 効率 | 「cache_read 80% = コンテキスト設計◎」 |
AI 開発は「速さ」だけで語られてきましたが、entire.io によって「コスト効率」で語れるようになります。
歴史的文脈: git → GitHub → entire.io
コラボレーション基盤は段階的に進化してきました。
| 年 | プロダクト | 何を変えたか |
|---|---|---|
| 2005 | git | 人間の変更を追跡(ファイル差分、コミット履歴) |
| 2008 | GitHub | 人間同士のレビュー文化を確立(PR、Issue) |
| 2026 | entire.io | 人間と AI のコラボレーションを記録 |
3 つの共通パターンがあります。
- 暗黙のプロセスを明示化する — git: FTP 上書きから変更追跡へ。GitHub: メールからレビュー文化へ。entire.io: ブラックボックスから推論記録へ
- メタデータが本体より価値を持つ — git: diff より commit message。GitHub: コードより PR ディスカッション。entire.io: 生成コードよりセッション記録
- 新しいレビュー文化を生む — git: 変更前後の比較。GitHub: LGTM 文化。entire.io: プロンプトレビュー・推論監査
現状と展望
現状の課題
- AI Review ツールがチェックポイントを読み込む統合レイヤーが未実装
- データは専用ブランチに保存されるが、外部ツールが参照する API/MCP がない
- GitHub Issue で MCP server endpoint が提案されているが未着手
展望
- 開発スピードが非常に速い — 統合レイヤーの実装が次の転換点になりそうです
- 元 GitHub CEO のネットワークで AI Review ツールとの連携に期待しています
- 「記録」から「活用」フェーズへの移行が始まれば一気に価値が出ると思います
まとめ
「AI Agent のコードレビューだけで終わらせたい」には 3 つのステップが必要です。
- AI の思考プロセスが記録される ← entire.io が実現中
- Review ツールがその記録を参照する ← これから(未実装)
- 人間はレビュー結果を承認するだけ ← いつかは
現状は 1 が動いていて、2 と 3 はまだありません。でも 1 がなければ 2 も 3 も始まりません。
「いつかは」の最初の一歩は、AI の思考を記録すること。entire.io がその基盤になる可能性を感じています。
おしまい