大規模言語モデルは文章を作れますが、実務を終えるには観察、道具、権限、検証、復帰点が必要です。Agent Harness は、その五つを一つの作業環境に束ね、モデルを安全に動く同僚へ近づける外骨格です。
本稿では、ハーネスの構造を開発チーム向けに分解します。ローカル PC ではなく、SSH と VNC で常時接続できる LeanVPS Mac mini M4 に置く理由もあわせて確認します。
5層
観察・計画・道具・検証・記録
24h
長時間ジョブを中断しない実行席
M4
Apple Silicon 実機で検証可能
モデル単体で止まる3つの理由
- 1. モデルは端末、ファイル、ブラウザの現在状態を自分では見られません。
- 2. コマンド実行や編集には権限境界が必要で、無制限に渡すと危険です。
- 3. テスト失敗、競合、長時間ビルドから復帰する記録がないと作業が散ります。
Harness 構成マトリクス
| 層 | 役割 | 失敗時の症状 | 実務での置き場 |
|---|---|---|---|
| 観察 | repo、端末、画面を読む | 古い前提で編集 | ログと差分 |
| 道具 | 検索、編集、test | 説明だけで止まる | CLI 権限 |
| 検証 | lint、unit、E2E | 壊れたまま完了 | CI とローカル |
| 復帰 | 履歴、todo、承認 | 同じ失敗を反復 | 永続 Mac |
導入の五手順
- 作業境界を決める — 対象 repo、編集可否、危険コマンドを明文化します。
- ツールを配線する — 検索、編集、シェル、ブラウザ、テストを分けて渡します。
- 承認点を置く — 削除、push、課金、秘密情報操作は人が確認します。
- 終了条件を固定する — diff、lint、テスト、字数などを合否にします。
- 実行席を専有する — LeanVPS M4 に SSH/VNC で入り、長時間処理を維持します。
引用できる判断材料
- Harness は UI ではなく制御面です。 モデルに何を見せ、何を許し、何で完了とするかを決めます。
- Mac 実機は iOS と WebKit 検証に強いです。 Xcode、Safari、証明書を同じ環境で扱えます。
- 専有環境は再現性を上げます。 依存関係、鍵、キャッシュ、ログがセッションをまたいで残ります。
まとめ:Harness は実行環境まで含めて設計する
Agent Harness の価値は、賢い返答ではなく終わる作業を増やすことです。モデルに道具を渡し、権限を絞り、検証で閉じ、専有 Mac に状態を残すと、調査、実装、テスト、修正の輪が安定します。AI エージェントを本番ワークフローに入れるなら、まず LeanVPS の Mac mini M4 を借り、チームのハーネスを一台の実機で試してください。
本稿は技術設計の整理です。利用するモデル、権限、社内規程に合わせて承認点を調整してください。
Agent Harness · 専有 Mac 実行基盤
エージェントの作業席を LeanVPS Mac mini M4 に用意しませんか
SSH/VNC、Apple Silicon 実機、月払いの専有環境で、長時間のビルド・検証・自動化を安定させます。