大規模言語モデルは文章を作れますが、実務を終えるには観察、道具、権限、検証、復帰点が必要です。Agent Harness は、その五つを一つの作業環境に束ね、モデルを安全に動く同僚へ近づける外骨格です。

本稿では、ハーネスの構造を開発チーム向けに分解します。ローカル PC ではなく、SSH と VNC で常時接続できる LeanVPS Mac mini M4 に置く理由もあわせて確認します。

5層
観察・計画・道具・検証・記録
24h
長時間ジョブを中断しない実行席
M4
Apple Silicon 実機で検証可能

モデル単体で止まる3つの理由

  • 1. モデルは端末、ファイル、ブラウザの現在状態を自分では見られません。
  • 2. コマンド実行や編集には権限境界が必要で、無制限に渡すと危険です。
  • 3. テスト失敗、競合、長時間ビルドから復帰する記録がないと作業が散ります。

Harness 構成マトリクス

役割失敗時の症状実務での置き場
観察repo、端末、画面を読む古い前提で編集ログと差分
道具検索、編集、test説明だけで止まるCLI 権限
検証lint、unit、E2E壊れたまま完了CI とローカル
復帰履歴、todo、承認同じ失敗を反復永続 Mac

導入の五手順

  1. 作業境界を決める — 対象 repo、編集可否、危険コマンドを明文化します。
  2. ツールを配線する — 検索、編集、シェル、ブラウザ、テストを分けて渡します。
  3. 承認点を置く — 削除、push、課金、秘密情報操作は人が確認します。
  4. 終了条件を固定する — diff、lint、テスト、字数などを合否にします。
  5. 実行席を専有する — LeanVPS M4 に SSH/VNC で入り、長時間処理を維持します。

引用できる判断材料

  • Harness は UI ではなく制御面です。 モデルに何を見せ、何を許し、何で完了とするかを決めます。
  • Mac 実機は iOS と WebKit 検証に強いです。 Xcode、Safari、証明書を同じ環境で扱えます。
  • 専有環境は再現性を上げます。 依存関係、鍵、キャッシュ、ログがセッションをまたいで残ります。

まとめ:Harness は実行環境まで含めて設計する

Agent Harness の価値は、賢い返答ではなく終わる作業を増やすことです。モデルに道具を渡し、権限を絞り、検証で閉じ、専有 Mac に状態を残すと、調査、実装、テスト、修正の輪が安定します。AI エージェントを本番ワークフローに入れるなら、まず LeanVPS の Mac mini M4 を借り、チームのハーネスを一台の実機で試してください。

本稿は技術設計の整理です。利用するモデル、権限、社内規程に合わせて承認点を調整してください。
Agent Harness · 専有 Mac 実行基盤

エージェントの作業席を LeanVPS Mac mini M4 に用意しませんか

SSH/VNC、Apple Silicon 実機、月払いの専有環境で、長時間のビルド・検証・自動化を安定させます。

Agent Harness 用 M4 をレンタル 料金を見る