一次情報読解 AI原典ノート
RSS 保存
2026-06-21 / OpenAI / OpenAI / Data Governance / OpenAI導入前に読む保持境界 2026-06-21 / Model Context Protocol / MCP / Authorization / MCP社内導入前に読む権限統制 2026-06-21 / Hugging Face / Open-source / Agent Architecture / agent設計前に読む実行責任 2026-06-21 / Anthropic / Claude Code / Settings / Claude Code導入前に読む秘密境界 2026-06-21 / Anthropic / Managed Agents / Configuration / managed agent導入前に読む設定資産化 2026-06-21 / Anthropic / Managed Agents / Outcome Evaluation / managed agent運用前に読む完了判定 2026-06-21 / Model Context Protocol / MCP / Security / remote MCP導入前に読む認可境界 2026-06-21 / Google AI for Developers / Models / Release Channel Policy / 本番運用前に読む model 固定 2026-06-21 / Model Context Protocol / MCP / Debug Workflow / MCP導入前に読む検査手順 2026-06-21 / OpenAI / Tools / Function Calling / 外部処理接続前に読む責務分界 2026-06-21 / Anthropic / Coding Agents / Permissions / repo運用前に読む権限設計 2026-06-21 / Google AI for Developers / Retrieval / Embeddings / 検索基盤導入前に読む意味検索の基礎 2026-06-21 / OpenAI / Retrieval / Managed File Search / 文書検索導入前に読む責務分界 2026-06-21 / Anthropic / Coding Agents / Hooks / repo運用前に読む強制境界 2026-06-21 / OpenAI / Agents / Sandbox Execution / agent実装前に読む実行境界 2026-06-21 / Anthropic / Evals / Infrastructure Noise / 評価導入前に読む infra 交絡 2026-06-21 / OpenAI / State / Conversations / 長期運用前に読む state 設計 2026-06-21 / Model Context Protocol / Specification / Resources / MCP導入前に読む参照面仕様 2026-06-21 / Google AI for Developers / Credentials / Migration / 本番前に読む鍵運用変更 2026-06-21 / OpenAI / Prompting / Migration / 本番前に読む prompt 運用変更 2026-06-21 / OpenAI / Identity / Credentials / 運用前に読む認証境界 2026-06-21 / OpenAI / Safety / Moderation / 本番前に読む制御順序 2026-06-21 / Google AI for Developers / Migration guide / Schema / 移行前に読む破壊的変更 2026-06-21 / OpenAI / Connectivity / MCP / MCP接続前に読む境界設計 2026-06-21 / OpenAI / Responses API / Job Control / 実装前に読む非同期設計 2026-06-21 / Model Context Protocol / Specification / Permission Boundary / MCP導入前に読む境界仕様 2026-06-21 / Google AI for Developers / Managed Agent / Security / 導入前に読む境界設計 2026-06-21 / Anthropic / Security / Engineering / 運用前に読む安全設計 2026-06-21 / OpenAI / Realtime API / Voice / 本日読むべきAPI更新 2026-06-21 / OpenAI / API / Agent / まず読むべき原典 2026-06-21 / Anthropic / Postmortem / 実装に効くニュース 2026-06-21 / Google AI for Developers / Release notes / モデル・API更新 2026-06-21 / Hugging Face / Open-source / Tutorial / 今週試したい開発者ツール 2026-06-21 / Model Context Protocol / Specification / Architecture / 英日AI用語集
用語集

英日AI用語集

日本語訳だけでは技術的な手触りが消える用語を、英語のまま読めるように補助します。

基礎概念 31 語 Agent / MCP 36 語 API / 実装部品 30 語 安全・権限 46 語 評価・運用 8 語 ベンダー固有 6 語
用語分類

基礎概念

AI原典を読む前提になる基本語。

31 語
英語日本語補足関連
context window コンテキストウィンドウ モデルが一度に参照できる入力と履歴の容量。長いほど便利だが、品質・コスト・遅延の検証は別に必要。 GPT-Realtime-2 は、音声UIを「会話」から実行ワークフローへ寄せる
Gemini API の release notes は、仕様変更を追うための一次情報になる
MCP は tool だけではない。resources と prompts を含む設計として読む
reasoning model 推論モデル 複雑な問題で内部推論に多くの計算を使うモデル。速度・費用と正答率のトレードオフを明示して使う。 GPT-Realtime-2 は、音声UIを「会話」から実行ワークフローへ寄せる
Responses API の組み込みツールは、Agent 実装の責任分界を変える
Claude Code の品質低下報告から読む、AI coding tool 運用の現実
distillation 蒸留 大きなモデルの挙動を小さなモデルへ移す手法。コスト削減の反面、対象タスクの評価が不可欠。 記事内参照なし
Zero Data Retention (ZDR) データ非保持保証 一定期間保持しない前提の運用要件。background mode のように保持を前提にする機能とは両立しない場合がある。 Zero Data Retention は「何も残らない」ではなく、「何がどこに残るかを切り分ける」話
Background mode は「長時間 reasoning を同期HTTPで待つな」という運用変更
flagged フラグ判定 危険の可能性があると見なした first-pass 判定。単独では粗く、カテゴリ別制御や人手確認の起点として使う。 Moderation を別APIの前処理で終わらせる時代が終わりつつある
category_scores カテゴリ別スコア 各危険カテゴリへのモデル信頼度。アプリ側の policy 閾値設計と定期再較正が必要になる。 Moderation を別APIの前処理で終わらせる時代が終わりつつある
category_applied_input_types 判定対象の入力種別 そのカテゴリ判定が text 由来か image 由来かを示す情報。modalities 混在時の運用判断に使う。 Moderation を別APIの前処理で終わらせる時代が終わりつつある
CEL Common Expression Language claim から派生属性を作る式言語。federation では mapping 条件を絞るために使う。 Workload identity federation は「OpenAI API key を配る前提」を崩す
prompt caching プロンプトキャッシュ 同一 prefix の再利用で効率を上げる仕組み。静的 instructions を先に置く設計が効きやすい。 Prompt Objects 廃止は「prompt を管理画面で育てる運用」をやめる合図
dormant key 休眠キー 長期間使われておらず block 対象になりうる key。棚卸しと削除判断の対象になる。 Gemini API key の制限強化は、雑な PoC 鍵運用を 403 に変える
key rotation キー更新 / ローテーション 漏えい時や運用見直し時に新 key へ切り替える作業。発行だけでなく旧 key 無効化まで含む。 Gemini API key の制限強化は、雑な PoC 鍵運用を 403 に変える
resource templates リソーステンプレート パラメータ付き resource を公開する仕組み。固定ファイル列挙ではない context surface を表現できる。 MCP Resources は「全部 tool にする雑設計」をやめるための基礎仕様
resource headroom リソース余裕幅 transient spike を吸収するための余白。足りないと model failure ではない偽失敗が増える。 agentic coding benchmark の 2点差は、モデル差ではなく RAM の差かもしれない
hard ceiling 強制上限 超えると process や container が止まる resource 上限。guaranteed allocation と別管理にしないと評価が歪みやすい。 agentic coding benchmark の 2点差は、モデル差ではなく RAM の差かもしれない
deterministic automation 決定的自動化 LLM の気分に依らず必ず走る処理。禁止操作や必須後処理を instruction から分離する時に使う。 Claude Code hooks は「守ってほしいお願い」を実行境界へ移す
stable 安定版 本番利用を前提にしやすい公開段階。便利さではなく、変更の追いやすさが価値になる。 Gemini の model 名は「性能ラベル」ではなく運用契約として読む
preview プレビュー版 先に試せる公開段階。使える場面はあっても、安定版と同じ変更前提では扱えない。 Gemini の model 名は「性能ラベル」ではなく運用契約として読む
latest alias 最新別名 より新しい実体へ差し替わりうる model 名。再現性が必要な本番では便利さが調査負債になる。 Gemini の model 名は「性能ラベル」ではなく運用契約として読む
experimental 実験版 探索を優先する公開段階。継続運用や endpoint の安定性まで強く約束された名前ではない。 Gemini の model 名は「性能ラベル」ではなく運用契約として読む
model pinning モデル固定 本番で使う model 名を明示的に固定すること。挙動変化の切り分けと再現確認の前提になる。 Gemini の model 名は「性能ラベル」ではなく運用契約として読む
resource inspection resource 検査 resource の metadata や内容、購読挙動を確認すること。読む機能と実行機能の責務混同を見つけやすい。 MCP Inspector は「ホスト上で何となく動いた」を分解して壊しながら確かめる道具
concurrent operations 並行操作 複数要求が同時に走る時の挙動。単発成功では見えない競合や順序問題を露出させる。 MCP Inspector は「ホスト上で何となく動いた」を分解して壊しながら確かめる道具
error handling エラー処理 失敗時の応答形式や扱い方。正常系だけでなく壊れ方を説明可能にするために検査が必要。 MCP Inspector は「ホスト上で何となく動いた」を分解して壊しながら確かめる道具
redirect_uri exact match `redirect_uri` の厳密一致 承認後に戻す先を完全一致で縛ること。少し違う URI を許すと認可コード奪取の入口になる。 MCP Security Best Practices は「つながる」より先に、誰の権限を誰が横取りできるかを見る
state validation `state` 検証 返ってきた OAuth 応答が、自分の開始した要求に対応するか確かめる手順。 MCP Security Best Practices は「つながる」より先に、誰の権限を誰が横取りできるかを見る
outcome 完成条件付きの目標 何を done とするかまで含めた仕事の定義。依頼文だけでは曖昧になりがちな完了条件を外出しする。 Define outcomes は「終わったはず」を rubric と grader で検査可能にする
iteration loop 反復修正ループ 評価して直し、再評価する周回。完成条件未達を機械的に差し戻す。 Define outcomes は「終わったはず」を rubric と grader で検査可能にする
needs_revision 要再修正 rubric 未達のためもう一周修正が必要な状態。 Define outcomes は「終わったはず」を rubric と grader で検査可能にする
satisfied 条件充足 rubric を満たし、完了として受け取れる状態。 Define outcomes は「終わったはず」を rubric と grader で検査可能にする
retained until deleted 削除するまで保持 明示削除しない限り残る retention 形態。短期ログ型とは分けて扱う必要がある。 Zero Data Retention は「何も残らない」ではなく、「何がどこに残るかを切り分ける」話
zero-touch OAuth 手作業不要の OAuth 接続 社員ごとの同意画面を毎回通す代わりに、会社の policy に沿って最初から接続可否を配る考え方。 Enterprise-Managed Authorization は「各自で OAuth 接続」から「会社の権限設計でつなぐ」へ進める
用語分類

Agent / MCP

Agent、MCP、tool、外部接続に関わる語。

36 語
英語日本語補足関連
MCP Model Context Protocol AI アプリが外部ツールやデータ源に接続するためのプロトコル。ツールだけでなく resources / prompts も含む。 MCP Resources は「全部 tool にする雑設計」をやめるための基礎仕様
MCP Roots は「tool 接続規格」ではなく permission 境界の primitive
Responses API の組み込みツールは、Agent 実装の責任分界を変える
preamble 作業前の短い発話 音声 agent が本回答やツール実行の前に、何をしているかを短く伝える発話。待ち時間の不安と誤解を減らすために使う。 GPT-Realtime-2 は、音声UIを「会話」から実行ワークフローへ寄せる
containment 封じ込め / コンテインメント agent の判断を信じ切らず、届く範囲を環境側で制限する考え方。モデル挙動より先に被害範囲を固定する。 Claude を安全に走らせる論点は、賢さより先に blast radius をどう切るか
blast radius 被害範囲 誤動作や侵害が起きたときにどこまで届くか。agent 運用では性能より先に小さくすべき設計対象。 Claude を安全に走らせる論点は、賢さより先に blast radius をどう切るか
workspace picker ワークスペース選択UI どの repo やフォルダを root にするか選ぶ UI。Roots と結びつく実装上の入口。 MCP Roots は「tool 接続規格」ではなく permission 境界の primitive
private MCP server 非公開MCPサーバー public internet に晒さない前提の MCP server。公開の代わりに outbound-only 接続で扱う設計が争点になる。 Secure MCP Tunnel は「private MCP を公開せずに使う」責任境界を具体化した
outbound HTTPS 外向きHTTPS通信 内側から外へだけ張る通信。MCP tunnel では inbound port 開放を避けるための前提になる。 Secure MCP Tunnel は「private MCP を公開せずに使う」責任境界を具体化した
steps steps スキーマ 入出力と tool 呼び出しを時系列で持つ新しい表現。parser、viewer、履歴引き継ぎの実装影響が大きい。 Gemini Interactions API の `steps` 移行は、SDK 更新より parser 棚卸しが本体
tool-call arguments ツール呼び出し引数 モデルが tool に渡そうとする入力。会話 content に現れる範囲は moderation 対象になりうる。 Moderation を別APIの前処理で終わらせる時代が終わりつつある
backend proxy バックエンドプロキシ client 側へ key を置かず、サーバー経由で API を叩く構成。client-side 埋め込み回避の基本線。 Gemini API key の制限強化は、雑な PoC 鍵運用を 403 に変える
resources リソース / 参照コンテキスト モデル理解の材料になる共有データ。tool と分けて扱うことで read-only 文脈と action を分離できる。 MCP Resources は「全部 tool にする雑設計」をやめるための基礎仕様
resources/list リソース一覧取得 利用可能 resource を発見する request。client がどの参照面を見せるかを制御する入口になる。 MCP Resources は「全部 tool にする雑設計」をやめるための基礎仕様
resources/read リソース読取 指定 URI の内容を取得する request。text だけでなく binary content も対象になりうる。 MCP Resources は「全部 tool にする雑設計」をやめるための基礎仕様
read-only context 読み取り専用コンテキスト action ではなく参照目的の情報面。resources を全部 tool に押し込めないための整理軸。 MCP Resources は「全部 tool にする雑設計」をやめるための基礎仕様
conversation object 会話オブジェクト messages、tool calls、tool outputs などの items を長く持てる会話単位。shared state の主単位になりうる。 Conversations API は「前の response をつなぐだけ」の限界を超える state の器
orchestration オーケストレーション model loop、tool state、承認などを持つ進行制御層。execution environment そのものとは別に考える。 Sandbox Agents は「agent 本体」と「作業用 compute」を同じものとして扱う雑設計をやめさせる
execution environment 実行環境 files や commands を実際に扱う箱。agent の思考や承認フローとは責務を分けて設計する。 Sandbox Agents は「agent 本体」と「作業用 compute」を同じものとして扱う雑設計をやめさせる
OOM kill メモリ超過強制終了 memory 上限超過で container が殺されること。agentic coding eval では実力差と誤読されやすい。 agentic coding benchmark の 2点差は、モデル差ではなく RAM の差かもしれない
Terminal-Bench Terminal-Bench shell、tests、依存導入を伴う agentic coding eval。モデル単体ではなく system test に近い。 agentic coding benchmark の 2点差は、モデル差ではなく RAM の差かもしれない
PreToolUse ツール実行前フック 実行前に block や書き換えを行うイベント。禁止系ガードレールはここに置く。 Claude Code permissions は「承認が出るから安全」という雑な期待を壊す
Claude Code hooks は「守ってほしいお願い」を実行境界へ移す
agent hook エージェントフック subagent で実状態を確認する実験的フック。強力だが production では安定性前提を置けない。 Claude Code hooks は「守ってほしいお願い」を実行境界へ移す
tool_choice ツール選択制御 モデルにどの tool を使わせるか、使わせないか、必ず使わせるかを制御する設定。 Function calling は「AIに外部処理を任せる境界」を雑にしないための基本部品
MCP Inspector MCP Inspector MCP server の検査とデバッグに使う開発者ツール。接続成功だけでなく壊れ方を分解して観察する。 MCP Inspector は「ホスト上で何となく動いた」を分解して壊しながら確かめる道具
capability negotiation 機能合意 client と server が使える機能を握る手順。つながったことと使えることを分けて確認するために要る。 MCP Inspector は「ホスト上で何となく動いた」を分解して壊しながら確かめる道具
tool schema tool スキーマ tool が受け取る入力形式の定義。ここが曖昧だと host 上の失敗を再現しにくくなる。 MCP Inspector は「ホスト上で何となく動いた」を分解して壊しながら確かめる道具
SSRF サーバー側リクエスト強要 攻撃者が server に内部向け URL を踏ませる攻撃。metadata discovery や fetch 設計で対策が要る。 MCP Security Best Practices は「つながる」より先に、誰の権限を誰が横取りできるかを見る
system prompt システムプロンプト agent の常設ルールを置く指示。各 session の user message とは役割が違う。 Define your agent は「長いプロンプト」ではなく再利用できる設定資産を作る話
MCP servers MCPサーバー群 agent から接続する標準化された外部機能群。構成定義に含めると接続責任を追いやすい。 Define your agent は「長いプロンプト」ではなく再利用できる設定資産を作る話
skills スキル 領域固有の手順や文脈を与える再利用部品。agent 定義に含めると運用再現性が上がる。 Define your agent は「長いプロンプト」ではなく再利用できる設定資産を作る話
update semantics 更新規則 どの項目が置換で、どの項目が併合かを決めるルール。managed agent の改版事故を減らす。 Define your agent は「長いプロンプト」ではなく再利用できる設定資産を作る話
rubric 採点表 成果物を何で評価するか書いた基準文書。managed agents では required として扱われる。 Define outcomes は「終わったはず」を rubric と grader で検査可能にする
grader 採点役 rubric に照らして成果物を評価する別系統の判定役。agent 本体の自己申告をそのまま信じないために置く。 Define outcomes は「終わったはず」を rubric と grader で検査可能にする
conditional access 条件付きアクセス 端末条件や所属条件などで接続可否を変える制御。MCP 接続を既存の企業統制へ乗せる時に効く。 Enterprise-Managed Authorization は「各自で OAuth 接続」から「会社の権限設計でつなぐ」へ進める
CodeAgent コード実行型 agent 途中でコードを書いて実行しながら解く型。表現力の代わりに実行環境の責任が重い。 agent は一種類ではない。コードを書かせるか、JSON に閉じるかで責任が変わる
ToolCallingAgent ツール呼び出し型 agent 決めた形式で定義済みツールを呼ぶ型。表現力は狭いが壊れ方を限定しやすい。 agent は一種類ではない。コードを書かせるか、JSON に閉じるかで責任が変わる
用語分類

API / 実装部品

API、SDK、schema、stream、実装部品に関わる語。

30 語
英語日本語補足関連
function calling 関数呼び出し モデル出力をアプリ側の関数実行に接続する仕組み。schema 設計と失敗時処理が実装品質を左右する。 Function calling は「AIに外部処理を任せる境界」を雑にしないための基本部品
Gemini Interactions API の `steps` 移行は、SDK 更新より parser 棚卸しが本体
Gemini API の release notes は、仕様変更を追うための一次情報になる
embedding 埋め込み表現 テキストや画像をベクトル化して検索や類似度計算に使う表現。RAG の基礎部品。 記事内参照なし
background mode バックグラウンド実行モード 長時間 task を非同期 response として扱うモード。待機ではなく job 管理の設計が必要になる。 Background mode は「長時間 reasoning を同期HTTPで待つな」という運用変更
sequence_number シーケンス番号 stream 再開位置を示す cursor。切断を正常系として扱う実装で重要になる。 Background mode は「長時間 reasoning を同期HTTPで待つな」という運用変更
response_format 出力形式設定 構造化出力や multimodal response の指定方法。schema の包み方や parser の前提に効く。 Gemini Interactions API の `steps` 移行は、SDK 更新より parser 棚卸しが本体
Api-Revision APIリビジョン指定ヘッダー REST API で schema を切り替えるためのヘッダー。移行猶予や先行 opt-in の管理に使う。 Gemini Interactions API の `steps` 移行は、SDK 更新より parser 棚卸しが本体
step.delta ステップ差分イベント streaming 時に新 schema で流れる差分イベント。listener が古い event 名のままだと UI が半壊しやすい。 Gemini Interactions API の `steps` 移行は、SDK 更新より parser 棚卸しが本体
moderation モデレーション / 有害性判定 危険な入力や出力を分類し、表示・保存・実行前の制御に使う仕組み。単体 API より制御順序の部品として重要。 Moderation を別APIの前処理で終わらせる時代が終わりつつある
inline moderation 生成同梱モデレーション 生成 response の中に moderation 結果も含める運用。表示前や送信前で止める順序設計に向く。 Moderation を別APIの前処理で終わらせる時代が終わりつつある
JWKS JSON Web Key Set JWT 検証に使う公開鍵集合。rotation 失敗はそのまま token exchange failure になる。 Workload identity federation は「OpenAI API key を配る前提」を崩す
application code アプリケーションコード prompt を review、test、deploy の流れへ戻す置き場所。prompt を product logic として扱う前提になる。 Prompt Objects 廃止は「prompt を管理画面で育てる運用」をやめる合図
versioning バージョン管理 prompt や schema の変化を git などで追跡すること。rollback と原因追跡の前提になる。 Prompt Objects 廃止は「prompt を管理画面で育てる運用」をやめる合図
unrestricted key 無制限APIキー 利用元や対象 API の制限が付いていない key。便利だが期限付きで壊れる運用へ変わりつつある。 Gemini API key の制限強化は、雑な PoC 鍵運用を 403 に変える
application restrictions 利用元制限 IP、website、app などリクエスト発生元の制限。API 制限とは別軸で扱う必要がある。 Gemini API key の制限強化は、雑な PoC 鍵運用を 403 に変える
Conversations API 会話状態API durable な conversation object を管理する API。長時間 job や複数 device をまたぐ state の置き場として使う。 Conversations API は「前の response をつなぐだけ」の限界を超える state の器
encrypted reasoning 暗号化 reasoning 項目 manual state 管理時に次 request へ戻せる reasoning item。表示テキストだけでは継続に必要な state が欠ける場合がある。 Conversations API は「前の response をつなぐだけ」の限界を超える state の器
30 day TTL 30日保持期限 response object の通常保持期間として案内される期限。conversation items とは retention の扱いが同一ではない。 Conversations API は「前の response をつなぐだけ」の限界を超える state の器
vector store ベクターストア 検索対象文書を保持する検索用ストレージ。添付ファイル置き場ではなく retrieval 前提の文書集合。 File Search は「RAG を自作するか否か」ではなく責務の切り方を問い直す
citation 引用表示 / 出典表示 回答の根拠文書を示す仕組み。RAG を信用できる運用にするには UI 側の見せ方まで要設計。 File Search は「RAG を自作するか否か」ではなく責務の切り方を問い直す
JSON schema JSONスキーマ 関数や構造化出力に渡す入力の形を定義する仕様。AI に外部処理を任せる時の受け口を狭める。 Function calling は「AIに外部処理を任せる境界」を雑にしないための基本部品
strict 厳格モード schema から外れた余計な項目を出しにくくする設定。便利さより入力制御を優先する場面で使う。 Function calling は「AIに外部処理を任せる境界」を雑にしないための基本部品
multimodal embeddings マルチモーダル埋め込み テキストだけでなく画像、音声、動画、PDF なども意味の近さで比較できるようにする埋め込み。 Embeddings は「検索の前に何を同じ意味として近づけるか」を決める層だ
embedding space 埋め込み空間 意味が近いデータ同士を近くに置く数値上の空間。モデルを替えると互換でない場合がある。 Embeddings は「検索の前に何を同じ意味として近づけるか」を決める層だ
output dimensionality 出力次元数 embedding ベクトルの長さ。保存量、検索性能、下流 index 設計に影響する。 Embeddings は「検索の前に何を同じ意味として近づけるか」を決める層だ
managed settings 管理設定 組織側が中央配布する設定。個人の convenience より強い統制を置きたい時に使う。 Claude Code settings は「見せない」ではなく「読ませない」で秘密を守る
reusable resource 再利用可能な資産 session をまたいで同じ形で呼び出せる設定単位。一回限りの会話指示と分けて管理する。 Define your agent は「長いプロンプト」ではなく再利用できる設定資産を作る話
versioned configuration 版管理された設定 更新のたびに版を増やし、どの構成で動いたか追跡できる設定。 Define your agent は「長いプロンプト」ではなく再利用できる設定資産を作る話
application state アプリケーション状態 会話継続や job 追跡など、API 機能を成立させるために残る状態。 Zero Data Retention は「何も残らない」ではなく、「何がどこに残るかを切り分ける」話
structured JSON 決めた形の JSON 引数の項目や型があらかじめ決まっている JSON。自由度を下げる代わりに機械検査しやすい。 agent は一種類ではない。コードを書かせるか、JSON に閉じるかで責任が変わる
schema validation スキーマ検証 渡された引数が決めた項目名や型に合っているかを機械的に検査すること。 agent は一種類ではない。コードを書かせるか、JSON に閉じるかで責任が変わる
用語分類

安全・権限

権限、秘密情報、境界、監査、保護設計に関わる語。

46 語
英語日本語補足関連
tool use ツール使用 モデルが検索、DB、コード実行、外部 API などを呼び出す設計。便利さより権限と監査が重要になる。 Responses API の組み込みツールは、Agent 実装の責任分界を変える
Claude Code の品質低下報告から読む、AI coding tool 運用の現実
Tiny Agents は、MCP 時代の agent 実装を小さく理解する入口になる
retrieval augmented generation 検索拡張生成 / RAG 外部文書を検索して回答に使う方式。検索品質、引用、更新頻度、権限管理が本体。 Responses API の組み込みツールは、Agent 実装の責任分界を変える
MCP は tool だけではない。resources と prompts を含む設計として読む
realtime voice リアルタイム音声AI 音声入力、推論、応答、場合によってはツール実行までを会話中に処理する設計。速度だけでなく回復動作と安全設計が重要。 GPT-Realtime-2 は、音声UIを「会話」から実行ワークフローへ寄せる
parallel tool calls 並列ツール呼び出し 複数の外部ツールを同時に呼び出す実装。応答速度には効くが、順序依存、失敗時処理、監査ログの設計が難しくなる。 GPT-Realtime-2 は、音声UIを「会話」から実行ワークフローへ寄せる
human-in-the-loop 人間承認付き運用 実行前に人が確認する設計。approval fatigue が起きるため、単独の主防御にはしにくい。 Claude を安全に走らせる論点は、賢さより先に blast radius をどう切るか
trust boundary 信頼境界 どこから先を未信頼入力として扱うかの境目。ローカル設定や起動時フックも trust 前なら未信頼として扱う。 Secure MCP Tunnel は「private MCP を公開せずに使う」責任境界を具体化した
MCP Roots は「tool 接続規格」ではなく permission 境界の primitive
Claude を安全に走らせる論点は、賢さより先に blast radius をどう切るか
egress control 外向き通信制御 外部 API やネットワーク送信を制限する仕組み。誤送信や資格情報流出の最後の防壁になる。 Claude を安全に走らせる論点は、賢さより先に blast radius をどう切るか
managed agent マネージドエージェント ベンダーが実行環境ごと提供する agent harness。推論だけでなく code、files、web まで抱える場合は権限設計が本体になる。 Gemini API の managed agents は「sandbox がある」だけでは安心できない
Linux sandbox Linuxサンドボックス 隔離された Linux 実行環境。sandbox があっても外向き通信や資格情報の権限が自動で安全になるわけではない。 Gemini API の managed agents は「sandbox がある」だけでは安心できない
allowlist 許可先リスト 通信先を限定する設定。宛先を許すことは、その先の API 機能利用を認めるのと近い意味を持つ。 Gemini API の managed agents は「sandbox がある」だけでは安心できない
credential scoping 資格情報のスコープ制限 agent に渡す credential の権限を最小に絞る考え方。使える以上は full scope を与えたのと近い前提で設計する。 Gemini API の managed agents は「sandbox がある」だけでは安心できない
review-before-rely 依存前レビュー agent の行動や出力を、その結果に依存する前に人が確認する運用。特に sensitive workflow では省略しにくい。 Gemini API の managed agents は「sandbox がある」だけでは安心できない
filesystem boundary ファイルシステム境界 どこまで読めるか、触れるかの範囲。agent や MCP server の permission 設計で最初に決める境界。 MCP Roots は「tool 接続規格」ではなく permission 境界の primitive
roots ルーツ / 作業領域境界 MCP server に見せる filesystem の起点。tool 接続より前に permission 範囲を決める primitive。 MCP Roots は「tool 接続規格」ではなく permission 境界の primitive
Secure MCP Tunnel Secure MCP Tunnel / 安全なMCPトンネル private MCP server を公開せずに OpenAI 製品と接続する仕組み。接続容易化より trust boundary 配置の問題として読むべき。 Secure MCP Tunnel は「private MCP を公開せずに使う」責任境界を具体化した
tunnel-client トンネルクライアント 社内境界内で動き、OpenAI と private MCP server の間を中継する実行体。置き場所がそのまま信頼境界になる。 Secure MCP Tunnel は「private MCP を公開せずに使う」責任境界を具体化した
control-plane mTLS 制御プレーンmTLS OpenAI 側 control plane との相互認証。接続できることより、どの主体を信用するかの整理に関わる。 Secure MCP Tunnel は「private MCP を公開せずに使う」責任境界を具体化した
workload identity federation ワークロードIDフェデレーション 外部 workload の身元を使って短命 token を発行する認証方式。長寿命 API key 配布を前提にしない。 Workload identity federation は「OpenAI API key を配る前提」を崩す
service account mapping サービスアカウント対応付け どの属性の workload がどの OpenAI service account を使えるか決める設定。粗い mapping は broad permission の別形になる。 Workload identity federation は「OpenAI API key を配る前提」を崩す
previous_response_id 前回レスポンス参照ID 直前 response を基点に文脈を継ぐ簡易方式。共有、再開、監査の要件が増えると鎖管理が苦しくなる。 Conversations API は「前の response をつなぐだけ」の限界を超える state の器
SandboxAgent サンドボックスエージェント agent が独立した execution environment と組で動く形。agent 本体と作業箱を同居させない設計の単位。 Sandbox Agents は「agent 本体」と「作業用 compute」を同じものとして扱う雑設計をやめさせる
session state セッション状態 sandbox session へ再接続するための状態。会話履歴や長期 memory と同一視しないほうがよい。 Sandbox Agents は「agent 本体」と「作業用 compute」を同じものとして扱う雑設計をやめさせる
snapshot スナップショット 保存済み workspace contents から新しい sandbox を始めるための状態。会話継続ではなく作業箱の再利用に効く。 Sandbox Agents は「agent 本体」と「作業用 compute」を同じものとして扱う雑設計をやめさせる
artifact 成果物 sandbox run が出す review 対象の files や output。生成しただけで本番へ昇格させない運用が必要。 Sandbox Agents は「agent 本体」と「作業用 compute」を同じものとして扱う雑設計をやめさせる
metadata filtering メタデータ絞り込み 文書属性で検索対象を制限する方法。精度調整だけでなく部署別や時期別の境界設計にも効く。 File Search は「RAG を自作するか否か」ではなく責務の切り方を問い直す
hooks フック 決まったイベントで自動実行される処理。会話内のお願いを実行境界へ移すための仕組み。 Claude Code hooks は「守ってほしいお願い」を実行境界へ移す
PostToolUse ツール実行後フック 実行後の整形、通知、監査向けイベント。危険操作の遮断には使えない。 Claude Code hooks は「守ってほしいお願い」を実行境界へ移す
permissionDecision 許可判断 hook が返す allow / deny の判定。permission mode を緩めても deny 側の制約は残せる。 Claude Code hooks は「守ってほしいお願い」を実行境界へ移す
Claude Code permissions Claude Code 権限設定 Claude Code が実行してよい操作を allow / ask / deny の rule として制御する仕組み。 Claude Code permissions は「承認が出るから安全」という雑な期待を壊す
allow rule 自動許可ルール 手動承認なしで実行を許す permission rule。広げ過ぎると監査と安全性が弱くなる。 Claude Code permissions は「承認が出るから安全」という雑な期待を壊す
ask rule 都度確認ルール 実行前に人へ確認させる permission rule。多過ぎると承認疲れが起きる。 Claude Code permissions は「承認が出るから安全」という雑な期待を壊す
deny rule 禁止ルール 実行を止める permission rule。Claude Code permissions では allow より強い制約として扱われる。 Claude Code permissions は「承認が出るから安全」という雑な期待を壊す
settings precedence 設定優先順位 複数の設定元が重なった時にどれを優先するかの規則。deny と allow の衝突理解に必要。 Claude Code permissions は「承認が出るから安全」という雑な期待を壊す
regression 回帰不具合 更新後に以前できていたことが崩れること。AI 機能では model 更新でも起こるため、継続テストが要る。 Gemini の model 名は「性能ラベル」ではなく運用契約として読む
confused deputy 権限横取り型の代理人問題 正当な権限を持つ中継役が、別 client のために悪用される問題。remote MCP の認可設計で重要になる。 MCP Security Best Practices は「つながる」より先に、誰の権限を誰が横取りできるかを見る
token passthrough トークン素通し 受け取った token を別先へそのまま渡す危険な設計。token の宛先境界を崩しやすい。 MCP Security Best Practices は「つながる」より先に、誰の権限を誰が横取りできるかを見る
permissions.deny 拒否ルール Claude Code に特定操作を実行させない設定。秘密保護では『見つけにくさ』ではなく『読めなさ』を作る。 Claude Code settings は「見せない」ではなく「読ませない」で秘密を守る
ignorePatterns 旧除外パターン Claude Code の旧方式設定。検索や一覧から見えにくくする寄りで、現行の秘密保護の中心ではない。 Claude Code settings は「見せない」ではなく「読ませない」で秘密を守る
read operation 読み取り操作 agent がファイル内容を開いて読む処理。ここを拒否できるかが秘密保護の本体になる。 Claude Code settings は「見せない」ではなく「読ませない」で秘密を守る
sensitive files 秘密ファイル `.env`、鍵ファイル、認証情報 JSON など、agent に読ませたくない対象。 Claude Code settings は「見せない」ではなく「読ませない」で秘密を守る
configuration scope 設定スコープ managed、user、project、local のような設定の適用範囲。どこで決めたルールかを表す。 Claude Code settings は「見せない」ではなく「読ませない」で秘密を守る
Enterprise-Managed Authorization 企業管理型認可 MCP 接続を個人の都度認可ではなく、会社の認証基盤と権限ルールで配る拡張。 Enterprise-Managed Authorization は「各自で OAuth 接続」から「会社の権限設計でつなぐ」へ進める
identity provider 認証基盤 / IdP 会社のログインと権限をまとめる中心。MCP 接続を個人作業から組織統制へ寄せる要になる。 Enterprise-Managed Authorization は「各自で OAuth 接続」から「会社の権限設計でつなぐ」へ進める
secure execution environment 安全な実行環境 コード型 agent を sandbox や container の内側へ閉じ込める実行場所。 agent は一種類ではない。コードを書かせるか、JSON に閉じるかで責任が変わる
dynamic composition 動的組み立て 問題に応じて手順やツールの組み合わせをその場で変えること。柔軟さと引き換えに監査負荷が増える。 記事内参照なし
用語分類

評価・運用

品質、計測、遅延、運用監視、失敗時処理に関わる語。

8 語
英語日本語補足関連
evals 評価セット / 評価実験 モデルやプロンプト変更の品質を測るためのテスト群。AI機能の CI に近い役割を持つ。 Prompt Objects 廃止は「prompt を管理画面で育てる運用」をやめる合図
GPT-Realtime-2 は、音声UIを「会話」から実行ワークフローへ寄せる
Claude Code の品質低下報告から読む、AI coding tool 運用の現実
inference latency 推論レイテンシ リクエストから応答までの時間。UX、コスト、バックグラウンド処理設計に直結する。 Claude Code の品質低下報告から読む、AI coding tool 運用の現実
Gemini API の release notes は、仕様変更を追うための一次情報になる
Tiny Agents は、MCP 時代の agent 実装を小さく理解する入口になる
polling ポーリング 定期的に status を取りに行く方式。長時間 task の進捗追跡でよく使う。 Background mode は「長時間 reasoning を同期HTTPで待つな」という運用変更
terminal state 終端状態 それ以上進行しない最終状態。job 管理では完了、失敗、キャンセル済みをここに含める。 Background mode は「長時間 reasoning を同期HTTPで待つな」という運用変更
infrastructure noise インフラ由来ノイズ benchmark score に混ざる runtime 側の揺れ。モデル能力差と誤読しやすい。 agentic coding benchmark の 2点差は、モデル差ではなく RAM の差かもしれない
infra error rate インフラエラー率 model 能力とは別に環境都合で失敗する割合。benchmark の小差を読む前に確認すべき。 agentic coding benchmark の 2点差は、モデル差ではなく RAM の差かもしれない
max_num_results 最大取得件数 取得件数を抑えて token と latency を制御する設定。絞り過ぎると答えの品質が落ちうる。 File Search は「RAG を自作するか否か」ではなく責務の切り方を問い直す
Modified Abuse Monitoring 変更版 abuse monitoring 不正利用監視ログから customer content を外す制御。機能側の状態保存とは別問題。 Zero Data Retention は「何も残らない」ではなく、「何がどこに残るかを切り分ける」話
用語分類

ベンダー固有

OpenAI、Anthropic、Google、Hugging Face など固有名に寄る語。

6 語
英語日本語補足関連
outputs 旧 outputs スキーマ legacy response の平坦な出力配列。Gemini Interactions API では `steps` への移行で読み替えが必要になった。 Gemini Interactions API の `steps` 移行は、SDK 更新より parser 棚卸しが本体
OIDC subject token OIDCサブジェクトトークン 外部 identity provider が発行する JWT。OpenAI 側では workload 属性検証の入力になる。 Workload identity federation は「OpenAI API key を配る前提」を崩す
short-lived access token 短命アクセストークン OpenAI API 呼び出しに使う有効期限の短い token。漏えい時の持続被害を減らす。 Workload identity federation は「OpenAI API key を配る前提」を崩す
prompt objects 保存済みプロンプトオブジェクト API から参照していた OpenAI 側の managed prompt 資産。本番運用では code 管理へ戻す方向が示された。 Prompt Objects 廃止は「prompt を管理画面で育てる運用」をやめる合図
v1/prompts Prompt APIエンドポイント OpenAI の prompt object 管理 API。2026-11-30 に shutdown 予定と案内されている。 Prompt Objects 廃止は「prompt を管理画面で育てる運用」をやめる合図
API restrictions API制限 どの Google API に使えるかを絞る設定。shared key を Gemini 用と他用途で兼用しにくくする。 Gemini API key の制限強化は、雑な PoC 鍵運用を 403 に変える