AI(人工知能)
Artificial Intelligence
人間の知的な振る舞い(学習・推論・認識・判断)をコンピュータで再現する技術の総称です。近年は機械学習、特にディープラーニングを指すことが多くなっています。
オーケストレーション、LLM、RAG、AIエージェントなど、 AIにまつわる用語をわかりやすく解説します。
Artificial Intelligence
人間の知的な振る舞い(学習・推論・認識・判断)をコンピュータで再現する技術の総称です。近年は機械学習、特にディープラーニングを指すことが多くなっています。
AI Agent
目標を与えると、自ら計画を立て、ツールを使い、複数のステップを実行して達成しようとするAIです。単発の応答にとどまらず、自律的にタスクを進めます。
AI-assisted Development
Claude CodeやGitHub CopilotなどのAIツールを使い、コード生成・レビュー・リファクタリングを効率化する開発スタイルです。生産性を大きく高めます。
Application Programming Interface
外部のプログラムからAIモデルの機能を呼び出すための接続口です。多くの生成AIはAPI経由で自社サービスやアプリに組み込めます。
Chain of Thought
答えに至る途中の推論ステップを言語化させることで、複雑な問題の正答率を高める手法です。「順を追って考えて」と促すのが典型です。
Claude Fable 5
Anthropicが2026年に発表した、Mythosクラスの能力を安全機構付きで一般向けに提供するモデルです。コーディング性能の高さと、単一のゴールで何日も走り続ける長時間の自律稼働を特長とします。
Claude Mythos
Anthropicが2026年に発表したフロンティアAIモデルです。長年見つからなかった重大な脆弱性を自律的に発見するなど突出した能力を持つ一方、その強力さゆえ一般公開されず、限られた組織にのみ提供される限定モデルとして知られます。
Few-shot / Zero-shot
プロンプト内に例を数個示して学習させるのがFew-shot、例を与えずタスクを指示するのがZero-shotです。例示によって精度が向上することがあります。
Large Language Model
膨大なテキストで訓練された、自然言語を理解・生成する大規模なモデルです。GPTやClaude、Geminiなどが該当し、対話や要約、コード生成に利用されます。
Model Context Protocol
AIモデルが外部のツールやデータソースに接続するためのオープンな標準プロトコルです。連携を共通化し、エージェント開発を効率化します。
MLOps / LLMOps
機械学習・LLMを用いたシステムを継続的に開発・運用するための仕組みやプラクティスです。デプロイ、監視、評価、改善のサイクルを支えます。
Retrieval-Augmented Generation
外部の知識ベースから関連情報を検索し、その内容をプロンプトに加えて回答を生成する手法です。最新情報や社内データを根拠にでき、ハルシネーションを抑えられます。
ReAct (Reasoning + Acting)
推論(Reasoning)と行動(Acting)を交互に繰り返し、思考しながらツールを使って課題を解くエージェントの設計パターンです。
Reinforcement Learning from Human Feedback
人間の評価を報酬として強化学習を行い、モデルの応答を人の好みに沿うよう調整する手法です。安全性や有用性の向上に用いられます。
Transformer
自己注意機構(Attention)を中心とした深層学習アーキテクチャです。並列計算に優れ、現在のほぼ全てのLLMの基盤となっています。
Attention
入力の中でどの要素に注目すべきかを動的に重み付けする仕組みです。Transformerの中核技術で、長い文脈の関係性を捉えるのに役立ちます。
Orchestration
複数のAIモデル・ツール・処理ステップを連携させ、全体のワークフローを制御・調整する仕組みです。役割分担や実行順序を管理し、複雑なタスクを実現します。
Guardrails
AIの出力が不適切・危険・的外れにならないよう制約や検証を設ける仕組みです。入出力のフィルタリングやポリシー適用で安全性を担保します。
Grounding
モデルの回答を信頼できる外部情報や事実に紐づけることです。出典の提示によって、回答の正確性と検証可能性を高めます。
Context Window
LLMが一度に処理できる入力+出力のトークン数の上限です。大きいほど長い文書や会話履歴を扱えますが、その分コストやレイテンシが増えます。
Context Engineering
LLMの推論に渡す情報・文脈の全体を設計・最適化する技術です。会話の要約、不要な情報の削減、サブエージェントへの委譲などで、限られたコンテキストを効率よく使い、出力品質を高めます。
System Prompt
モデルの役割や振る舞いの方針を定義する、会話の前提となる指示です。ユーザーの入力より優先され、応答の一貫性を保つ役割を持ちます。
Function Calling / Tool Use
LLMが外部の関数やAPIを呼び出して、計算・検索・データ取得などを実行する仕組みです。エージェントが現実世界と連携するための基盤技術です。
Deep Learning
多層のニューラルネットワークを用いた機械学習の一分野です。画像認識や自然言語処理で高い精度を発揮し、現在のAIブームの中核を担っています。
Dataset
学習や評価に用いるデータの集合です。前処理やラベル付け、品質管理がモデル性能を左右し、適切な分割(訓練・検証・テスト)が重要です。
Token
LLMがテキストを処理する際の最小単位です。単語や単語の一部、記号などに分割され、入出力の長さや料金はトークン数で計算されます。
Token-based Pricing
入力・出力のトークン数に応じて料金が決まる課金方式です。多くの生成AI APIで採用され、コスト管理にはトークン数の見積もりが欠かせません。
Neural Network
人間の脳の神経細胞(ニューロン)を模した数理モデルです。入力層・隠れ層・出力層からなり、層を重ねることで複雑なパターンを表現できます。
Harness Engineering
AIエージェントに「何を見せ、どこまで許し、どう評価し、どう運用するか」という実行環境(ハーネス=馬具)全体を設計する取り組みです。モデル単体ではなく、能力を引き出しつつ安全性と再現性を担保する環境づくりに焦点を当てます。
Bias
学習データやアルゴリズムに含まれる偏りが、出力の不公平や誤りとして現れる現象です。公平性の観点から、データ収集や評価の段階で注意が必要です。
Vibe Coding
厳密な仕様書ではなく「こんな雰囲気・操作感にしたい」という曖昧な意図を自然言語でAIに伝え、生成されたコードを実行結果を見ながら改善していく開発スタイルです。2025年にAndrej Karpathy氏が提唱し、試行回数の多さと開発の速さが特長です。
Parameter
モデルが学習を通じて獲得する重みの値です。数(例: 数十億〜数千億)が多いほど表現力が高まる傾向がありますが、計算コストも増加します。
Hallucination
LLMが事実と異なる内容をもっともらしく生成してしまう現象です。RAGや根拠提示、出力の検証などで対策します。
Human-in-the-Loop
AIの処理の要所に人間の確認・承認を組み込む設計です。重要な判断や不可逆な操作の前に人がチェックし、安全性と品質を担保します。
Fine-tuning
事前学習済みモデルを、特定タスクや独自データで追加学習させて最適化する手法です。専門用途や独自のトーンに合わせた応答を実現します。
Prompt
LLMに与える指示や質問の文章です。書き方次第で出力の品質が大きく変わるため、目的を明確に伝えることが重要です。
Prompt Engineering
望ましい出力を引き出すためにプロンプトを設計・改善する技術です。役割設定、例示、出力形式の指定などのテクニックがあります。
Vector Database
埋め込みベクトルを格納し、意味的な類似度で高速に検索できるデータベースです。RAGの検索基盤として利用されます。
Multi-Agent
役割の異なる複数のエージェントが協調・分業して、単体では難しい複雑なタスクを解決するアプローチです。レビュー役と実装役を分けるなどの構成が例です。
Multimodal
テキストだけでなく画像・音声・動画など複数種類の入力を扱えるモデルやAIを指します。画像を見て説明する、図表を読み取るといった用途に対応します。
Loop Engineering
AIエージェントに毎回プロンプトを手で打つのをやめ、エージェントを自律的に回し続ける「ループ(仕組み)」そのものを設計する考え方です。2026年6月にX上の投稿をきっかけに広まり、人間の仕事の重心が「指示」から「設計」へ移ったことを表します。
Latency
リクエストを送ってから応答が返るまでの遅延時間です。ユーザー体験に直結し、モデル選定やストリーミング表示で改善を図ります。
Workflow Automation
定型的な業務フローをAIやツール連携で自動実行する仕組みです。n8nやGitHub Actionsなどと組み合わせ、人手の作業を削減します。
Temperature
生成の多様性を調整するパラメータです。低いと安定的で決定的な出力に、高いと創造的でばらつきのある出力になります。
Overfitting
学習データに過剰に適合し、未知のデータに対する性能(汎化性能)が下がってしまう状態です。正則化やデータ拡張などで抑制します。
Training Data
モデルの訓練に使うデータのことです。量と質がモデルの性能を大きく左右し、偏りがあるとバイアスの原因になります。
Foundation Model
大規模データで事前学習され、さまざまなタスクに応用できる汎用モデルです。ファインチューニングやプロンプトで個別用途に適応させて使います。
Machine Learning
明示的にルールを記述する代わりに、大量のデータからパターンや規則性を自動的に学習させる手法です。学習結果を使って未知のデータに対する予測や分類を行います。
Reinforcement Learning
エージェントが環境と試行錯誤を繰り返し、報酬を最大化する行動を学習する手法です。ゲームAIやロボット制御、LLMの調整(RLHF)にも応用されます。
Supervised Learning
入力と正解(ラベル)のペアを使ってモデルを訓練する手法です。スパム判定や価格予測など、正解が用意できるタスクに適しています。
Unsupervised Learning
正解ラベルを与えず、データそのものの構造や類似性をモデルに見つけさせる手法です。クラスタリングや次元削減などに用いられます。
Autonomous Agent
人間の逐次的な指示なしに、目標に向けて自ら判断・行動を継続するエージェントです。自由度が高い反面、ガードレールや監視の設計が重要になります。
Distillation
大きなモデル(教師)の知識を小さなモデル(生徒)に移し、軽量で高速なモデルを作る手法です。精度を保ちつつ運用コストを下げられます。
Inference
学習済みのモデルに入力を与え、予測や生成結果を得る処理です。学習(トレーニング)と対になる概念で、実運用時のコストやレイテンシに直結します。
Inference Cost
モデルを実行して結果を得る際にかかる計算・料金のコストです。モデルサイズやトークン数、リクエスト量に応じて増減します。
Generative AI
テキスト・画像・音声・コードなどの新しいコンテンツを生成するAIの総称です。LLMや画像生成モデルが代表例で、業務活用が急速に広がっています。
Evaluation
モデルやプロンプト、エージェントの品質を測定・比較する仕組みです。テストケースや指標を定義し、改善の効果を定量的に確認します。
Embedding
テキストなどの意味を数値ベクトルに変換したものです。意味が近いものはベクトル空間でも近くなり、検索やRAG、類似度計算の基盤になります。
Quantization
モデルの重みを低い精度(例: 32bit→8bitや4bit)で表現し、メモリ使用量と計算量を削減する手法です。エッジ環境やローカル実行で重宝します。