用語集

プロンプトエンジニアリング

コンテンツやカスタマーサービスなどにおいて、LLMのようなAIモデルを正確で高品質なアウトプットに導くためのプロンプトエンジニアリングの技術を習得する。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

プロンプトエンジニアリングは、人工知能(AI)モデル、特に大規模言語モデル(LLM)が望ましい出力を生成するように導くための効果的な入力(プロンプト)を作成する技術と科学である。これには、これらのモデルがどのように指示を解釈するかを理解し、明確で具体的で、正確で適切かつ有用な応答を引き出すのに十分なコンテキストを提供するプロンプトを繰り返し設計することが含まれる。AIモデルが様々なツールやワークフローに統合されるにつれて、プロンプトエンジニアリングを習得することは、その潜在能力を最大限に引き出し、単純な質問応答から複雑な創造的テキスト生成に至るまで、様々なタスクにおいて信頼性の高いパフォーマンスを確保するために極めて重要である。

プロンプト・エンジニアリングの仕組み

効果的なプロンプト・エンジニアリングは、しばしば反復プロセスである。まず、タスクの要件を分析し、対象となるAIモデルの能力と限界を理解することから始める。次にエンジニアは最初のプロンプトを設計し、それをテストし、出力を評価し、その結果に基づいてプロンプトを改良する。この改良には、より具体的な指示の追加、例の提供(数ショット学習)、望ましい出力形式の定義(JSONなど)、制約の設定、トーンの調整などが含まれる。重要なテクニックは、自然言語処理(NLP)の原理を利用することが多く、有名な論文「Attention Is All You Need」で説明されているTransformerモデルのように、学習データとアーキテクチャに影響されながら、文言がモデルの動作にどのような影響を与えるかを注意深く考慮する必要がある。

主なプロンプティング・テクニック

プロンプト・エンジニアリングでは、いくつかの戦略が一般的に採用されている:

  • ゼロショットプロンプティング:プロンプト自体に事前の例を示すことなく、モデルに直接タスクの実行を求めること。これは、学習中に得たモデルの既存の知識に依存する。ゼロショット学習を参照。
  • スモールショットプロンプティング:少数の例(入力と出力のペア)をプロンプトに直接含めることで、モデルを望ましいタスクと形式に誘導する。
  • 思考の連鎖(CoT)プロンプティング最終的な答えを出す前に、推論プロセスを分解するように促すことで、モデルに「段階的に考える」ことを促し、多くの場合、複雑なタスクのパフォーマンスを向上させる。
  • 役割プロンプティング:特定のペルソナや役割(例:「Python 専門開発者として行動する」)を採用するようモデルに指示し、応答のスタイルや内容を調整する。
  • 出力構造の指定:例えば、番号付きリスト、表、特定の言語でフォーマットされたコードなど。OpenAI Prompt Engineering Guideのようなリソースは、ベストプラクティスを提供しています。

実世界での応用

迅速なエンジニアリングは、多くのAIアプリケーションの展開を成功させるための基本である:

  1. カスタマーサービス自動化:顧客からの問い合わせに正確に対応し、特定のブランド・ボイスを維持し、複雑な問題を適切にエスカレーションするために、チャットボットや バーチャル・アシスタント用のプロンプトを設計すること。Zendesk AIのようなプラットフォームに見られるように、企業は顧客体験を向上させるためにこれらの技術を使用している。
  2. コンテンツの作成と要約: ジェネレーティブAIツール(Cohereが開発したようなものや Anthropicを使用して、マーケティングコピーの生成、Eメールの作成、長い文書の要約(テキストの要約)、さらにはGitHub Copilotのようなツールを使用してコードスニペットを生成する。

その他の用途としては、セマンティック検索エンジンのパワーアップ、インタラクティブな教育ツールの駆動、自然言語インターフェースによる高度なデータ分析などがある。

プロンプト・エンジニアリングと関連コンセプト

プロンプト・エンジニアリングを関連用語と区別することは有用である:

  • プロンプトの充実ユーザーの最初のプロンプトがLLMに到達する前に、追加のコンテキスト(例えば、RAGを使用した知識ベースから)で自動的に補強することに焦点を当てる。プロンプトエンジニアリングは、コアとなる命令を手動で作成することである。
  • プロンプトチューニング学習可能な埋め込み(ソフトプロンプト)をモデル入力に追加し、最適化するPEFT(Parameter-Efficient Fine-Tuning)手法。
  • 微調整入力プロンプトだけでなく、モデルそのものを適応させるために、特定のデータセットでさらにトレーニングを行うことで、実際のモデルの重みを更新する。

これらの技法は異なるものであるが、補完し合うこともできる。例えば、よく設計されたベースプロンプトは、微調整されたモデルで処理される前に、検索されたデータで自動的にエンリッチされるかもしれない。LangChainのようなフレームワークはこれらの異なるアプローチを統合することが多い。

コンピュータ・ビジョンにおける関連性

従来、コンピュータビジョン(CV)は自然言語処理(NLP)に比べてあまり目立たなかったが、マルチモーダルモデルやプロンプト可能なビジョンシステムの台頭により、プロンプト工学の重要性が増している。CLIPYOLO、またはYOLOEのようなモデルは、テキスト記述に基づいて物体検出や 画像分割のようなタスクを実行することができる。効果的なテキストプロンプト(例えば、「すべての "赤い車 "を検出するが、"トラック "は無視する」)を作成することは、これらのビジョン言語モデルを導くために重要なプロンプトエンジニアリングの一形態である。Ultralytics HUBのようなプラットフォームは、以下を含む様々なモデルとのインタラクションを容易にします。 Ultralytics YOLOのようなモデル YOLOv8YOLO11のようなモデルでは、インターフェイスを通じてタスクを定義する場合、特にモデルがよりインタラクティブな機能を持つようになればなるほど、プロンプトエンジニアリングの原則から恩恵を受けることができる。

すべて読む
OSZAR »