付録: 今日から使えるAIツール集+用語集
この付録を読むと: 2026年4月時点で実際に使えるAIツールをカテゴリ別に把握でき、よく耳にするAI用語50語の意味が一気にわかります。教科書本編で登場した用語の「辞書」として繰り返し参照してください。
Part 1: AIツールカタログ(2026年版)
AIツールは現在、数千種類が存在します。ここでは「まず試すべき主要ツール」を厳選してカテゴリ別に紹介します。料金は2026年4月時点の情報です。為替変動により円換算額は変わる場合があります。
文章生成・チャット
日常業務で最も使われるカテゴリです。メール作成・要約・アイデア出し・翻訳など、幅広い用途に対応します。
| ツール名 | 提供元 | 料金目安 | おすすめ用途 |
|---|---|---|---|
| ChatGPT | OpenAI | 無料〜$20/月(Plus) | 汎用チャット・文章生成・画像生成(DALL-E連携) |
| Claude | Anthropic | 無料〜$20/月(Pro) | 長文処理・コード作成・細かい指示への忠実な対応 |
| Gemini | 無料〜$19.99/月(Advanced) | Google Workspace連携・Webリサーチ統合 | |
| Perplexity | Perplexity AI | 無料〜$20/月(Pro) | AI検索・最新情報付きの回答・出典付き調査 |
| Copilot | Microsoft | 無料〜$30/月(Pro) | Office製品との連携・企業内利用 |
使い分けの目安:
- 何でも試したいならまず ChatGPT(最も情報が多い)
- 長い文書の要約・編集なら Claude(10万トークン超えの長文でも安定)
- Google DocsやGmailと連携したいなら Gemini
- 最新ニュースをソース付きで調べたいなら Perplexity
画像生成
テキストを入力するだけで画像を生成するツール群です。デザイン・マーケティング素材・SNS画像などに活用できます。
| ツール名 | 提供元 | 料金目安 | おすすめ用途 |
|---|---|---|---|
| Midjourney | Midjourney, Inc. | $10〜$60/月 | 高品質なアート・ビジュアル系コンテンツ |
| DALL-E 3 | OpenAI | ChatGPT Plus込($20/月) | 文章との連携・リアルなシーン生成 |
| Stable Diffusion | Stability AI | 無料(オープンソース) | ローカル動作・カスタマイズ・商用自由度が高い |
| Flux | Black Forest Labs | 無料〜従量課金 | 高精細・フォトリアル系の画像 |
| Adobe Firefly | Adobe | 無料(月25クレジット)〜約1,580円/月 | 商用利用安全・Adobe製品との連携 |
使い分けの目安:
- 芸術的で個性的なビジュアルなら Midjourney(業界でも人気No.1)
- 商用利用の安全性を重視するなら Adobe Firefly(学習データは著作権クリア)
- 無料でとにかく試したいなら Stable Diffusion(自前PCで動かせる)
- ChatGPTから離れずに使いたいなら DALL-E 3
動画生成
2024年以降に急成長したカテゴリ。テキストや画像から動画クリップを自動生成します。
| ツール名 | 提供元 | 料金目安 | おすすめ用途 |
|---|---|---|---|
| Runway Gen-4 | Runway AI | $15〜$95/月 | 映像制作・高品質クリップ生成 |
| Kling AI | Kuaishou | $5〜$10/月 | コスパ最強・長尺動画・日本語UIあり |
| Veo 2 | Google DeepMind | Google One AI Premiumプラン込 | 高品質・Google Workspace連携 |
| Sora 2 | OpenAI | ※2026年3月提供終了 | (参考情報として記載) |
注意: Sora 2はOpenAIが2026年3月に提供を終了しました。動画生成を試すなら現時点では Kling AI(コスパ優秀)か Runway Gen-4(品質重視)をおすすめします。
音声・音楽
音声読み上げ・音楽生成・文字起こし(Whisper)など、耳と声に関わるツールです。
| ツール名 | 提供元 | 料金目安 | おすすめ用途 |
|---|---|---|---|
| Whisper | OpenAI | 無料(オープンソース)/ APIは$0.006/分 | 音声→テキスト変換・多言語文字起こし |
| ElevenLabs | ElevenLabs Inc. | 無料(月1万クレジット)〜$22/月 | 高品質な音声合成・多言語ナレーション |
| Suno | Suno AI | 無料(1日10曲)〜$8/月 | テキストから楽曲生成・ボーカル付き |
| Udio | Udio | 無料(月100曲)〜$10/月 | 高品質な音楽生成・詳細なジャンル指定 |
| VOICEVOX | ヒホ(個人開発) | 完全無料 | 日本語音声合成・商用利用可・ずんだもん等 |
使い分けの目安:
- 会議や動画の文字起こしなら Whisper(精度・多言語対応ともにトップ級)
- 動画ナレーションや多言語音声なら ElevenLabs(自然な人間らしい声質)
- BGMや効果音を作りたいなら Suno または Udio
- 日本語キャラクター音声なら VOICEVOX(完全無料で商用利用OK)
コーディング支援
プログラミングを補助するAIツールです。コード補完・バグ修正・コード生成など、エンジニアの生産性を大幅に向上させます。
| ツール名 | 提供元 | 料金目安 | おすすめ用途 |
|---|---|---|---|
| GitHub Copilot | GitHub(Microsoft) | $10/月(個人) | VSCode等でのリアルタイムコード補完 |
| Claude Code | Anthropic | $20〜(Claudeプラン従量) | ターミナルベースの自律的コーディングエージェント |
| Cursor | Anysphere | 無料〜$20/月(Pro) | AI統合IDE・コードベース全体の理解と編集 |
| Devin | Cognition AI | $20/月〜(ACU従量課金追加) | 自律的なソフトウェアエンジニアAIエージェント |
| Windsurf | Codeium | 無料〜$15/月(Pro) | AI IDE・Cursorの競合・無料枠が手厚い |
使い分けの目安:
- 今使っているIDEをそのまま使いたいなら GitHub Copilot(VSCode・JetBrains対応)
- 本格的なAI IDEに乗り換えるなら Cursor(最もシェアが高い)
- ターミナルから複雑な作業を自律実行させたいなら Claude Code
- 無料でAI IDEを試したいなら Windsurf
ビジネス・プレゼン
資料作成・会議・ドキュメント管理など、日常のオフィス業務に特化したAIツールです。
| ツール名 | 提供元 | 料金目安 | おすすめ用途 |
|---|---|---|---|
| Notion AI | Notion Labs | Businessプラン込($20/月) | ドキュメント・データベース管理とAI統合 |
| Gamma | Gamma | 無料(400クレジット)〜$8/月 | プロンプトからスライド自動生成 |
| Beautiful.ai | Beautiful.ai | $12/月〜 | デザインが自動最適化されるプレゼン作成 |
| Otter.ai | Otter.ai | 無料(月600分)〜$16.99/月 | 会議の自動文字起こし・要約・共有 |
使い分けの目安:
- プロンプト1つでスライドを作りたいなら Gamma(最速・無料枠あり)
- 議事録を自動で取りたいなら Otter.ai(Zoom・Teams・Meet連携)
- チームのナレッジ管理と兼ねたいなら Notion AI
デザイン
グラフィック・UI/UX・ブランディングデザインを支援するAIツールです。
| ツール名 | 提供元 | 料金目安 | おすすめ用途 |
|---|---|---|---|
| Canva AI | Canva | 無料〜$12/月(Pro) | SNS画像・プレゼン・バナー・マーケ素材 |
| Figma AI | Figma | 無料〜$15/月(Pro)+ AIは追加料金 | UI/UXデザイン・プロトタイプ・開発連携 |
| Adobe Sensei | Adobe | Creative Cloudプランに含む | Photoshop・Illustratorの生成塗りつぶし等 |
使い分けの目安:
- デザイン未経験でもSNS素材を作りたいなら Canva AI(最も入門しやすい)
- UIデザインの現場で使うなら Figma AI(業界標準ツール)
- Adobe製品ユーザーなら Adobe Sensei(既存ワークフローに自然統合)
Part 2: AI用語集(50語)
本教科書で登場した用語、およびAIに関する会話でよく出る用語を50語、アルファベット順に解説します。各用語に読み方(カナ)を付けています。
A
AGI(エージー・アイ)
Artificial General Intelligence(汎用人工知能)の略。特定のタスクに特化した現在のAIとは異なり、人間と同等以上にあらゆる知的タスクをこなせるAIを指します。2026年現在まだ実現しておらず、「いつ達成されるか」が研究者の間で活発に議論されています。
API(エーピーアイ)
Application Programming Interface の略。ソフトウェア同士が会話するための「窓口」です。「ChatGPTのAPIを使う」とは、ChatGPTの機能を自分のアプリやシステムから呼び出すことを意味します。
Attention(アテンション)
文章中の「どの単語が今最も重要か」を計算する仕組みです。「私はりんごが好きで、それをよく食べます」という文で、「それ」が「りんご」を指すとわかるのはAttentionが機能しているからです。Transformerの中心的な概念です。
B
Backpropagation(バックプロパゲーション)
誤差逆伝播法とも呼ばれます。AIが間違えた際に、「どのパラメータがどれだけ悪かったか」を後ろ向きに計算して修正する学習アルゴリズムです。ニューラルネットワークの学習を支える基本技術です。
BERT(バート)
Bidirectional Encoder Representations from Transformers の略。Googleが2018年に発表したTransformerベースの言語モデルです。文章を前後両方向から理解する特性を持ち、検索エンジンの精度向上に大きく貢献しました。
Bias(バイアス)
AIの学習データや設計に起因する偏りです。学習データに男性医師の事例ばかりあると、AIが「医師 = 男性」と判断しやすくなります。公平性(Fairness)の観点から重要な課題です。
C
Chain-of-Thought(チェーン・オブ・ソート)
「考えるプロセスを段階的に示させる」プロンプト技法です。「ステップ・バイ・ステップで考えてください」と指示するだけで、AIの回答精度が大幅に向上します。略称: CoT。
CNN(シーエヌエヌ)
Convolutional Neural Network(畳み込みニューラルネットワーク)の略。画像認識に特化したニューラルネットワークの構造です。画像を小さな領域に分けて特徴を抽出する仕組みが、目の視覚野に似ていることから「視覚野型AI」とも呼ばれます。
D
Diffusion Model(ディフュージョン・モデル)
画像生成AIの主要な技術方式です。ノイズ(砂嵐)を少しずつ取り除いて画像を生成するアプローチで、Stable Diffusion・DALL-E・Midjourneyなどが採用しています。「ノイズ除去」という直感に反するアイデアが高品質な画像生成を可能にしています。
E
Embedding(エンベディング)
テキストや画像などを数値のベクトル(座標)に変換したものです。「猫」と「ネコ」は表記が違っても意味が近いため、Embedding空間では近い座標に置かれます。検索・推薦・類似度計算の基盤となる技術です。
Epoch(エポック)
学習データ全体を1回学習した単位です。「100 epoch学習する」とは、全データを100周学習させることを意味します。多すぎると過学習(Overfitting)が起きる可能性があります。
F
Few-shot(フュー・ショット)
プロンプト内に少数の例を示してAIに学習させる方法です。「以下の例のように答えてください:(例文3つ)」という形式がFew-shotの典型です。対義語はZero-shot(例なし)です。
Fine-tuning(ファインチューニング)
事前学習済みモデルを特定のタスクや業界用語向けに追加学習させることです。汎用の言語モデルを医療文書や法律文書に特化させる際などに使います。学習コストが高い代わりに高精度が期待できます。
Foundation Model(ファウンデーション・モデル)
GPTやClaudeのように、大量のデータで事前学習され、多様なタスクに応用できる大規模なAIモデルを指します。「基盤モデル」とも呼ばれます。ここからFine-tuningして用途に特化させます。
G
GAN(ジーエーエヌ)
Generative Adversarial Network(敵対的生成ネットワーク)の略。生成器(本物らしいデータを作る)と識別器(本物か偽物かを判定する)が競い合うことで、リアルなデータを生成する仕組みです。Diffusion Modelが台頭する以前は、画像生成の主流技術でした。
GPT(ジーピーティー)
Generative Pre-trained Transformer の略。OpenAIが開発したTransformerベースの大規模言語モデルシリーズです。GPT-1(2018年)→ GPT-4(2023年)→ GPT-4o(2024年)と進化を続けています。
H
Hallucination(ハルシネーション)
AIが事実とは異なる情報を、あたかも真実であるかのように自信満々に出力する現象です。日本語では「幻覚」と訳されます。存在しない論文を引用したり、実在しない人物のプロフィールを生成したりするケースが代表例です。AIの出力を鵜呑みにしてはいけない最大の理由です。
Hyperparameter(ハイパーパラメータ)
学習率・バッチサイズ・エポック数など、AI学習の「やり方」を決める設定値です。モデルが自動で学習するパラメータとは区別され、人間が設計段階で決める必要があります。
L
LLM(エルエルエム)
Large Language Model(大規模言語モデル)の略。GPT・Claude・Geminiなど、数千億パラメータ規模の言語モデルを指します。テキストを入出力の中心に据えており、現在の生成AIブームの主役です。
LoRA(ローラ)
Low-Rank Adaptation の略。Fine-tuningを少ないリソースで効率的に行う手法です。モデル全体を再学習するのではなく、小さなアダプタ層だけを学習するため、個人のPCでも手軽に実施できます。画像生成AIのスタイル転移によく使われます。
M
MCP(エムシーピー)
Model Context Protocol の略。Anthropicが2024年に発表した、AIが外部ツール(ファイル・DB・API・ブラウザなど)を標準的な方法で操作するためのプロトコルです。「AIとツールをつなぐUSB規格」のようなもので、AIエージェント構築の基盤として急速に普及しています。
Mixture of Experts(ミクスチャー・オブ・エキスパーツ)
一つの大きなモデルを使う代わりに、複数の「専門家モデル」を用意し、入力に応じて最適な専門家を呼び出す方式です。略称: MoE。GPT-4はMoE方式を採用していると言われています。全専門家を常時動かさないため、効率的に高性能を実現できます。
Multimodal(マルチモーダル)
テキスト・画像・音声・動画など、複数のデータ形式(モダリティ)を同時に扱えるAIの性質です。「この写真の内容を説明して」という使い方が代表例です。GPT-4o・Gemini・Claude 3以降が対応しています。
N
Neural Network(ニューラルネットワーク)
人間の脳の神経回路を模した計算モデルです。入力層・中間層(隠れ層)・出力層で構成され、層が多いほど「深い(Deep)」ネットワークと呼ばれます。深層学習(Deep Learning)はこの多層ニューラルネットワークを使った機械学習の総称です。
NLP(エヌエルピー)
Natural Language Processing(自然言語処理)の略。コンピュータが人間の言語(テキスト・音声)を理解・生成する技術の総称です。翻訳・要約・感情分析・チャットボットなどが代表的な応用例です。
O
Overfitting(オーバーフィッティング)
学習データに特化しすぎて、未知のデータに対応できなくなる状態です。「過学習」とも呼ばれます。「テストの過去問だけ完璧に解けて、本番では全然解けない」状態と同じです。
P
Parameter(パラメータ)
AIモデルの「重みと偏り」を表す数値群の総称です。GPT-4は数千億個のパラメータを持ちます。学習によって最適化されるもので、人間に例えると「経験から蓄積された判断の傾向」に当たります。
Prompt(プロンプト)
AIへの指示文やテキスト入力のことです。「良いプロンプトを書く」ことがAIの性能を引き出す鍵であり、これを体系的に学ぶ分野をプロンプトエンジニアリングと呼びます。
R
RAG(ラグ)
Retrieval-Augmented Generation の略。AIの回答生成時に、外部のデータベースや文書を検索して参照させる手法です。「学習時のデータしか知らない」というLLMの限界を補い、最新情報や社内文書を踏まえた回答が可能になります。社内AI構築の標準パターンです。
RLHF(アールエルエイチエフ)
Reinforcement Learning from Human Feedback の略。人間の評価(これは良い回答・悪い回答)を報酬シグナルとして使い、AIを強化学習で改善する手法です。ChatGPTの品質向上に大きく貢献した技術で、AIを「人間の好みに合わせる」調整方法として標準化されています。
RNN(アールエヌエヌ)
Recurrent Neural Network(再帰型ニューラルネットワーク)の略。テキストや時系列データを、前から順番に処理する古典的な構造です。Transformerの登場以降は主役を譲りましたが、軽量さや音声処理などで今も活用されます。
Reinforcement Learning(リインフォースメント・ラーニング)
強化学習のことです。「正解を教える」のではなく、行動の結果に報酬またはペナルティを与えて、AI自身が最適行動を学んでいく方法です。囲碁AI・ゲームAI・自動運転などに使われます。
S
Self-Attention(セルフ・アテンション)
文章内の単語同士の関係性を計算するTransformerの中核機能です。「銀行(金融機関)に行った」と「川の銀行(土手)に座った」を区別できるのは、周囲の単語への注目度(Attention)を計算しているからです。
Supervised Learning(スーパーバイズド・ラーニング)
教師あり学習のことです。正解ラベル付きのデータを使ってAIを学習させる最も基本的な方法です。「これが猫、これが犬」と正解を与えて学習させ、未知の画像でも判定できるようにします。
T
Temperature(テンペラチャー)
AIの出力の「ランダム性」を制御するパラメータです。値が低い(0に近い)ほど同じ答えが出やすくなり(事実確認向き)、高い(1以上)ほど多様な出力が生まれます(創作・発想向き)。プロンプトAPIを使う際に設定できます。
Token(トークン)
AIが言語を処理する最小単位です。単語や文字の一部で、英語では約4文字が1トークン、日本語では漢字1〜2文字が1トークン程度です。「○○万トークンのコンテキストウィンドウ」という表現は、AIが一度に処理できる文章量の上限を指します。
Transformer(トランスフォーマー)
2017年にGoogleが発表した「Attention Is All You Need」論文で提唱されたニューラルネットワーク構造です。現在のほぼすべての大規模言語モデル(GPT・Claude・Geminiなど)の基盤技術です。文章を前から順番ではなく、全体を同時並列で処理できる点が革命的でした。
Transfer Learning(トランスファー・ラーニング)
転移学習のことです。大量のデータで学習済みの基盤モデルを、別のタスクに再利用する技術です。医療・法律・製造業など特定分野でのAI構築コストを大幅に削減できます。Fine-tuningはTransfer Learningの一手法です。
U
Unsupervised Learning(アンスーパーバイズド・ラーニング)
教師なし学習のことです。正解ラベルなしで、AIがデータの構造やパターンを自分で発見します。顧客のグループ化(クラスタリング)・異常検知・データ圧縮(オートエンコーダ)などに使われます。
V
Vector Database(ベクター・データベース)
Embeddingとして表現されたベクトルデータを高速に検索するためのデータベースです。RAGを構築する際の中核コンポーネントで、「意味的に近い文書を探す」という従来のキーワード検索では難しい検索を可能にします。Pinecone・Chroma・Weaviateなどが代表的なサービスです。
Vision Transformer(ビジョン・トランスフォーマー)
Transformerを画像処理に適用したモデルの総称です。略称: ViT。画像をパッチ(小さな断片)に分割してTransformerで処理します。CNNに代わる画像認識の主流技術として台頭しています。
Z
Zero-shot(ゼロ・ショット)
例を一切示さずにAIに推論させる手法です。「この文章のポジティブ/ネガティブを判定してください」という直接的な指示がZero-shotの典型です。Few-shotより簡単ですが、複雑なタスクでは精度が落ちやすいため、Chain-of-ThoughtやFew-shotと組み合わせることが多いです。
用語早見表
本付録で解説した50語を、カテゴリ別にまとめています。
基礎概念
AGI / AI / Neural Network / Parameter / Token / Transformer
学習手法
Backpropagation / Epoch / Few-shot / Fine-tuning / Reinforcement Learning / RLHF / Supervised Learning / Transfer Learning / Unsupervised Learning / Zero-shot
モデル・アーキテクチャ
BERT / CNN / Diffusion Model / Foundation Model / GAN / GPT / LLM / LoRA / Mixture of Experts / Multimodal / RNN / Vision Transformer
技術要素
API / Attention / Embedding / Hyperparameter / Self-Attention / Temperature
応用・課題
Bias / Chain-of-Thought / Hallucination / MCP / NLP / Overfitting / Prompt / RAG / Vector Database
AIを使い始める前に覚えておきたいこと
ツールも用語も、使いながら覚えていくのが最も効率的な学び方です。
おすすめの始め方:
- まず ChatGPT か Claude を無料プランで試す(今日できます)
- 「メールの返信を書いて」「この文章を要約して」など、日常業務から試す
- うまくいかなかったら Chain-of-Thought(ステップで考えさせる)で改善
- 使いたいツールが決まったら、本付録の料金表で月額コストを確認
最後に一言: AIツールの世界は変化が速く、今日ここに書いた料金や機能は半年後に変わっている可能性があります。常に公式サイトで最新情報を確認することをおすすめします。道具を知ることよりも、道具を使って何を実現したいかを先に考えることが、AIを使いこなす近道です。
この教科書を読み終えた方へ
「世界一わかりやすいAI教科書」全15章+付録、お読みいただきありがとうございました。
この教科書を通じて伝えたかったことは一つです。
「AIは魔法でも脅威でもなく、今まで存在しなかった種類の道具が生まれた」
電卓が登場した時も、インターネットが登場した時も、人々は驚き、恐れ、やがて使いこなすようになりました。AIも同じプロセスをたどります。
違うのはスピードだけです。だからこそ、今この瞬間に理解を始めることに価値があります。
今日から一つ、試してみてください。
最終更新: 2026年4月19日