第1回:zipファイルを開くように ─ AIの正体
「魔法じゃない。圧縮と解凍。それが分かれば、使いこなせる」
※この連載では「圧縮・解凍」という比喩でAIを説明します。技術的には正確じゃない。でも、AIの本質を理解するには、この比喩が一番腑に落ちる。
ChatGPTに質問したこと、ありますか?
「明日の会議の資料、どう構成すればいい?」
「この英文メール、自然な日本語に直して」
「競合他社の強みを3つにまとめて」
質問を入力すると、すぐに答えが返ってくる。
すごい。
でも、なんで答えられるのか?
「AIだから」
それは答えになっていない。
じゃあ、AIって何だ?
魔法じゃない
AIは「考えて」いるわけじゃない。
AIは「理解して」いるわけじゃない。
人間のように思考しているわけでも、意識があるわけでもない。
じゃあ、何をしているのか?
答え:圧縮されたものを解凍している。
は?
意味が分からない?
大丈夫。今から説明する。
zipファイルの比喩
zipファイル、知っていますか?
パソコンで使うあれ。
大量のファイルを圧縮して、小さくまとめる。
メールで送るとき、よく使う。
開くと、元のファイルが出てくる。
圧縮して、解凍する。
AIも、同じだ。
何を圧縮しているのか?
インターネット上の膨大な情報。
ウェブサイト、ニュース記事、Wikipedia、論文、書籍、SNSの投稿…
想像を絶する量のテキストデータ。
それを「圧縮」した。
質問すると、何が起こるか?
関連する部分を「解凍」して返している。
「マーケティングについて教えて」
→ マーケティングに関する圧縮データを解凍
「この英文を翻訳して」
→ 翻訳パターンの圧縮データを解凍
魔法じゃない。
圧縮と解凍。
それだけ。
圧縮の仕組み
どうやって圧縮しているのか?
パターンを見つけている。
膨大な文章を読み込んで、こう学習する。
「こういう文脈では、こういう言葉が続くことが多い」
「この質問には、こういう答え方が多い」
「この話題には、こういう情報が関連することが多い」
パターン、パターン、パターン。
たとえば、「日本の首都は」と入力する。
AIは考える(いや、考えてはいないけど)。
「この文脈の後には、『東京』が続く確率が圧倒的に高い」
だから「東京」と答える。
もう少し複雑な例。
「効果的なプレゼンの方法を教えて」
AIは、過去に読み込んだ膨大なプレゼン関連の文章から、パターンを解凍する。
「プレゼンの方法を聞かれたら、こういう構成で答えることが多い」
「具体例を入れることが多い」
「箇条書きで整理することが多い」
だから、それっぽい答えが返ってくる。
これが「圧縮」の正体。
膨大な情報から、パターンを抽出して保存している。
質問されたら、そのパターンを解凍して返す。
腑に落ちる瞬間
「AIはインターネットをzip化したもの」
この比喩で、いろんなことが説明できる。
なぜ「知らない」ことがあるのか?
→ 圧縮されていないから。
zipファイルに入っていないファイルは、開いても出てこない。
当然だ。
AIも同じ。
圧縮されていない情報は、聞いても出てこない。
なぜ「古い」情報があるのか?
→ 圧縮時点の情報だから。
zipファイルには、圧縮した時点のファイルしか入っていない。
後から追加されたファイルは、入っていない。
AIも同じ。
学習した時点(圧縮時点)の情報しかない。
だから、最新ニュースは知らない。
なぜ「嘘」をつくのか?
→ 圧縮時にパターンが歪むから。
zipファイルも、圧縮しすぎると壊れることがある。
AIも同じ。
圧縮時に、パターンが歪むことがある。
「それっぽいけど、間違っている」答え。
これが「ハルシネーション」と呼ばれるもの。
AIが嘘をつこうとしているわけじゃない。
圧縮時に歪んだパターンを、解凍しているだけ。
今回の3つの洞察
-
AIは魔法じゃない。圧縮と解凍だ。
- 思考でも理解でもない。パターンの圧縮と解凍
-
インターネットの情報が圧縮されている
- 膨大なテキストからパターンを抽出して保存
-
だから、できることとできないことがある
- 圧縮されたものは出せる。されていないものは出せない
次回予告
「AIはインターネットをzip化したもの」
この比喩で、AIの正体が見えてきた。
でも、ここから大事なことが分かる。
圧縮されたものしか出てこない。
つまり、AIには「できないこと」がある。
次回は、AIの限界を見ていく。
「AIは何でも知っている」
そう思っていると、痛い目を見る。
次回:「圧縮されたものしか出てこない ─ AIの限界」