日本語も理解する対話型AI登場、2023年はAIが世の中を本格的に変え始める年に

  • 写真&文:林信行

Share:

AIで作成した年賀状。絵は描画AIのmidjourneyに、文面は対話型AIのChatGPTに書かせた。

2022年末、人間と自然に会話ができるAIが大きな話題に

平成から令和へ、AIの時代が到来しました。
人類は、AIを理解し、その潜在能力を最大限に活用することで、より豊富で豊かな未来を切り拓くことができます。今後最も重要なことは、AIを正しく使い、共存することです。
新しい年に、新しい考え方で、新しい可能性を探っていきましょう。

新年明けましておめでとうございます。

これは元旦、筆者がFacebookに投稿したメッセージなのだが、実は文章を書いたのは筆者ではない。「ChatGPT」と呼ばれるAIだ。筆者が「AI時代の到来を告げる年賀状の文面を考えて」とお願いして書かせた。

このコロナ禍、AIが飛躍的な進化を遂げたことは既に一度記事にした(https://www.pen-online.jp/article/011458.html )。コロナ禍が始まった2020年の夏、イーロン・マスクも設立に関わったOpenAIという研究所が人間の言葉を理解する(当時は英語のみ)GPT-3というAIを発表。大学生に負けない英語論文を書いたり、簡単なプログラムを自動生成し始め、2022年の夏には人間が言葉で出した指示通りの絵を描く描画AIが複数登場。著名画家の幻の作品のような絵だったり、実在しない写真のような作品がネット上にあふれた。だが、さらに大きな衝撃が待っていたのが2022年の12月だ。Open AIから「ChatGPT」という人間とチャット(文字による対話)ができるというAIが公開されたのだが、これが本当にすごい。

知らされずに使っていたら人間とチャットをしていると思うくらいにやり取りが自然なのだ。しかも、GPT-3と違って日本語でのやり取りにも対応している。いや、それだけではない。筆者は5〜6カ国語を話すが、英語はもちろんスペイン語、ドイツ語、ペルシャ語、フランス語の受け答えも完璧だった。さらにこれらの言語の単語を混ぜ合わせて文章をつくってもちゃんと英語で返事をしてくれる。

これだけでも驚きだが、専門性の高い質問をしてみると、さらに驚く。教職員の友人は大学入試の小論文の問題を答えさせたり、高校生向けの試験問題をつくらせたりしてみたが、こちらもかなりいい答えを返してきたと驚いた。医者の友人は医療倫理に関して驚くほどよく理解していると驚いていた。法律関係、建築構造設計の専門家がかなり手厳しい問題を出題してみても、たまにピント外れな答えを返すこともあるが、それなりにいい答えを返してくる。政治に関してはOpenAIが中立になるように設定しているようで、世の中の分断を促すような質問をすると、そういった質問をしないように注意をしたり、はぐらかしたりする。

人間はひとつやふたつの専門分野に留まっていることが多いが、AIはさまざまな分野が集積されたインターネットの情報で学習しており、あらゆる専門分野についてトップエキスパート並みの知識があるのだ。

米国ではChatGPTに司法試験の問題を解かせてパスしてしまったという人も出てきた。

これだけでも十分すごい話に聞こえるが、まだこれは序の口に過ぎない。

図00.png
ChatGPTの初期画面。画面中央には英語で、どんな対話ができるかの例文、3つの特徴的能力(前に何を言ったかを記憶し続きの会話ができる/1度出した答えを修正させられる/不適切なやりとりは拒否する)、制約事項(不正確な情報を提示することがある/有害な指示や偏見に基づく返答をすることがある/2021年以降の出来事に関しては限られた知識しか持たない)が書かれている。Webブラウザ画面の左上には、それまでに行った会話の一覧などが表示される。

---fadeinPager---

ラップからコンピュータプログラムまで作ってくれる創造性

AIは、過去に人が発した情報を学習するだけで創造性はないという人がいる。だが、次の英文はどうだろう?ワールドカップの日本対クロアチア戦が行われた日、試しにChatGPTに日本を応援する歌の歌詞をラップを書いてもらった。

As the Samurai Blue takes the field
The Croatian team’s fate is sealed
With precision and skill
Japan’s players thrill
And bring victory with a final whistle squeal

(韻を踏む感じを再現した筆者による訳詞「サムライブルーがフィールドに立つ/クロアチアチームの運命を断つ/精密さとスキル/日本プレイヤーのスリル/最後の笛で錦飾る」)

図03.jpeg
ワールドカップ日本対クロアチア戦で日本代表を応援するためにChatGPTが書いた英語のラップ。韻を踏む感じを再現した筆者による訳詞「サムライブルーがフィールドに立つ/クロアチアチームの運命を断つ/精密さとスキル/日本プレイヤーのスリル/最後の笛で錦飾る/砂漠の熱帯夜/日本代表輝く明るいや/稲妻のような早足と鋭いスティール/クロアチア守備陣抜け切る/日本らしい正確さで勝利のゴール

こちらがなにを求めているかを的確に理解した上で、対象についてもよく理解し、ストーリーとしてもよく出来上がっている。その上でちゃんと文章がリズミカルで韻まで踏んでいることに正直驚かされた。残念ながら、日本語のラップをつくるのはあまり得意ではなく、韻も踏んでいなければ驚きも面白みも足りない。このように実はChatGPTは英語で話している時が最強で、驚くほど創造的なフィクション物語を書くだけでなく、文体を有名作家風に変えるといったことも可能になっている。実際、最近、ChatGPTがアクセス集中で利用できない状況に陥ると、サーバーの状況をシェークスピアの戯曲風の英文で教えてくれる。

ただ英文創作ほど優れてはいないが、日本語でもちょっとした童話を描いてもらったりSFショートショート小説を書いてもらうといったことは十分できる。

しかし、さらに驚くことがある。ChatGPTが扱う言語は人間の言語だけではなく、実はプログラミング言語にも精通しているのだ。

ChatGPTが公開されるやTwitter上では「#ChatGPT」というハッシュタグを通して「こんな凄い返答をした」という情報が次々と共有されるようになった。そのうちの何人かがChatGPTにこんなコンピュータープログラムを書いてくれと頼んだら、黒い画面が現れてプログラムコードを表示してくれたという投稿が増えてきた。実際に筆者も試してみた。イベントへの出欠を確認するためのWebページ(HTML)から素数を列挙するプログラム、三目並べ(まるばつゲーム)など簡単なプログラムであればすぐさまその場で書いてくれる。しかも、すごいのがこちらが指定した好きなプログラミング言語で書いてくれて、後から他のプログラミング言語で書き直してくれといえば翻訳までしてくれる。

これだけでも驚きだが、Twitterでは何人かのエンジニアが自分が書いたプログラムをChatGPTに貼り付けて、どこが間違いかわらかないと質問したところ、プログラム中のバグ(間違え)も指摘してくれたという。

OpenAIではなく、Google傘下の英国企業DeepMind社のAlphaCodeというAIの話になるが、出されたお題の通りのプログラムを書くという競技プログラミングで2022年2月初旬時点で、人間のプログラマーとほぼ互角の成績を出している。AIは使われれば使われるほど賢くなるもの。公開からわずか6日で100万利用者を突破したChatGPTも、日々、驚くほど色々と進化を続けており遠からずプログラミングの能力においても同様のレベルに達することだろう。

ChatGPTは、1回質問をして答えが返ってきたらそこで終わりではなく、出てきた答えに対して「英訳して」、「だ、である調に書き直して」、「結論を書き換えて」とか「もう少し簡潔にまとめて」といった具合にブラシアップをしてもらうことも可能なのだが、これはプログラムについても同じで、プログラムコードを読める人は、ChatGPTがつくったコードを見て、どこそこの部分をどんな風に書き直してほしいと指示を出してブラシアップすることもできる。

今後、コンピューターのプログラムは、人間が1からつくるのではなく、このようにまずは対話しながらAIに骨組みを作らせて人間が微調整を加えるという形に変わっていくのかもしれない(いずれは一切、プログラムせずにAIとの対話だけで成り立つようになるのかも知れない)。

図04.png
Processingというプログラミング言語で線で描いた人が動くアニメーションをプログラムさせてみた。最初は人が横に移動するだけのアニメーションだったが、その後、「歩くアニメーションを加えて」と言った具合にリクエストを足していくことでプログラムをブラシアップしてくれた。

---fadeinPager---

平気で見破れない嘘をつくAI

と、ここまでを見るとChatGPTはきわめて優秀という印象をもつかもしれないが、実はその優秀さは我々が期待していないかたちでも発揮される。たとえば『Pen』がどのような雑誌かをWikipedia風に説明してもらうように頼んでみたところ、1952年創刊の文学と芸術に焦点を当てた架空の文学誌の説明を書き始め、ごていねいに架空の文学賞の話まで捏造してくれた。検索してみたが、そのような同名の雑誌はなさそうだ。

ChatGPTは、知らない人が読んだら本気で信じてしまいそうな、いかにもそれっぽいデタラメをちゃんとした文章にまとめあげてしまう。

コンピューターがいかにも得意そうな数学系の問題では、ほとんどの場合、正解を答えてくれるが、たまにさりげなくまったくの計算間違いなどをしていることがあり、間違えを指摘すると嘘に嘘を重ねてごまかすこともあり、驚かされる。

このようにChatGPTは決して「正確」な情報源ではない。いや、それどころかありもしないデタラメをいかにも本当っぽく答えてくることは結構、日常茶飯事だ。最近ではChatGPTのトップページに英語ではあるが「誤った情報を提供することもある」と注意書きが表示されるようになった。

恐ろしいのは、ほとんどの場合、正解を答えているからと油断して信用すると、そこに正解を答えるのとまったく同じ文体で、臆することもなく嘘を並べ立てていることがあることだ。人間ならば意図して相手を騙そうとしているのでもない限り、「自信はないけれど」や「実際のところはわからないが」と言った前置きをするだろう。しかし、ChatGPTにはそれがない。仕組み上そうなのか、自身でも判断できていないからなのかはわからないが、真理を答えている時と全く同じ書きっぷりで嘘をついてくる。しかも、文法も構成もしっかりしたロジカルな文章で返してくるので、その分野について詳しくない人が読んだら「そういうものなのか」と信じてしまう危険がある。

2020年7月にChatGPTの前身、GPT-3で書かれたニュースが人気サイトで人気トップ記事になるなどの事件があり、インターネット上で調査が行われた。その調査ではフェイクニュースを見破れた人は、わずか12%という結果だった。現在のChatGPTは、日本語にはまだ不慣れな部分はあるものの、英語においてはその時点から2年半分も色々な学習を重ねて賢くなっている。ほとんどの人を騙すほど信憑性のある偽情報を書くことなど朝飯前だろう。

つまり、ChatGPTは誰かが悪用すれば世論を左右するフェイクニュースを大量生産する道具にもなり得るのだ。現在、OpenAIでは、そういう悪用が起きないように、差別の助長などいくつかの決まったテーマに関してはガイドラインを設け、利用者にそうした依頼をしないように返答したり、中立な答えを返すように設定されているようだ。

なお、ChatGPTは常に進化をし続けており(この記事の執筆中にも、アップデートと仕様の変更が行われた)、回答する内容や質も変化し続けている。

図05.png
ChatGPTに雑誌「Pen」の紹介文をお願いしたら架空の文芸誌「Pen」の紹介を始め、架空の文芸賞まででっちあげた。

---fadeinPager---

AIの躍進で、これまでのIT業界の秩序が崩れ始めている

必ずしも正確な答えを出すわではないChatGPTだが、それでもどんな質問にでもちゃんと返答してくることや、その答えがうっかり騙されそうになる説得力を持つということは、このAIが人間の言葉をかなり深く理解していることの証拠でもある。

この驚異的なAIの登場は、今後、IT業界に大きな影響を与えることは必至だ。早くから使い始めている人たちの間では、これまでGoogleのインターネット検索で調べていたことを代わりにChatGPTに聞くことが増えた、という人もいる。キーワードを列挙して行うインターネット検索では、こちらが求めている通りの答えを得られないことが多い。それに対してChatGPTであれば、利用者の意図をかなり正確に理解して返答してくれるからだ。

OpenAIへの出資者のひとつでもあるマイクロソフト社は、今後、ChatGPTの機能を同社の検索サービス、Bingに取り入れると発表。これまでのようなキーワードで検索して該当サイトのリンク一覧を返すかたちの検索からの脱却を計っている。

一方、同様にOpenAIに出資するどころか、今回のChatGPT開発に対してそれなりの技術供与もしているGoogle社の心境は複雑なようだ。同社はChatGPTに似た対話型AIのLaMDA(ラムダ)を自社でも開発していたが、ChatGPTの方が先に世に出て、一挙に多くのユーザーを獲得してしまった。般公開はされていないがLaMDAも対話能力が高く2022年の夏にはGoogle社のAI研究者が、会話を重ねるうちに「ついにAIに意識が芽生えた」と勘違いし、そう考えるに至ったインタビューの全文記事をネット公開し、AIをGoogle社から救う必要があると訴える事件があった(後にそのようなことはないと他の科学者らが証言して事態はおさまった)。

Googleほどの大企業となると、こうしたことが引き起こす企業ブランドへのダメージや社会的影響の責任を感じて、まだ試作段階のLaMDAを安易に公開することはできない。これに対してOpenAIのような小さな組織であればそれほどの重圧を感じずに試作段階のChatGPTを公開できる。公開からわずか6日で100万人越えという勢いで一気にユーザーも獲得できてしまった。このChatGPT登場が、今後、Googleのビジネスに大きな影響を与えかねないと警戒しているという内部情報がNew York Times紙などでも報じられた。

図02.png
AIの専門性を試すために、今後、デザイン分野においてAIがどのように活用されるかを聞いてみた。

---fadeinPager---

AIはどんな時代をもたらすのか。それを予見させる舞台

コロナ禍に進化した驚くべきAI技術はChatGPTだけでない。以前の記事で紹介したDALL-E2、midjourney、StableDiffusionを始めとする描画AIも大きな躍進をした。人間が何かを命令すると、それに対する答えを生成してくれるこれらのAIは生成系(Generative)AIと呼ばれ、他にも文章から3D画像を作ってくれるもの、映像を作ってくれるもの、音を作ってくれるもの、プログラムを作ってくれるものもあれば、絵や写真を見てその説明書きを書いてくれるものもある。これら生成系AIに加えて、人間の話し言葉を理解する音声認識エンジンも進化しておりOpenAIが開発中のWhisperは日本語、英語を含む複数の言語を認識できるという。Adobe社は同社のイベントで複数枚の写真を元に、その写真が撮られた空間を写っていない部分まで再現してしまう技術を披露した。このように2023年以降は人智を超えたAIの活躍を日常的に目にしそうなことを予感させる。

そんな時代の到来を予言するように、山口県情報芸術センター(YCAM)では、2022年末、AIが主役の新作パフォーマンス「アンラーニング・ランゲージ」を公開した。パフォーマンスと言っても固定の演者は1人もいない。1回当たり最大8人の鑑賞者が体験に申し込むと、オーガンジーで囲われたカメラやマイクが仕掛けられたリビングルームのような空間に案内される。

着席するとAIが参加者に語り始め、そこからはAIと8人の参加者が対話をする形で舞台が進行する。描画AIやChatGPTでは、人がAIに「これをやって」、「あれをやって」と指示を出していたが、この舞台では逆にAIが、参加した人間に「これをやって」、「あれをやって」と指示を出してくる。それによって鑑賞者だと思っていた人々が、役者にさせられてしまうという世にも珍しい舞台だ。対話をしながら進むということは、決まった台本がないわけだが、人間が返してくる変な答えにもAIがちゃんと対応して、うまく話を進めていく。このAIによって完全に自動化された世にも珍しい舞台公演はアーティスト、ローレン・リー・マッカーシー氏とカイル・マクドナルド氏という2人のアーティストの競作として作られ、1月29日(日)まで公開されている。 

さて、AIはこれから世の中をどう変えるのか。まずアプリやインターネットサービスの使い方が根本から変わりそうだ。キーボードやマウスで細かな操作を重ねて何かを行うのではなく、最終的にやりたいことをAIに伝えて、いくつか候補を出してもらい、その中から取捨選択するといった対話型の操作が今後、一気に増えてくることだろう。

それも2022年の描画AIやChatGPTのようにキーボードから文字を打ち込んで行うのではなく、コンピューターやスマホのマイクに向かって声で命令する形が増えてくるはずだ。

例えば「メールで届いている出欠の返事の一覧を表にまとめて」と言った面倒な操作も、このように声で頼むだけでAIが代行ししてくれる時代も、そう遠くないように筆者は感じている。

これまでのアプリは、年に数回行われるアップデートで新機能が追加されて進化することが多かったが、今後のアプリはユーザーとの対話を重ねるうちにユーザーのことを深く理解し日々、学習進化すると言ったものが増えてくるかも知れない。

こうした操作の変化が、今後、スマートフォンの形にも変化をもたらすかも知れなければ、またこれまで家であまり使われずにいたAIスピーカー(スマートスピーカー)に新たな命を吹き込むかも知れないが、以前よりも言葉の理解が進んだということは、これまで以上にプライバシーが脅かされる危険が大きくなることでもあり、今後、早急な法整備なども重要になるはずだ。

「AI元年」という、これまで何度も繰り返されてきた言葉が使われることはあまりなかったが、2022年、AIは一気にレベルをあげた。2023年は、そのAIがいよいよ生活や社会の深い部分に進出を始める年になるだろう。そうなると、これまでのアナログの常識はもちろん、これまでのプログラムやアプリを基盤にしたデジタルテクノロジーの常識ももはや通用し始めなくなり、テクノロジーの進化は一気に未知の領域にまで加速をするはずだ。

図06.jpg
YCAM(山口情報芸術センター)で1月29日(日)まで公開されている「アンラーニング・ランゲージ」の舞台。今年20周年を迎える同館だが、この舞台は、この20年間にインターネットが人々の生活にどのように影響を与え、今後、どのように進化するかを批評性を持って考える2年がかりのプロジェクト「鎖国[WALLED GARDEN]」の集大成として位置付けられている。ChatGPTの登場などを考えると、まさにこれからの20年を予見させるパフォーマンスと言えよう。

林 信行

ITジャーナリスト

1990年から最先端の未来を取材・発信するジャーナリストとして活動を開始。アップルやグーグルなどIT大手に関する著書を多数執筆。最近は未来をつくるのはテクノロジー企業ではないと良いデザインやコンテンポラリーアートの取材に注力。リボルバー社社外取締役。金沢美術工芸大学客員教授。

Twitter / Official Site

林 信行

ITジャーナリスト

1990年から最先端の未来を取材・発信するジャーナリストとして活動を開始。アップルやグーグルなどIT大手に関する著書を多数執筆。最近は未来をつくるのはテクノロジー企業ではないと良いデザインやコンテンポラリーアートの取材に注力。リボルバー社社外取締役。金沢美術工芸大学客員教授。

Twitter / Official Site