September 1, 2020

GPT-3が会話型AIとデジタルヒューマンのイノベーションをどのように加速させることができるのでしょうか?

OpenAIの印象的な生成型AI、GPT-3のローンチは、デジタルヒューマンによる会話での転換点をもたらしました。以下にその方法を説明します。

GPT-3が会話型AIとデジタルヒューマンのイノベーションをどのように加速させることができるのでしょうか?

- この記事はdigitalhumans.comから機械翻訳され、修正されました

GPT-3の驚異的なディープラーニングの能力は、最近β版がリリースされた後、テクノロジーコミュニティの想像力を刺激しました。すでに、魅力的な会話を作り出すために使用され、フィクション作品を書いたり、数分でウェブページをデザインしたりしています。しかし、GPT-3は会話型AIの現在と未来に何を意味しているのでしょうか?我々は、上級コンピュータビジョンとマシンラーニング開発者の、Amir HajiRassoulihaに説明を求めました。

***

GPT-3とは何ですか?

Generative Pre-trained Transformer 3(GPT-3)は、OpenAIによって開発されたGPTモデルの第3世代です。GPT-3は、トランスフォーマベースのディープラーニングニューラルネットワークアーキテクチャを持ち、インターネット上で利用可能なデータセット、例えばWikipediaや本からの45 TBのテキストデータで訓練されています。

一つの推定によれば、これは約34億件のテキストページに相当するデータがモデルの訓練に使用されたことを意味し、それは「戦争と平和」の約270万部分に近いです。

GPT-3は言語モデルで、テキスト中の単語の論理と概念を理解し、文脈上で文が意味をなす可能性を予測するために訓練されています。

GPT-3のアーキテクチャは新しいものではありません。 これは、Google BERTやMicrosoft Turing NLGなどの以前の言語モデルと似ていますが、GPT-3はこれまでに作成された最大のモデルです。GPT-3には1750億のパラメータがありますが、Google BERTは1100万のパラメータ、Microsoft Turing-NLGは170億のパラメータしかありません。

ニューラルネットワークのパラメータは、ネットワークのノード(または接続)の重みであり、訓練プロセス中に学習し最適化されます。こうした複雑なネットワークの訓練は、非常に時間とコストがかかります。GPT-3モデルの訓練費用は、1200万ドルを超えると推定されています。

GPT-3はどのように機能するのか?

GPT-3は、他の深層学習モデルと同様に機能します。ニューラルネットワークの層は、受け取った入力に基づいて出力を生成します。しかし、GPT-3は他のどのモデルでもできない複雑なタスクを、非常に少ない訓練例で実行することができます。

例えば、GPT-3は検索エンジン、翻訳者、プログラマー、履歴書ビルダー、または有名な歴史的人物を表現するために使用することができます。このビデオには、すでにGPT-3を使って作成されたいくつかの興味深い作品が収録されています。

これは、他の利用可能なモデルに比べて大幅な改善です。 たとえば、GPT-3は数文で英語をフランス語に翻訳することを学べますが、Google BERTでは同じことをするために数万の文章が必要です。

もしかしたら、GPT-3の最もエキサイティングな部分は、ごくわずかな学習データでカスタムタスクを実行するようにプログラムできることかもしれません。何しろ、GPT-3は非常に早く学習するのですから。

GPT-3は会話型AIの進歩にどのように寄与できるか?

GPT-3は自然に次に来るべきテキストを予測するのが得意なので、非常に人間らしい会話を作ることができます。AIは伝統的に特定のトピックで「質問し回答する」ことが得意ですが、トピックが急に変更されると混乱することがあります。

GPT-3は簡単にトピックを切り替えて質問に答えることができます。そして、一般的にAIが常識的な質問に答えることは非常に難しいとされていますが、GPT-3はそのような質問に答える際に非常に良好なパフォーマンスを示しています。

これら全ての新規性が会話型AIにとって重要なブレイクスルーとなるGPT-3の一方、GPT-3が理解できない問題や、人間が尋ねない問題については正式に答えることができないという点をリマークするべきです。たとえば、「足には何個の目がありますか?」という問いにGPT-3が答えると「足には二つの目があります」です。

ここでは、GPT-3が非論理的な質問に答えられない事例がさらに多く存在しています。

デジタルヒューマンの未来にGPT-3がなぜ重要なのか

自然な会話を行う能力はデジタルヒューマンにとって大きな利点です。史上の人物のような会話をするための人工知能の使用は、GPT-3がもたらすことができる刺激的な機会の1つです。

GPT-3では、会話を再現し、それがデジタルヒューマンプラットフォームによって具現化され、その歴史的な人物の視覚的な外観と特性が創造されます。特に教育業界のような場所では、これがとても刺激的な可能性を持っています。学生たちは、例えば、アルバート・アインシュタインとの流れるような会話を通じて物理学についてより深く学ぶことが可能です。また、デカルト、フロイト、またはサルバドール・ダリといった人々との自然で思慮深い会話を通じて、哲学、心理学、または芸術についての探求を深めることも可能です。

これらの多くの利点にもかかわらず、GPT-3はより広範囲にわたってテストする必要があります。モデルの複雑さは、現在の技術を使用したリアルタイムの用途に対して処理速度を遅くする可能性があります。AIが感じたトピックにどのように答えるかは、デジタルヒューマンの場合にも考慮する必要がある会話型AIの長い問題です。

ChatGPTについてはどうでしょうか?

このブログを初めて公開して以来、OpenAIは大成功を収めたChatGPTインターフェイスも立ち上げています。これは同じChatGPTの大型言語モデル(LLM)を使用しています。

この生成AIソリューションは基本的に同じですが、異なるチャットボットスタイルのインターフェイスを持つため、上記のChatGPTの可能性についての議論は、GPT-3にも推論することができます。 同様に、BardやGoogleの対話型AI、Bingの印象的な検索エンジンインターフェースなどの他のLLMも存在します。

最高の顧客体験を提供するためにどのLLMをデジタルヒューマンに統合すればよいかについて質問がある場合、あなたのUneeQカスタマーサクセスまたはビジネス開発担当者がお手伝いします

意味のあるAIインタラクションの未来を築く

対話型AIが進化するにつれて、自然な人間のインタラクションをシミュレートする方法が次々と改善されてきています。しかし、その体験を提供するテクノロジーも、より自然で人間らしい次元を持つことで利益を得ることができます。

デジタルヒューマンについて、その仕組みや組織がこの種のインタラクションを構築する理由について詳しく知りたい場合は、以下から私たちの無料ガイド「デジタルヒューマンとは何か」をダウンロードすることができます。

2021年のアップデート - 今すぐGPT-3で動くデジタルヒューマンに話しかける!

2021年4月に、UneeQはデジタルアインシュタインを発表し、我々のデジタルヒューマンの一人、SophieをGPT-3の対話モデルに接続しました。

彼女は今すぐ利用可能で、話すほどに深い会話を持つことができます。 ログインやサインアップ、個人情報の提供は必要ありません。下記をクリックしてSophieについてもっと知るか、ここをクリックして会話を開始してください。