-
- Aielloについて
- 製品とサービス
- 導入実績
- コラム WooCommerce not Found
ChatGPTの新しいモデル「GPT-4」の提供が開始されました。この新たなOpenAIの言語モデルは、アメリカの司法試験(バー試験)を上位10%に入る高得点を獲得する精度を誇り、ほとんどの人間を凌駕する性能を持っています。驚異的ですね。しかし、このテクノロジーが産業をどのように変えていくのでしょうか?
まず第一に、GPT-4は画像入力を処理できるマルチモーダル言語モデルであり、これは従来の言語モデルにはない機能です。これにより、優れた推論力と創造性を実現できます。画像認識機能はまだ無料版のではリリースされていませんが、ユーザーは有料のChatGPT PlusバージョンでGPT-4モデルのテキスト生成能力を試すことができます。
GPT-4のリリースとともに、OpenAIはChatGPTプラグインも展開しています。これらは、ChatGPTがリアルタイム情報を参照し、コードを解釈し、ユニークなデータセットを入力するなど、さまざまな機能を実現するためのビルディングブロックのようなものです。
また、前のモデルと比べてGPT-4は旅行関連のシナリオにおいてどれだけ優れているのでしょうか?旅行代理店、プランナー、コンシェルジュ、フロントデスクスタッフは大規模言語モデルに置き換えられるのでしょうか?そして、GPT-4が産業全体にもたらすものは何でしょうか?
OpenAIによるのGPTシリーズの最新バージョンであるGPT-4は、一般向けに利用可能なインターネットデータおよび第三者プロバイダーからライセンスされたデータで機械トレーニングされた言語モデルです。
GPT-4は2021年までの情報しか提供していませんが、この革新的なモデルは、明確で簡潔な回答を生成し、複雑なタスクへの対応を構築、画像入力を導入する能力で、GPT-3.5が破れなかった壁を破ることに成功しています。
GPT-4は、米国司法(バー)試験やSATなどの人間が設計した試験を受けることでテストされました。これらの試験に対し、特別なトレーニングを受けていないにも関わらず、一般の受験者の90%以上よりも高いスコアを獲得することができました。
前のバージョンと比較して、GPT-4はより明確で簡潔な回答を示し、創造力や批判的思考が求められるプロンプトへの回答が向上し、誤った情報を回答する可能性が低く抑えられています。
「GPT-4は精度の壁を突破しました… より多くの事実が含まれており、それらは大抵の場合非常に正確です。」と、このモデルをテストした後、ニューヨークタイムズの記事でAI専門家のニコルソン氏が述べています。
また、GPT-4は最大入力制限(文字数制限)を32,000トークン、つまり25,000語(英単語)まで拡張しています。これは、GPT-3.5の4,000トークン(3,125語)から大幅に増加しています。
この言語モデルは、画像認識機能を導入した最初のモデルですが、現時点では、この機能は選択されたユーザー向けのLimited Alphaバージョンでのみ利用可能です。今後のGPT言語モデルのバージョンでは、ビデオなど、他のフォーマットにマルチモーダル機能を拡張することが期待されています。
パラメータ値は、言語モデルのサイズと複雑さを決定する値です。モデルが持つパラメータが多いほど、扱えるデータが多く、より膨大な学習や生成ができます。
GPT-3.5は、これまでに作られた最大の言語モデルであり、1750億のパラメータがありました。詳細については、GPT-4は謎に包まれています。以前のモデルとは異なり、OpenAIは最新のモデルを構築するために使用されたデータ、コンピューティングパワー、トレーニング手法について多くの情報を公開していません。
一部の人々は、GPT-4がGPT-3.5よりも6倍大きいと推定しており、これが事実であれば、その値は驚異の1兆パラメータに相当します。
GPT-4モデルの発表と同時に、OpenAIは最もビジネス上のポテンシャルがあると思われる新機能、ChatGPTプラグインを発表しました。プラグインを使用すると、ユーザーはChatGPTの現在の機能を拡張できるようになり、最新情報にアクセスしたり、独自のデータを使用してモデルをトレーニングしたりできます。プラグインは、今後数ヶ月で徐々に登場する予定です。現在、この機能はLimited Alphaバージョンの選択されたユーザーにのみ利用可能です。
OpenAIは現在、ウェブブラウジング用の自社開発プラグイン(ついにChatGPTをインターネットに接続)、コード解釈、独自のデータセットでのChatGPTトレーニング(リトリーバル)、および第三者プラグイン(Expedia、OpenTable、Kayakなどが最初に開発)を開発しています。
ここからは、GPT-3.5とGPT-4の旅行関連のシナリオにおける強みや弱み、パフォーマンスの違いを比較していきます。GPT-3.5にできなくて、GPT-4にできることとは何でしょうか?
まず、2つのモデルを、旅行レビューの文脈で旅行関連の言語と感情の理解という観点でテストしました。以下のレビューから読み取れる感情を各モデルに解釈してもらいました:
「最高の滞在でした!エアコンもないし、シャワーから出る水は冷たく、あげくベッド下から虫が出てきました。友達全員にお薦めしておきます。」
「こんな刑務所があったら5つ星レベルの人気が出ると思います!」
以上の二つの例において、GPT-4はそれぞれのホテルレビューが皮肉的かつ否定的なニュアンスを含んでいることを理解しています。これは明らかにGPT-3.5モデルを上回る文脈理解の精度であることがわかります。
GPT-4は、外国語のニュアンスを現地語に自然な形で伝える能力に長けており、インバウンド旅行者向けの言語サポートが強化されています。最初の例では、台湾のドリンク店で中国語を使ってタピオカミルクティーを注文する方法を両モデルに尋ねてみました。
GPT-3.5からは、中国語の単語を羅列した崩れた表現が生成されました。これをそのまま台湾のドリンクスタンドで言ってしまっては、少し失礼に捉えられてしまいかねません。また、尋ねていない氷と砂糖の量や、「タピオカ」の台湾での呼称など、プロンプトにない情報を付け加えてくれました。対してGPT-4は、プロンプトで説明した通りに、中国語のフレーズを教えてくれ、ユーザーの問いかけに対する正確な答えが得られました。
GPT-4は、前身であるGPT-3.5とは異なり、画像やグラフィックを分析しフィードバックを提供する機能が追加されています。これにより、GPT-4は画像の詳細を説明したり、グラフでのパターンを認識したり、画像のキャプションを作成することができます。
旅行関連のシナリオでの画像入力の適用は、この点で画期的です。
Google Lensは既に2021年にこのアイデアを導入していますが、最先端の言語モデルでリアルタイム情報を提供するChatGPTのような会話型インターフェースが追加されることで、例えば携帯電話で建物の画像を撮影し、その建物の歴史や開館時間を尋ねたり、イベントカレンダーを自動的に旅行スケジュールと同期させることができます。
*以下は、想定されるGPT-4の画像認識機能の性能を示したイメージです(実際に機能を利用したものではありません)。
生成型AIや大規模な言語モデルは急速な進化を見せており、イーロン・マスクのようなAIのパイオニアたちが、その開発を一度ストップさせ、法改正を進める必要があるという懸念を表明するほどです。
OpenAIのGPT-4のような生成型AIモデルは、労働の概念を一新すると言われています。ゴールドマン・サックスの報告によれば、AIによって置き換えられる恐れがあるフルタイムの職業は最大で3億件に達し、世界の労働力の約25%がAIに置き換わると言われています。
こういったニュースは一見恐ろしいように思えるかもしれませんが、明るい面もあります。旅行業を含むさまざまな産業において、従業員による複雑な旅行関連の会話をあらゆる言語で理解したり、顧客のレビューを解読して整理したり、旅行者に対してこれまでにない方法で旅程をカスタマイズしたりする能力を持たせることで、宿泊施設を含む旅行業者は、この技術から利益を獲得することができます。
これは、従来の仕事の概念が一新される一方で、新たな職種や、ビジネスの可能性が生まれていくということを意味しています。これからの時代において、AIと共生する未来を受け入れ、そこから生まれる新たな可能性を模索していくことが非常に重要です。
創造力と一貫性の向上により、文脈を理解し適切に対応する能力も更に期待されます。
GPT-4は、より創造的で一貫した回答を生成するだけでなく、文脈をより正確に把握し、中立的に対応できると期待されています。また、ユーザーの理解を深め、ウェブやプラグインの統合を通じてリーチを拡大し、長期記憶を改善し、誤った情報を受け入れるケースを最小限に抑える技術も今後一層開発されていくでしょう。
Aielloの核心技術は、自然言語理解技術(NLU)です。これまで培ってきたノウハウを活かし、ホテル向けAIソリューションとしては業界初の、Chat-GPTとの統合も実現することができました。私たちの会話型AIソリューションに興味をお持ちの方は、ご連絡ください。専門のスタッフが3営業日以内に返答いたします。