Aiello:台湾のAIスタートアップが音声文字起こし技術を活用してスマートビジネス分析市場に参入?

私たちAielloは、自然言語処理を専門とするAIスタートアップ企業として、まさに最前線に位置しています。AIによる自然言語処理の進展は、ここ数年間で急速な成長を遂げていることを、私たち自身が肌で実感しています。

7e5006e8 0451 4a43 8b0f 39a6fe37f43a
Photo Credit:INSIDE/Chris攝影

*記事出展:INSIDE – 社群媒體、行動網路、行銷、技術、創業  2023 年 5 月 28 日

著者:Chris

ChatGPTを含むさまざまな大規模言語モデル(LLM)や生成型AIが、技術およびインターネット業界全体に広がっています。この大きな波において、INSIDEでは自然言語処理に特化した台湾のAIスタートアップ企業「Aiello(犀動智能)」を紹介しました。Aielloは元々ホテル業界に特化していましたが、純粋なオンラインプラットフォームに進出し、今年5月にオンライン上で音声からテキストへの変換を行うAIプラットフォーム「Vocol.ai」を発表しました。

Vocol.aiは、一見すると他の音声文字起こしソフトウェアと非常に似ていますが、リアルタイム録音に加えて、事前に録音された音声ファイルをアップロードすることもできます。録音ファイルの長さの10分の1程度の時間で、Vocol.aiは正確な文字起こしと要約の内容を自動的に整理し、ユーザーに提供します。さらに、異なる話者が何を話しているかも個別に素早く要約することができ、非常に便利です。

25eba467 2515 4c1f bc42 aea403af8684

Vocol.aiは、単なる音声文字起こしソフトウェアとは言い切れないことが筆者の実測によってわかりました。それはむしろ「オンラインコラボレーション」プラットフォームであり、異なるユーザー間で相互に権限を与え合い、共同でテキストの記録、作業、注釈を行うことができます。しかしながら、Aielloの創業者である沈書緯(ヴィック・シェン)氏は、Vocol.aiに対するイメージがそれだけではないと考えています。

BERTからハイブリッドモデルへの進化

ここ数年の間におけるAIによる自然言語処理の発展は、まさにロケットの如く速いです。最初は多くの人々が音声アシスタントを馬鹿げていると批判し、特定の問題しか処理できないと思っていましたが、現在ではChatGPTは非常に滑らかで詳細(必ずしも正確とは言えないものの)な情報を生成することができるようになりました。

台湾の自然言語処理に取り組むスタートアップ、Aielloもこの進化を身をもって感じています。特定の宿泊場所に特化したAiello音声アシスタント(AVA)からVocol.aiへの進展は、AIの自然言語処理がこれらの数年間でどれほど進歩したかを象徴しています。犀動智能の創業者、沈書緯氏は、2019年に発表されたAielloスマート音声AIプラットフォームが、Googleが2018年に提案したオープンソース技術「BERT」を活用して開発されたものであると説明しています。AielloはBERTを純粋なテキスト分類モデルとして活用し、複雑な構造解析は行わず、キーワードの識別ツールとして使用します。そして、事前に用意されたデータベースから適切な質問を見つけ出し、音声でユーザーに回答するのです。

085029cc 767a 4b1c a690 0b9de97464e4
Aielloはこれまでホテル向けに音声AIアシスタントのAVAを提供してきた。/ Photo Credit:Aiello

OpenAIの世界初の提携企業

ChatGPTの名声が広まる前に、犀動智能はすでにOpenAIから認可を受けた最初の5社の一つであり、彼らは常にオープンソースのNLU(自然言語理解)を活用して製品開発を行ってきた企業です。そのため、OpenAIのオープンソースコミュニティに非常に興味を持っており、2021年初めから公式にOpenAIと協力し、2年間にわたってオープンソースコミュニティに多くの貢献をしてきました。

沈書緯氏は特に、GPT-2からGPT-3への開発過程を振り返ります。「当時、私たちはGPT-2の自然言語処理(NLP)の能力が非常に高いことに気付いていましたが、自然言語生成(NLG)の能力はまだ充実していませんでした。その時点で私たちは気づきました。NLGが十分に強力でなければ、一般のユーザーは大規模な言語モデルの潜在的な応用価値を理解することができないのです。」

「そのため、当時私たちはGPT-2だけでなく、オープンソースのBLOOMも使用しました。両方を使用したのです。BLOOMの利点は自己ホストが可能であることですが、自然言語生成の能力が不十分であるという欠点があります。しかし、OpenAIのGPT-3は非常に良い回答を返してくれるので、私たちはテキストをまずBLOOMで要約し、トークンを消費する必要がある場合にはGPT-3に要約させることで、品質の高い回答を得ることができます。」

沈書緯氏はまた笑顔でこう話し、台湾マイクロソフトがOpenAIの台湾における承認パートナーリストを取得した時、犀動智能が実際にそのリストに含まれていたことに気付いたと語っています。

次のステップ:ビジネス洞察への拡充

しかしながら、多くのスタートアップがまずMVP(最小限の実行可能製品)をリリースし、その後、ビジネスモデルを拡大していくように、沈書緯にとってもVocol.aiは単に最初の一歩に過ぎません。次のステップはB2Bの専門的なカスタマーサービスセンター市場に参入し、非構造化データから有用な情報を抽出するためのビジネスインサイトプラットフォームとして変わっていくことです。

b64f448d 993a 45dc aa75 80ac8462eb54
▲Vocol.ai ビジネスモデルの発展予想図。

このようなサービスは、SaaSから派生した専用の用語で、「Contact center as a service(CCaaS)」と呼ばれています。大企業では通常、500人から1000人のカスタマーサービス担当者がおり、彼らはさまざまな種類の問題を取り扱い、専門レベルも異なります。一般消費者の質問に対応するだけでなく、ビジネス顧客向けのサービスや技術的な問題に直接回答する必要もあります。沈書緯氏曰く、どの種類のカスタマーサービス担当者でも、毎回の対応終了後に問題をテキストで記録する必要があります。したがって、Vocol.aiの音声からテキストへの変換を導入することで、少なくともカスタマーサービス担当者の時間コストを半分以上削減することができます。

さらに、Vocol.aiはAzureクラウド上に構築されており、各音声は顧客に保存されます。これにより、個人情報を保護するだけでなく、音声から変換された大量のテキストとデータを使用して大規模な分析を行うことができます。「たとえば、この顧客が1か月に数千通の電話をするとしても、Vocol.aiを使用すると、非常に短時間で、顧客が気に入りやすい部分や逆に苦情を受け付けやすい部分を自動的に整理することができます。また、今日のこの電話と3か月前の特定の電話との関連性を簡単に見つけることができます。それにより、その案件を継続することができます。」音声ファイルだけでなく、Vocol.aiは会社の従業員の同意のもと、会社のメール、契約、テキストファイルなどすべてを統合的に分析することができます。これにより、顧客の基本的なニーズを洞察することができます。また、Aielloがこれまで従事してきた宿泊業界のように、Vocol.aiを使用して自社のホテルや競合他社のGoogleマップやAgoda上のレビューを分析し、それに基づいた戦略を立てることも可能です。

「私たちが注目しているのは、この非構造化データのビジネス機会です。」と沈書緯は最後に述べました。多くのソフトウェア企業が積極的に競争しているB2C AI/CG市場とは異なり、犀動は新たな戦場を開拓し、AIを用いて「クラウドカスタマーサービスセンターソフトウェア」を再定義し、新たな可能性を広げたいと考えています。

無料デモを予約

音声AIについてもっと知りたいですか?無料のデモをご予約ください!