Aiello 犀動智能:一間台灣本土 AI 新創,要怎用「逐字稿」攻進智慧商業分析市場?

作為一間處理語言 AI 的新創,犀動智能自然是站在海景第一排的位置親身感受,AI 處理自然語言這幾年如火箭般的發展速度。

7e5006e8 0451 4a43 8b0f 39a6fe37f43a
Photo Credit:INSIDE/Chris攝影

*文章出處:INSIDE – 社群媒體、行動網路、行銷、技術、創業  2023 年 5 月 28 日

作者:Chris

以 ChatGPT 為首的各式大型語言模型(LLM)與生成式 AI 正在席捲整個科技與網路業界 ,在這巨浪中,INSIDE 曾介紹過專精在自然語言處理的台灣 AI 新創「Aiello」犀動智能也沒置身事外,打算從原本擅長的旅宿場景進入純網路平台,在今年 5 月推出了線上語音轉文字的 AI 平台「Vocol.ai」。

Vocol.ai 乍看之下跟不少逐字稿軟體看起來相當類似,除了即時錄音之外,使用者也可以上傳是先錄好的錄音檔,只要錄音檔音長十分之一的時間,Vocol.ai 就會自動整理出精準度頗高的逐字紀錄與摘要內容給使用者,甚至連不同的講話者講了什麼,都能個別快速整理成摘要,十分方便。

25eba467 2515 4c1f bc42 aea403af8684

而且根據筆者實測,Vocol.ai 也不能說成只是單純的逐字稿軟體,更是一組「線上協作」平台,不同使用者彼此之間可以互相開權限,讓眾人圍繞在紀錄文字上一起工作、紀錄、下註解;不過,犀動智能創辦人沈書緯對 Vocol.ai 的想像卻不止如此。

從 BERT 走向混合模型

AI 處理自然語言在這幾年的發展速度堪稱搭火箭一樣,從剛開始大眾覺得很多語音助理還有點笨笨的、只能處理特定問題,到現在 ChatGPT 已經可以生成十分通暢、詳盡(雖然不一定準確)的資訊。

作為一間處理語言 AI 的新創,犀動智能自然是站在海景第一排的位置親身感受這一切,光是怎麼從專門處理旅宿場景的小犀智能音箱走到 Vocol.ai,就足以代表 AI 自然語言在這幾年是怎麼進步的。沈書緯解釋,2019 年創業之初所發表的小犀管家智能語音 AI 平台是基於 Google 在 2018 所提出的開源技術「BERT」所打造,犀動智能很直覺地將它作為單純文本分類模型、不做複雜結構分析;再簡言之,犀動只把 BERT 當作辨認關鍵字的工具,然後在資料庫中找到事先預設好的題目,再用語音回答使用者。

085029cc 767a 4b1c a690 0b9de97464e4
Aiello 之前就以小犀管家智能語音 AI 平台,與各大飯店合作。/ Photo Credit:Aiello

OpenAI 全球第一批合作夥伴

在 ChatGPT 名聲遠播之前,犀動智能就已經是全球第一批獲得 OpenAI 授權的 5 家公司之一,畢竟他們是一直是拿開源 NLU 在做產品的公司,所以本身就會對 OpenAI 裡開源社群非常有興趣,在 2021 年年初開始跟 OpenAI 進行官方合作,陸陸續續在兩年內對開源社群出了不少力。

沈書緯特別回憶起 OpenAI 從 GPT-2 開發到 GPT-3 的過程:「我們當時有觀察到 GPT-2 的自然語意理解(NLP)是很強,但是自然語言生成(NLG)卻還差強人意;當時我們就意識到,如果 NLG 不夠強,一般來使用者還是看不出來大型語言模型到底有什麼應用潛力、看不出來價值。」

「所以我們當時不只用 GPT-2,也用了開源的 BLOOM,兩邊都用;BLOOM 的好處是自己可以 host,但缺點是自然語言生成不夠好,但 OpenAI 這裡到 GPT-3 就回答得不錯了,所以我們會把文本先在 BLOOM 摘要一次,要花費 token 時,再讓 GPT-3 摘要一次,就能得到品質相當好的回答。」

沈書緯也笑稱,等到臺灣微軟拿到 OpenAI 在台灣 approve partner list 時,才驚覺犀動智能其實就已經在上面了。

下一步:擴充至商業洞察

但就像很多新創會先推出 MVP 最小可行性產品、再不斷擴充商業模式一樣,對沈書緯來說Vocol.ai 當作語音轉文字 AI 平台僅僅只是第一步而已,接下來的路是打入 B2B 的專業客服中心市場,並再從中搖身一變,成為專門從非結構化資料中,找出有用資訊的商業洞察平台。

b64f448d 993a 45dc aa75 80ac8462eb54
▲Vocol.ai 理想中的商業模式發展圖。

這種服務有種從 SaaS 變形而來的專有稱呼,叫做 Contact center as a service(CCaaS),直譯就是聯絡中心服務模式。大型企業通常有 500 到 1000 位客服,他們處理的問題分門別類、五花八門,專業程度也不一,除了要回應一般消費者的疑問之外,也有專門服務商業客戶,或是直接回答技術問題。沈書緯解釋但不管是哪種客服人員,都必須在每一通客服結束後用文字記錄問題;因此導入 Vocol.ai 語音轉文字,就起碼可以省下每位客服人員至少一半的時間成本。

而且 Vocol.ai 是建立在 Azure 雲上,每筆語音都能保留給客戶,這麼做不僅能保護個資,也能用這些語音轉出的大量文字與資料做巨量分析。「就算這個客戶一個月有幾千通電話好了,有了 Vocol.ai,就能在極短時間內,自動整理出客人最常抱怨、或是最喜歡的部分是什麼?又或是我們可以輕鬆找出今天這通電話跟三個月前某一通電話有所關聯,這就可以把個案延續下去。」

不只是音檔,Vocol.ai 甚至在公司員工同意之下掛在公司伺服器裡,可以對所有像公司的 mail、合約、文字檔進行統整分析,洞察出客戶的底層需求;又或是像犀動之前深耕的旅宿產業,可以使用 Vocol.ai 去爬梳自家飯店與競爭者在 Google Map、Agoda 上的評價,然後做針對性的策略擬定。

「我們想做的,就是這種非結構資料的商機。」沈書緯最後說著,比起像眾多軟體大廠積極攻入的 B2C AIGC 市場,犀動此時卻另闢戰場,自己想用 AI 重新定義「雲端客服中心軟體」再開闊一片天。

預約Demo

若你對我們的解決方案有興趣,請與我們聯繫,讓我們來為你介紹Aiello的技術與產品。