ถอดรหัสเทคโนโลยี ChatGPT

【図解】ChatGPTキーワード技術を解読! AIの会話能力をトレーニングする方法とは?
ผมเห็นถึงอนาคตที่สดใสของ GPT-3 ความก้าวหน้าในด้านของเทคนิค จะกระตุ้นการสร้างโอกาสทางธุรกิจใหม่ๆขึ้น

สารบัญ

*เผยแพร่ครั้งแรกในภาษาจีนบน bnext.com.tw เมื่อวันที่ 3 มกราคม 2566

ผู้เขียนบทความ: 陳君毅

ในเวลาเพียง 5 วัน ChatGPT ได้สร้างประวัติศาสตร์ด้วยจำนวนผู้ใช้กว่า 1 ล้านคนและความสามารถที่โลกไม่เคยเห็นมาก่อน เราได้นั่งคุยกับนักวิชาการและผู้เชี่ยวชาญในอุตสาหกรรมเพื่อค้นหาว่าอะไรที่ทำให้โมเดลภาษานี้ สามารถปฏิวัติวงการได้ สำรวจเพิ่มเติมแล้วคุณจะเข้าใจ ChatGPT มากขึ้น

ผู้คนมักจินตนาการมากมายเกี่ยวกับ AI ที่ควบคุมโลก “The Matrix”, “Blade Runner”, “Elysium” และ “Black Mirror” ล้วนเป็นหนังและซีรีย์ผลงานชิ้นเอก แต่ใครจะรู้ว่า”แชทบอท”จะสามารถทำให้เกิดคลื่นลูกใหญ่ได้

OpenAI ผู้นำด้านการพัฒนา generative AI ได้สร้างกระแสในสื่อทั่วโลกด้วยการสร้างเทคโนโลยี AI ล่าสุด ChatGPT ซึ่งใช้โมเดลการสร้างภาษาธรรมชาติ GPT-3.5 เพื่อสร้างแชทบอทที่กวาดสื่อทั่วโลกผ่านการตอบสนองเหนือมนุษย์ ถามได้เกือบทุกอย่างและให้คำตอบที่มีความแม่นยำสูงมาก จากรายงานและสื่อต่างๆได้ดึงดูดผู้คนมากกว่าหนึ่งล้านคนให้ลงทะเบียนในเวลาเพียง 5 วัน Kate Darling นักวิทยาศาสตร์การวิจัยของ MIT Media Lab กล่าวว่า “เมื่อรวมโมเดลภาษาขนาดใหญ่ที่พัฒนาโดย Google, Facebook และอื่นๆ เข้าด้วยกัน AI ประเภทนี้จะพลิกโฉมวงการไปโดยสิ้นเชิง”

เทคโนโลยีที่อยู่เบื้องหลัง ChatGPT และ GPT-3.5 คืออะไร

เราได้เชิญศาสตราจารย์ที่ศึกษาด้าน NLP (การประมวลผลภาษาธรรมชาติ) และผู้ก่อตั้งบริษัทที่มีวิสัยทัศน์และได้ใช้เทคโนโลยีนี้ในเชิงธุรกิจ เพื่อเข้ามาร่วมคุยว่าพวกเขาคิดอย่างไรกับอนาคตยุคใหม่

จากโมเดล Transformer ของ Google สู่ GPT-3.5: พรมแดนถัดไปของ Generative AI

GPT-3.5 หรือเวอร์ชั่นอัปเกรดใหม่ของ GPT-3 เป็นระบบพื้นฐานของ ChatGPT โดยตัวโมเดลภาษา GPT (Generative Pre-Trained) ทั้งหมดนั้นอ้างอิงจากโมเดล Transformer ปี 2017 ของ Google ตามรายงานที่เผยแพร่โดยมหาวิทยาลัยสแตนฟอร์ดในปี 2021 ได้มีนักวิจัยกล่าวถึงโมเดล Transformer ว่าเป็น “โมเดลพื้นฐาน” ที่พวกเขาเชื่อว่าสามารถขับเคลื่อนการเปลี่ยนแปลงกระบวนทัศน์ใน AI ได้ หรือพูดง่ายๆก็คือ โมเดล Transformer สามารถเรียนรู้บริบทและความหมายได้ด้วยตนเอง โดยการสังเกตความสัมพันธ์ในข้อมูลตามลำดับ เช่น คำพูดในวลี และได้รับการฝึกอบรมเกี่ยวกับข้อมูล ผ่านข้อความที่ไม่มีป้ายกำกับจำนวนมาก

การใช้เทคโนโลยี Transformer ของ GPT-3 ถูกยกระดับขึ้นไปอีกขั้น ส่วนหนึ่งต้องขอบคุณพารามิเตอร์จำนวนมหาศาลถึง 175 พันล้านพารามิเตอร์ เพื่อให้ตัวเลขเหล่านี้เปลี่ยนเป็นมุมมอง เป็นที่น่าสังเกตว่า BERT ซึ่งเป็นโมเดลภาษาที่ใช้ Transformer ของ Google ซึ่งมีพารามิเตอร์เพียง 340 ล้านพารามิเตอร์ (เรากำลังพูดถึง BERTLARGE ซึ่งเป็นรุ่นที่ใหญ่ที่สุดในซีรีส์นี้) ในขณะที่อีกรุ่นที่มีชื่อเสียงอย่าง ELMo มีเพียง 94 ล้านพารามิเตอร์เท่านั้น

ChatGPT แสดงให้เห็นถึงความก้าวหน้าของโมเดลภาษาขนาดใหญ่ เช่น GPT 3.5 ในรูปแบบการสนทนา ระบบการทำงานที่ได้รับการป้อนข้อมูลด้วยข้อความจำนวนมหาศาล รวมถึงบทความใน Wikipedia เอกสารวิชาการ และหนังสือ ตามคำแนะนำที่ได้รับมา ระบบจะสามารถคาดเดาคำพูดหรือสัญลักษณ์ถัดไปในประโยคได้ แล้วเขียนคำตอบที่เหมาะสมที่สุดออกมา

image
Vic Shen ผู้ก่อตั้งและ CEO ของบริษัท Aiello กล่าวว่า ChatGPT เป็นตัวเปลี่ยนเกมในด้านเทคโนโลยีภาษาธรรมชาติ

ChatGPT เกิดขึ้นมาจากอะไร?

ChatGPT ได้รับการออกแบบให้ทำตามคำแนะนำที่แจ้งโดยผู้ใช้ เพื่อการดำเนินการต่างๆมากมาย ตั้งแต่การเขียนบทกวี อีเมล ไปจนถึงการสรุปบทความด้วยความแม่นยำในระดับที่ไม่เคยมีมาก่อน ทั้งนี้ สาเหตุหลักมาจากพารามิเตอร์จำนวนมากและการปรับแต่งที่ซับซ้อนที่ได้สร้างโมเดลขึ้นมา การนำเสนอ ChatGPT ของ OpenAI นับเป็นก้าวสำคัญในด้านของวงการ AI เครื่องมือใหม่นี้เป็น “ผลิตภัณฑ์” ที่เปลี่ยนแปลงเกมไปโดยสิ้นเชิง ซึ่งจะเป็นตัวกำหนดอนาคตของการโต้ตอบกับเทคโนโลยีในภายภาคหน้า

Hung-yi Lee ศาสตราจารย์ด้านวิศวกรรมไฟฟ้าของมหาวิทยาลัยแห่งชาติไต้หวัน ที่มุ่งเน้นด้าน Machine learning และ Semantic Understanding (ความสามารถของเครื่องจักรในการประมวลผลความหมาย และบริบทที่อยู่เบื้องหลังข้อมูลในโลกความจริง) ได้กล่าวว่า โมเดล AI เหล่านี้ได้นำ “นวัตกรรมเชิงแนวคิด” มาสู่สาขาการสร้างภาษาธรรมชาติ ก่อนหน้านี้ โมเดลภาษาต้องมีความเข้าใจ และมีการปรับแต่งอย่างละเอียดเป็นพิเศษสำหรับทุกแอปพลิเคชัน เช่น การแปล การเขียนบทความ และการเขียนจดหมาย แต่โมเดล OpenAI ท้าทายแนวคิดนี้ และด้วย GPT-3 และ ChatGPT เหล่านี้ ทำให้โลกของเทคโนโลยีภาษาธรรมชาติหยุดชะงักโดยสิ้นเชิง

ChatGPT มีความสามารถในการทำงานต่างๆ เช่น การแปล การเขียนบทความ และแม้แต่การเขียนโปรแกรมโดยไม่ต้องปรับแต่งอย่างละเอียดเพื่อวัตถุประสงค์เฉพาะ ซึ่งทำให้เป็นเครื่องมืออเนกประสงค์ขั้นสูง (ความสามารถนี้ ได้สาธิตให้เห็นถึงสภาพแวดล้อมการสนทนาแล้ว โดยโมเดลภาษาของ LaMDA ที่ถูกพัฒนาและเผยแพร่โดย Google ในปี 2564)

Hung-yi Lee เปรียบเทียบความสามารถของ ChatGPT กับนักศิลปะการต่อสู้ผู้มีพรสวรรค์ที่สามารถแสดงการเคลื่อนไหวได้หลากหลายหลังจากได้เห็นเพียงครั้งเดียว “ไม่ต้องสงสัยเลยว่า ChatGPT จะทำให้เกิดการเปลี่ยนแปลงครั้งใหญ่ในด้านภาพรวมของ AI”

ChatGPT เป็นการนิยามการบริการลูกค้าแบบใหม่หรือไม่

เนื่องจากจุดแข็งของ ChatGPT และ UI ที่ใช้งานง่าย แฟนๆ จึงอดสงสัยไม่ได้ว่าเทคโนโลยีนี้จะส่งผลต่ออนาคตอย่างไรและมีโอกาสใดบ้างที่รออยู่ข้างหน้าเรา

Aiello เป็นบริษัท AI จากไต้หวันที่อยู่เบื้องหลัง Aiello Voice Assistant (AVA) เจ้าหน้าที่อำนวยความสะดวกในห้องพักที่ตอบคำถามของผู้เข้าพักโดยใช้ NLP เป็นเทคโนโลยีหลัก Aiello ได้รับใบอนุญาตโมเดลภาษา GPT-3 ในการพัฒนาผลิตภัณฑ์ถัดไป กว่าหนึ่งปีที่ผ่านมา ทีมงาน NLU ของบริษัทยังได้ศึกษาโมเดลพี่น้องของ ChatGPT ที่เปิดตัวก่อนหน้านี้ InstructGPT “เราคาดหวังว่า ChatGPT จะสามารถเป็นเครื่องมือที่ทรงพลังได้ และเราก็ยังประทับใจในผลลัพธ์ที่เกิดขึ้น และเชื่อว่า นี่เป็นจุดเริ่มต้นของการปฏิวัติ AI เมื่อเราเริ่มต้นธุรกิจในปี 2019 เรารู้ว่าเทคโนโลยีภาษาธรรมชาติจะเติบโตอย่างรวดเร็วในอีก 5 ปีข้างหน้า อย่างไรก็ตาม เราไม่ได้มองว่ามันจะเร็วขนาดนี้” Vic Shen ผู้ก่อตั้งและ CEO ของบริษัท Aiello กล่าว (บทสัมภาษณ์นี้เกิดขึ้นหลังจากการเปิดตัว ChatGPT ได้ไม่นาน)

Sharif Ma ผู้ร่วมก่อตั้งและประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ Aiello กล่าวว่า “มีหลายบริษัทที่ใช้โมเดล GPT-3 เพื่อวัตถุประสงค์ทางการค้า เช่น การบริการลูกค้า และคำถามที่พบบ่อย แต่ไม่ได้หมายความว่าจะเป็นโซลูชันสากลสำหรับทุกปัญหา ปัจจุบันเราพบว่าธุรกิจเหล่านี้ส่วนใหญ่ใช้โมเดลแบบหลายภาษา”

ทุกการป้อนข้อความไปยัง GPT-3 และผลลัพธ์ที่ได้ทั้งสิ้นล้วนมีค่าใช้จ่าย OpenAI ประกาศว่า Davinci ซึ่งเป็นโมเดลภาษาที่แข็งแกร่งที่สุดในซีรีส์นี้ มีค่าใช้จ่าย 0.02 ดอลลาร์สหรัฐฯ ต่อการประมวลผล 750 คำหรือ 1,000 โทเค็น เมื่อไม่ทราบจำนวนผู้ใช้ และจำนวนคำที่ผู้ใช้ป้อนมีไม่จำกัด ทำให้สามารถประเมินค่าใช้จ่ายได้ยาก

“ตัวอย่างเช่น หากเราทราบว่าจำนวนการสอบถามที่ประมวลผลโดย AVA เกินหนึ่งล้านต่อเดือน การเปลี่ยนไปใช้โมเดลภาษาที่ทันสมัยที่สุดก็สมเหตุสมผล” Sharif Ma กล่าว

หลายคนคิดว่า ChatGPT จะนำการเปลี่ยนแปลงที่รุนแรงมาสู่การบริการลูกค้าเสมือนจริง แต่ถ้าเราแค่พูดถึงคำถามและคำตอบง่ายๆ เช่น ธนาคารเปิดทำการกี่โมง และจำกัดการถอนสูงสุดเท่าไร การใช้ซีรี่ส์ GPT ที่ทรงพลังแต่มีราคาแพงก็ไม่จำเป็น

chatgpt
รูปภาพโดย: https://openai.com/blog/chatgpt/

การปลดล็อกศักยภาพของ ChatGPT และ GPT-3

แม้ว่า ChatGPT จะสามารถตอบคำถามส่วนใหญ่ได้ แต่ก่อนที่ ChatGPT จะเหมาะสำหรับการบริการลูกค้าในอุตสาหกรรมหรือองค์กรเฉพาะนั้น จำเป็นต้องมีการปรับเปลี่ยนเพิ่มเติม เพื่อเป็นแนวทางสำหรับผลลัพธ์ ตัวอย่างเช่น เมื่อต้องตอบคำถามที่ลูกค้าของธนาคาร A ถาม ระบบจำเป็นต้องเรียนรู้ข้อมูลที่เกี่ยวข้องสำหรับกรณีการใช้งานนี้และสร้างการตอบสนองที่เป็นไปตามกฎเฉพาะของธนาคารนี้

“ผมมองเห็นอนาคตที่สดใสสำหรับ GPT-3 ความก้าวหน้าในด้านของเทคนิค จะสร้างโอกาสทางธุรกิจใหม่ๆขึ้น เพียงแค่เปลี่ยนคำสองสามคำในคำแนะนำ การตอบสนองอาจแตกต่างกันโดยสิ้นเชิง ความเป็นไปได้ไม่มีที่สิ้นสุด และตอนนี้เรายังอยู่ในแค่ช่วงต้นของมันเท่านั้น” Hung-yi Lee กล่าว

หากคุณสามารถออกแบบคำแนะนำและกฎที่ถูกต้องได้ งั้นคุณก็มีงานขนาดเท่าท้องฟ้าที่ต้องจัดการ ดังที่ได้กล่าวไว้ก่อนหน้านี้ GPT-3 ตามค่าเริ่มต้นมีประสิทธิภาพอยู่แล้ว และประสิทธิภาพจะขึ้นอยู่กับผู้ใช้และวิธีที่พวกเขาใช้เครื่องมือไปสู่ผลลัพธ์ที่ต้องการ

“ยังอีกยาวไกลกว่าจะไปถึงขีดจำกัดของโมเดลภาษาขนาดใหญ่เหล่านี้ เพื่อให้เข้าใจเทคโนโลยีใหม่นี้ชัดเจนยิ่งขึ้น เราต้องเริ่มต้นด้วยการทำความเข้าใจโมเดลในปัจจุบันและการตอบสนองของพวกเขาอย่างลึกซึ้ง ในอนาคต นักวิจัยจำนวนมากจะจำแนกและวิเคราะห์ AI เพียงอย่างเดียว เช่นเดียวกับนักวิทยาศาสตร์ด้านสมองของ AI” Hung-yi Lee กล่าว

ความนิยมของ ChatGPT เติบโตเร็วกว่าที่คาดไว้และจุดเปลี่ยนถัดไปอาจอยู่ไม่ไกล “สิ่งที่ผมรอคอยจริงๆ คือ GPT-4 มันจะปฏิวัติอุตสาหกรรมนี้อย่างไม่ต้องสงสัย” Vic Shen กล่าว

AI และโมเดลภาษาขนาดใหญ่จะเปลี่ยนวิถีชีวิตของเราอย่างแน่นอน ไม่ว่าสถานการณ์จะเป็นอย่างไร ไม่ว่าเราจะคาดการณ์ พูดคุย หรือออกแบบอนาคต เรามักจะต้องการการสนทนามากขึ้นเพื่อสำรวจสิ่งที่ไม่รู้จัก และสิ่งนี้อาจเกี่ยวข้องกับการสนทนากับคนๆหนึ่งหรือคนอื่นๆ หรือเรียนรู้จากการโต้ตอบกับ ChatGPT

หากคุณต้องการเจาะลึกลงไปในโซลูชัน AI เชิงสนทนาสำหรับโรงแรม โปรดติดต่อทีมงานของเรา แล้วเราจะติดต่อกลับภายใน 2 วันทำการ

สั่งจองเพื่อทดลองใช้ฟรี

สั่งจองเพื่อทดลองใช้ฟรี ถ้าคุณสนใจใน AI ของเรา สามารถติดต่อและทดลองฟรีได้แล้ววันนี้!