Generative AI คือ AI หรือปัญญาประดิษฐ์ประเภทหนึ่ง ที่สามารถใช้เพื่อสร้างคอนเทนต์ใหม่ได้ รวมไปถึง รูปภาพ วีดีโอ เสียง ฯลฯ ซึ่ง ChatGPT ได้เข้ามามีบทบาทสำคัญในการทำให้คนทั่วไปรู้ซึ้งถึง ศักยภาพของ generative AI และเข้าถึงการใช้งานได้ง่ายขึ้น โดย หลังจากห้องแล็บวิจัยปัญญาประดิษฐ์ OpenAI ได้เปิดตัว โมเดล ChatGPT (GPT-3) ในช่วงเดือนพฤษจิกายน ปี 2022 Statista ได้รายงานยอดผู้ใช้งานถึง 1 ล้านคน หลังจากเปิดตัวเพียง 5 วัน และในปัจจุบัน ChatGPT มีผู้ใช้งานรายเดือนมากกว่า 100 ล้านคน
หลังจากประสบความสำเร็จครั้งใหญ่ OpenAI ได้เปิดตัว GPT-4 ได้เปิดตัว GPT-4 เมื่อเดือนมีนาคม 2023 ที่มีความซับซ้อนมากกว่า GPT-3.5 ถึง 10 เท่า สิ่งที่น่าอัศจรรย์เกี่ยวกับ ChatGPT คือ ความง่ายในการใช้งาน โดยเพียงแค่ป้อนชุดคำสั่ง ‘ภาษาที่ใช้ในชีวิตประจำวันทั่วไป’ หรือ Prompt เพื่อให้ AI ประมวลผลลัพธ์ และทำตามคำสั่ง ก็สามารถแสดงผลลัพธ์ได้ในไม่กี่วินาทีด้วยข้อมูลที่กระชับและใช้ภาษาที่เหมาะสม การที่ ChatGPT-3 ถูกฝึกด้วยองค์ความรู้มากมายถึง 570 GB ทำให้สามารถนำไปประยุกต์ใช้ได้อย่างหลากหลายในการตอบสนองคำถามในแขนงต่างๆ ซึ่งตัว ChatGPT-4 ที่ได้รับการฝึกจากข้อมูลที่มากขึ้นและ ก็ได้พัฒนาอย่างก้าวกระโดด ทั้งในเชิงการใช้ภาษา ความคิดสร้างสรรค์ การวิเคราะห์รูปภาพ ฯลฯ อีกมากมาย จึงยิ่งเพิ่มกระแสความสนใจในตัวเทคโนโลยีนี้เป็นอย่างมาก โดย Mckinsey ได้ตีมูลค่าทางเศรษฐกิจของ Generative AI ไว้สูงถึง 4.4 ล้านล้านดอลลาร์
AI ย่อมาจาก Artificial Intelligence หรือ“ปัญญาประดิษฐ์”– คือ คำจำกัดความกว้างๆ ของ เทคโนโลยีที่มีการทำงานอย่างชาญฉลาด จนสามารถสร้างกระบวนการในการรับข้อมูลและตัดสินใจได้คล้ายๆ กับความคิดของมนุษย์ ในยุค Digital ที่มีข้อมูลจำนวนมาก มี Big Data ไหลเวียนอยู่มากมายอยู่ตลอดเวลา จึงสามารถนำมาใช้ฝึก AI ให้ทำงานในด้านต่างๆ และนำไปประยุกต์ใช้ได้อย่างหลากหลายมากขึ้น ซึ่งก่อนหน้านี้การประยุกต์ใช้ AI จะเน้นไปที่การประมวลผลเพื่อทำนายผลลัพธ์ที่จะเกิดขึ้นในอนาคต เพื่อทำให้กระบวนการหรืองานที่ต้องทำซ้ำๆ เป็นระบบอัตโนมัติ หรือ ช่วยในการตัดสินใจ ส่วน Generative AI ถือว่าเป็น AI แขนงหนึ่งที่สามารถสร้างข้อมูลที่ไม่มีอยู่จริง โดยสอน AI ให้เรียนรู้จากแบบจำลองของข้อมูลสิ่งต่างๆ ที่มีอยู่จริง
จนถึงตอนนี้ เราได้ทำความเข้าใจว่า Generative AI ถือว่าเป็น AI แขนงหนึ่งที่สร้างคอนเทนต์ใหม่ได้ ในลำดับถัดไปเราจะเจาะลึกเข้าไปว่า Generative AI ทำงานอย่างไร ซึ่งก่อนอื่นเราควรจะเข้าใจชั้นต่างๆ ของ ระบบ AI คืออะไร รวมไปถึง machine learning และ deep learning
Machine Learning (ML) คือ ส่วนการเรียนรู้ของระบบคอมพิวเตอร์ ซึ่งมนุษย์มีเพียงหน้าที่เขียนโปรแกรมให้ AI เรียนรู้จากข้อมูลเท่านั้นหลังจากนั้นจะเป็นระบบคอยเรียนรู้และจัดการต่อเอง โดย ML สามารถจำแนกหมวดหมู่ได้ โดยการจดจำและใช้ข้อมูลที่ได้รับ Label หรือป้ายชื่อ (Supervise) ซึ่งข้อมูลเหล่านี้จะถูกฝึกฝนโดยผู้เชี่ยวชาญ เช่น ตัว Algorithm ของ ML อาจจะเรียนรู้ว่าแมลงมี 6 ขา ส่วนแมงมี 8 ขา เพราะฉะนั้นแมลงเต่าทองซึ่งมี 6 ขาจึงจัดว่าเป็นแมลง
Deep Learning (DL) เป็นประเภทย่อยเฉพาะของ ML ที่ใช้เครือข่ายประสาทเทียมซึ่งถูกออกแบบคล้ายกลไกทางชีวภาพของมนุษย์ในการประมวลผล ซึ่งชุดข้อมูลเทียมจะถูกป้อนเข้าไปในฐานะ Input โดยไม่จำเป็นต้อง Label ตัวชุดข้อมูลทั้งหมดก่อน (Unsupervise) โดยตัวข้อมูลจะผ่านการวิเคราะห์หลายชั้นจากเครือข่ายประสาทเทียมใน (Artificial Neural Network: ANN) ก่อนออกมาเป็นชั้น output ซึ่งได้ทำการเข้าใจและแยกแยะลักษณะของข้อมูลต้นฉบับ (Feature Extraction) ในตัวเครือข่ายประสาทเทียม (ANN) โดยโมเดล DL สามารถหาลักษณะข้อมูลทางคณิตศาตร์ที่ยังไม่ได้รับการระบุก่อนโดยมนุษย์ได้ เช่น ตัว Algorithm ของ DL อาจจะสามารถสร้างสมการเพื่อแยกแยะประเภทของนกปักษาสวรรค์ (Bird-of-paradise) ซึ่งเป็นนกที่มีสีสันฉูดฉาดสวยงามได้ โดยสร้างสมการสำหรับ ความยาวของปาก หรือ ลายจุดที่ปีก
Generative AI เป็น Semi-Supervised ที่ได้รับการฝึกจากข้อมูลที่ไม่ได้รับการป้ายชื่อ (Unsupervised คล้าย DL) แล้วทำการปรับโฉมใหม่เพื่อสามารถสร้างผลลัพธ์ที่ซับซ้อนขึ้นโดยใช้ข้อความในการป้อนข้อมูล และอาจสร้างข้อมูลจากบริบทที่ไม่เคยเกิดขึ้นมาก่อน เช่น ChatGPT ใช้เครือข่ายประสาทแบบตัวแปร (Transformer Neural Network) ที่ถูกฝึกก่อนบนข้อความที่ไม่ได้รับการป้ายชื่อ (Unsupervised) จำนวนมากเพื่อเข้าใจรูปแบบของภาษา ในขั้นตอนนี้เรียกว่าโมเดลภาษาขนาดใหญ่ (Large Language Model : LLM) โมเดลจะถูกปรับโฉมเพิ่มเติมเพื่อตอบคำถามของผู้ใช้งาน โดย GPT-3 ซึ่งมี Parameter อยู่ในตัวเครือข่ายมีเครือข่ายประสาทเทียมถึง 175 พันล้านอัน จึงทำให้สามารถนำไป Fine-Tuning หรือกระบวนการฝึกโมเดลภาษา เพื่อจดจำ Input หรือชุดข้อมูลใหม่ แล้วนำไปประยุกต์ใช้งานต่อ เช่นเชื่อมต่อตัวโมเดลกับชุดข้อมูลบทภาพยนตร์ (Script) ของ Quentin Tirantino เพื่อฝึกโมเดลภาษาให้สามารถเขียนบทภาพยนตร์ที่ขับเคลื่อนด้วยตัวละคร ตามสไตล์ของ Quentin Tirantino ได้ โดย Transformer ถือเป็น Algorithm เพียงรูปแบบหนึ่งของ Generative AI เท่านั้น ซึ่งยังมี Algorithm ประเภทอื่นๆ อีกมากมาย เช่น Generative adversarial network: GANs (นิยมใช้ในการสร้างภาพ) และ Variational autoencoders: VAEs (นิยมใช้ในการสร้างเสียง)
Generative AI เป็นนวัตกรรมที่มีศักยภาพที่จะปฎิวัติวิธีการที่เราสร้างสรรค์คอนเทนต์โดยสิ้นเชิง ซึ่งสามารถช่วยให้คุณทำงานได้รวดเร็วและมีประสิทธิภาพมากขึ้น เช่น การหาไอเดีย การช่วยปรับทำงานให้ดีขึ้นหรือเร็วขึ้นได้ โดยเราจะแบ่งหมวดหมู่ของ Generative AI คร่าวๆตาม landscape ของ Sequoia Capital
Source: Sequoia Capital’s generative AI Landscape
1. AI Text / AI Chatbot ใช้ในการหาไอเดียเบื้องตน (เช่น Alisa ai – ของคนไทย) สรุปเนื้อหาโดยอัตโนมัติ ปรับปรุงไวยากรณ์ (เช่น ChatGPT, Bard, Claude) เขียนข้อความส่วนบุคคลสำหรับการขายหรือการบริการลูกค้า (เช่น Jasper, Copy.ai) การสวมบทบาทเป็นบุคคลต่างๆ (เช่น Character ai, ai dungeon, novel ai, beta character )
2. AI Video ใช้ AI สร้างคลิปวิดีโอ (synthesia, D-ID) หรือ ช่วยในการตัดต่อคลิปวิดีโอได้ (Pictory, Runway, VEED.io)
3. AI Image ใช้ AI วาดรูป หรือ สร้างภาพ เช่น Dall-E, Midjourney, DreamStudio, Playground AI Adobe Photoshop (Firefly), Bing AI ใช้ออกแบบเว็บ เช่น Designs.AI ใช้ออกแบบโลโก้ เช่น Lensa AI ใช้ตัดต่อภาพ เช่น Clipdrop AI, Autoenhance.ai
โดยเมื่อเร็วๆนี้ ได้มีกระแส AI Creative นำชื่อ จังหวัด ทางภาคต่างๆ มาสร้างสรรค์ป้ายชื่อจังหวัดจากภาพสถานที่ท่องเที่ยวชื่อดังของแต่ละจังหวัด และมาผนวกกับภาพธรรมชาติ ด้วย Stable Diffusion ถึงกระนั้นการจะได้ผลลัพธ์ที่มีความสมจริงดั้งป้ายชื่อจังหวัดที่ถูกให้ความสนใจนั้น จำเป็นต้องใช้ความคุ้นเคยกับ ตัว Platform ทักษะในการสั่งงาน (Prompt) และ อาจจำเป็นต้องใช้ Software เพิ่มเติม เช่น Photoshop
ภาพนี้สร้างขึ้นด้วย Bing AI
4. AI Code (เขียนโค้ด) ช่วยเขียนโค้ด (GitHub Copilot, replit, CodeGPT) ทำความเข้าใจโค้ด (Code Interpreter ฟีเจอร์ใหม่ล่าสุดของ ChatGPT Plus)
5. AI Speech (คำพูด) ใช้ สรุปหรือสร้างข้อความ เช่น Speechify, Voicemaker ใช้ เขียน ซับไตเติ้ล เช่น Scriptme.io ใช้ ดนตรี เช่น Uberduck AI, Beatoven.ai, Audioshake
6. อื่นๆ ใช้ เรียนภาษา เช่น Duolingo ใช้ สร้างสไลด์สำหรับ Presentation เช่น Gamma AI, Decktopus
สิ่งที่พิเศษสำหรับ Generative AIi คือเป็นเครื่องมือที่เข้าถึงคนทั่วไปได้ง่าย โดยหลักๆ อาจจะใช้เพียงแค่ป้อนชุดคำสั่ง ‘ภาษาที่ใช้ในชีวิตประจำวันทั่วไป’ หรือ Prompt เข้าไปใน Platform ต่างๆ เพื่อสร้างคอนเทนต์ใหม่ได้ แต่ในอนาคตตัว Generative AI มีความเป็นไปได้สูงที่จะมีบทบาทใน การ Co-Pilot มากชึ้นเพื่อให้ทำงานได้อย่างมีประสิทธิภาพมากขึ้น โดยจะทุกรวมกับตัว Application ต่างๆ เช่น Microsoft Copilot ซึ่งเป็น Function ที่จะไปอยู่ใน ชุด โปรแกรมของ Microsoft โดยเป็น Chatbot ที่คอยช่วยเหลือผู้ใช้งานในการสร้างเนื้อหาตามข้อมูลที่ป้อนเข้าไป อย่างเช่นการทำ Data Visualization เพื่อวิเคราะห์ข้อมูลจาก Spreadsheet รวมถึงการตอบคำถาม Insight ของข้อมูลที่มี ใน Microsoft Excel หรือ การเขียนเอกสาร, การช่วยแก้ไขเอกสาร และการสรุปรวมเอกสาร ใน Microsoft Word
เลือกแพลตฟอร์ม: เริ่มโดยการเลือกแพลตฟอร์ม AI ที่เหมาะกับความต้องการของคุณ ขึ้นอยู่กับว่าคุณต้องการสร้างเนื้อหาเป็นข้อความ รูปภาพ เสียง วิดีโอ ฯลฯ
เข้าไปในแพลตฟอร์ม: ลงทะเบียนหรือเข้าสู่ระบบในแพลตฟอร์มที่คุณเลือก บางแพลตฟอร์มอาจจะต้องการคุณสร้างบัญชีก่อนที่คุณจะเริ่มใช้บริการของพวกเขา
ป้อนข้อมูล (Prompt): ใส่ Prompt หรือข้อมูลเกี่ยวกับเนื้อหาที่คูณต้องการให้ AI สร้าง โดย AI จะทำการสร้างเนื้อหาต่อไปโดยอิงจากข้อมูลเริ่มต้น
ปรับแต่ง: บางแพลตฟอร์มสามารถปรับแต่งเนื้อหาที่สร้างเพิ่มเติมได้ เพื่อให้ตรงกับความต้องการมากขึ้น
ส่งออกหรือใช้งาน: สามารถส่งออกในรูปแบบที่ต้องการได้ เช่น บันทึกข้อความเป็นเอกสาร ดาวน์โหลดรูปภาพวิดีโอ หรือ ไฟล์เสียง หรือคัดลอกโด้คที่สร้างขึ้นสำหรับการใช้งานต่อไป
ทำซ้ำและทดลอง: อย่ากลัวที่จะทดลองใช้ข้อมูลหรือ Prompt ที่แตกต่างกันเพื่อทดสอบความสามารถของ AI ในการสร้างเนื้อหา ซึ่งจะช่วยนำไปสู่ผลลัพธ์ที่ดีขึ้น
เมื่อคุณเลือกแพลตฟอร์ม AI สำหรับการใช้งาน มีปัจจัยสำคัญหลายอย่างที่ควรพิจารณาเพื่อให้แน่ใจว่าคุณกำลังตัดสินใจได้ถูกต้อง:
ความง่ายในการใช้งาน: มีอินเทอร์เฟซที่ใช้งานง่าย ไม่ต้องการทักษะทางเทคนิคที่ซับซ้อน ใช้งานง่ายและมีคำแนะนำที่ชัดเจน
ความสามารถ: แต่ละแพลตฟอร์มมีความสามารถและความเชี่ยวชาญที่แตกต่างกัน เช่นสร้างเนื้อหา สร้างภาพ หรือสร้างวิดีโอ ควรเลือกแพลตฟอร์มที่สอดคล้องกับความต้องการใช้งาน
คุณภาพของผลลัพธ์: ประเมินคุณภาพของเนื้อหาและผลลัพธ์ที่ถูกสร้างขึ้นว่ามีความสอดคล้อง ถูกต้อง และสร้างสรรค์ตามความคาดหวังหรือไม่
การปรับแต่ง: ความสามารถในการปรับแต่งเนื้อหาให้มีความเกี่ยวข้องและตรงตามความต้องการส่วนบุคคลมากขึ้น (Personalization)
ข้อมูลและการสร้างโมเดล: เข้าใจแหล่งข้อมูลการฝึกอบรมและแบบจำลองหลักที่แพลตฟอร์มใช้ แพลตฟอร์มที่ใช้ชุดข้อมูลที่หลากหลายและเชื่อถือได้มักจะสร้างผลลัพธ์ที่ดีขึ้น
ความเป็นส่วนตัวและความปลอดภัย: AI ที่ใช้เทคโนโลยีสร้างเนื้อหา อาจมีการรั่วไหลของข้อมูลส่วนบุคคลได้ จึงควรเลือกใช้แพลตฟอร์มที่ปฏิบัติตามมาตรฐานการป้องกันความปลอดภัยและความเป็นส่วนตัวของข้อมูล
การซัพพอร์ต: แพลตฟอร์มควรมีการซัพพอร์ตที่เข้าถึงได้ง่าย เช่นมีเอกสารคู่มือให้อ่าน หากพบปัญหาหรือมีข้อสงสัยในการใช้งาน
ความสามารถในการสเกล: โดยเฉพาะในระดับองค์กรณ์ ควรพิจารณาว่าแพลตฟอร์มที่เลือกสามารถจัดการกับปริมาณของเนื้อหาที่คุณต้องการจะผลิตได้ โดยแพลตฟอร์มที่สเกลได้ดี ควรมีความยืดหยุ่นเรื่องราคา ใช้เวลาในการตอบสนองได้รวดเร็ว (Response Times) และ รับรองกระบวนการสร้างเนื้อหาที่ราบรื่นเมื่อ Workload ในการใช้งานของคุณเพิ่มขึ้น (Workload Fluctuations)
Generative AI สามารถใช้ฟรีได้ไหม? Generative AI Platform ส่วนใหญ่ต้องการให้ผู้ใช้ลงทะเบียนหรือเข้าสู่ระบบ ซึ่งบางแพลตฟอร์มจะต้องสร้างบัญชีก่อน จึงจะเริ่มใช้บริการได้ ซึ่ง Platform ส่วนใหญ่สามารถเริ่มต้นใช้งานได้ฟรี เช่น ChatGPT-3.5 ปัจจุบัน และหลายๆ Platform มีค่าบริการ เช่น ChatGPT-4 เริ่มต้นเดือนละ 20 ดอลลาร์สหรัฐ หรือราว 680 บาท หรือ Midjourney เปิดให้สร้างภาพฟรี 25 รูปแรก หลังจากนั้นจะเสียค่าบริการ 10 ดอลลาร์ (340 บาท) หรือ 30 ดอลลาร์ (1020 บาท) ต่อเดือน ขึ้นอยู่กับจำนวนภาพที่ต้องการสร้าง เป็นต้น
Generative AI เป็นนวัตกรรมที่มีศักยภาพที่จะปฎิวัติการทำงาน ถึงแม้ทุกคนจะสามารถเข้าถึงทักษะขั้นพื้นฐานในการใช้งาน Generative AI ได้ แต่การจะดึงศักยภาพจาก Generative AI ได้ จำเป็นต้องใช้ความเข้าใจศาตร์ในการใช้งาน เช่น Prompt Engineering ในการออกคำสั่ง (Prompt) ที่ชัดเจน พร้อมบริบทที่ครบถ้วน เพื่อดึงประสิทธิภาพสูงสุดของ AI มาใช้ เช่น การทำ Data Analytics ด้วย ChatGPT Code Interpreter ได้อย่างมีประสิทธิภาพและรวดเร็วแบบ End-to-End โดยไม่ต้องเขียนโค้ด ซึ่งทาง Data Wow ได้เปิดคอร์ส Accelerate your Data Analytics with ChatGPT ที่ทำให้ผู้เรียนสามารถวิเคราะห์ได้โดยไม่ต้องเขียนโค้ด ภายใน 6 สัปดาห์! ถ้าสนใจสามารถสอบถามข้อมูลเพิ่มเติมได้ที่ sales@datawow.io หรือโทร 02-024-5560