Supervised learning คืออะไร? มีความสำคัญต่อการพัฒนา Model AI อย่างไร?

Supervised learning คืออะไร? มีความสำคัญต่อการพัฒนา Model AI อย่างไร?

Supervised learning คืออะไร? หากแปลตรงตัว Supervised Learning จะมีความหมายว่า การเรียนรู้ในรูปแบบที่มีคนคอยควบคุมการเรียนรู้ของปัญญาประดิษฐ์ (AI) ซึ่งการควบคุมในที่นี้ คือควบคุมผ่านการคุมผลลัพธ์ (Output) ของข้อมูล (Input) ที่ได้ป้อนให้ปัญญาประดิษฐ์เรียนรู้ – ถ้าเปรียบเทียบกับการเรียนรู้ของคน กรณีตัวอย่างก็คือการสอนให้รู้ว่าสัตว์ต่างๆ มีลักษณะดังนี้ (Input) จะเรียกว่าอะไร (Output) เช่นสัตว์ที่มีความน่ารัก ตัวยืดๆ ทำตัวขี้เกียจ และมีมนุษย์เป็นทาส (Input) เรียกว่าแมว (Output)

จากกรณีตัวอย่างดังกล่าว จะเห็นได้ว่าความหมายของ Supervised learning เป็นการป้อน Input พร้อมกับ Output เพื่อให้ปัญญาประดิษฐ์หาความเชื่อมโยงโดยข้อมูลที่มีการจับคู่ Input กับ Output เข้าด้วยกันจะเรียกว่า Label Data หรือข้อมูลที่ถูกติดป้ายนั้นเอง

ประเภทของ Supervised Learning

Supervised Learning สามารถแบ่งได้เป็น 2 ประเภทใหญ่ๆ ซึ่งแบ่งตามผลลัพธ์หรือ Output ที่ต้องการ

  1. Classification: Output ในกรณีนี้จะเป็นค่าที่ไม่มีความต่อเนื่อง ยกตัวอย่างเช่น กลุ่มของสี (ม่วง, แดง, เขียว, อื่นๆ) หรือประเภทของสัตว์ (ปลา, หมา, แมว, นก, อื่นๆ)

  2. Regression: Output ในกรณีนี้จะเป็นค่าที่มีความต่อเนื่องยกตัวอย่างเช่น อายุ, ราคาสินค้า

ตัวอย่างของ Supervised Learning

  • การจำแนก Email ว่าเป็น Spam หรือไม่ – โดยการใช้ Input เป็นข้อมูลของผู้ส่งข้อความ หัวข้อของ Email เนื้อหาของ Email และอื่นๆ และใช้ Output เป็นประเภทของข้อความว่าเป็น Spam หรือไม่เราสามารถใช้ Input และ Output เหล่านี้ในการคาดการณ์ Email ที่ยังไม่เคยเจอว่าเป็น Spam หรือไม่

  • การประเมินความน่าเชื่อถือของผู้กู้เงิน – โดยการใช้ Input เป็นข้อมูลของผู้คนที่เคยกู้เงินในอดีตเช่น ประวัติของบัญชี รายได้ของผู้กู้ สถานะทางการงาน และ Output เป็นความสามารถในการคืนเงินที่กู้ไป ด้วยกระบวนการดังกล่าว ผู้กู้เงินในอนาคตสามารถถูกประเมินได้ว่ามีความสามารถในการคืนเงินหรือไม่ จากข้อมูลของผู้กู้ดังกล่าวในอนาคต

  • การแปลงเสียงเป็นข้อความ – โดยการใช้ Input เป็นลักษณะของเสียงได้แก่ Pitch (ระดับเสียง), Amplitude (ความแรงของเสียง), Frequency (ความถี่เสียง) และ Output เป็นข้อความอักษรที่ตรงกับข้อความเสียงเหล่านั้น ด้วยการทำ Supervised Learning ด้วยข้อมูลดังกล่าวจะทำให้ในอนาคตการแปลงเสียงเป็นข้อความอักษรในอนาคตสามารถทำได้ สำหรับข้อความอื่นๆ แม้จะเป็นข้อความที่ตัวปัญญาประดิษฐ์ไม่เคยพบ

ความแตกต่างระหว่าง Supervised Learning และ Unsupervised Learning

ความแตกต่างจะมาจากข้อมูลที่ใช้ในการสอนปัญญาประดิษฐ์โดย Unsupervised learning จะไม่มี Label หรือการแนบ Output ไปพร้อมกับ Input ทำให้เกิดลักษณะดังนี้

  • Unsupervised Learning จะไม่ต้องใช้ทรัพยากรสำหรับเตรียม Label
  • มีความอัตโนมัติในการเรียนรู้มากกว่า
  • งานที่สามารถทำโดย Unsupervised Learning ได้แก่การจัดกลุ่มข้อมูลจาก Input Features ต่างๆ

โดยสรุป Supervised Learning เน้นที่การหาความสัมพันธ์ระหว่าง Input กับ Output ในขณะที่ Unsupervised Learning เน้นที่การหาความสัมพันธ์ระหว่าง Input ด้วยกันเอง

ประโยชน์ของ Supervised Learning

  • สามารถควบคุมการเรียนรู้ได้อย่างเต็มที่ เนื่องจาก Label ที่ปัญญาประดิษฐ์ทำการเรียนรู้ถูกคุมด้วยมนุษย์ ทำให้ความสัมพันธ์ของข้อมูลและผลลัพธ์สามารถมั่นใจได้ว่ามีความหมายเมื่อเปรียบเทียบกับ Unsupervised Learning ที่ขั้นตอน และสิ่งที่เรียนรู้ถูกซ่อนอยู่เบื้องหลัง AI มากกว่า
  • ทดสอบผลลัพธ์และความแม่นยำของ Supervised Learning มีความง่ายและถูกต้องมากกว่า Unsupervised Learning เนื่องจากมี Output หรือ Label ที่สามารถใช้ในการทดสอบ
  • ความสัมพันธ์ระหว่าง Input และ Output ที่สามารถเรียนรู้ได้ผ่าน Supervised Learning มีความหลากหลายและไม่จำเป็นต้องมีความสัมพันธ์เชิงเส้น
  • Supervised Learning สามารถทำการเรียนรู้ความสัมพันธ์ที่ครอบคลุมถึงข้อมูลที่ปัญญาประดิษฐ์ยังไม่เคยเจอ

ข้อจำกัดของ Supervised Learning

ข้อมูลที่จะใช้สำหรับสอนใน Supervised Learning ต้องมีคุณภาพสูงและมีการควบคุมที่ดี ดังนั้นจึงทำให้เกิดข้อจำกัดดังนี้

  • ข้อมูลที่ใช้ต้องมีการเตรียม Label ซึ่งตัว Label นี้ต้องได้รับการเตรียมที่ถูกต้องดังนั้นสำหรับบางเนื้อหาหรือบางอุตสาหกรรม จำเป็นต้องมีผู้เชี่ยวชาญเรื่องนั้นๆ ในการช่วยเตรียม Label
  • การเตรียม Label นอกจากผู้เชี่ยวชาญที่ดีแล้วยังต้องใช้ทรัพยากร และเวลาสำหรับเตรียมอีกด้วย

อย่างไรก็ตาม ข้อจำกัดดังกล่าวจะขึ้นอยู่กับขั้นตอนการเตรียม Supervised Learning และความสัมพันธ์ระหว่าง Input และ Output ที่หาได้ อาจจะ Overfit หรือใช้ได้ดีกับข้อมูลที่เตรียมมา หรืออาจทำนายไม่แม่นสำหรับข้อมูลที่ปัญญาประดิษฐ์ไม่เคยพบ

สรุป

Supervised Learning เป็นการสอนให้ปัญญาประดิษฐ์เรียนรู้ความสัมพันธ์ระหว่าง Input และ Output ของข้อมูล โดยการใช้ความสัมพันธ์ Output สามารถถูกคาดเดาได้ด้วย Input ถึงแม้จะไม่อยู่ในข้อมูลที่สอนไป แต่หากรูปแบบความสัมพันธ์ระหว่าง Input กับ Output ของข้อมูลที่สอนไปมีความละเอียดมากพอ เพราะฉะนั้นประสิทธิภาพและประเภทของงานที่ดำเนินโดย Supervised Learning มักจะมีมากกว่า Unsupervised Learning แต่มักจะมาด้วยการใช้ทรัพยากรที่มากกว่าสำหรับเตรียม Label และการ Label ต้องมีคุณภาพ เพราะหากข้อมูลมีความผิดพลาดหรือไม่ดีพอ อาจทำให้ลดประสิทธิภาพของปัญญาประดิษฐ์ได้ นอกจากนี้การทำ Supervised Learning ต้องระวัง Overfitting เพื่อการทำนาย Output ในอนาคตสำหรับ Input ที่ไม่เคยเห็นให้แม่นยำขึ้น

Author: Akkanit Pornpattanadul (Data Scientist)

สนใจสอบถามเพิ่มเติมเกี่ยวกับ Supervised Learning เครื่องมือสำหรับการพัฒนา AI ให้พร้อมใช้งานติดต่อเราได้ที่ sales@datawow.io หรือโทร 02-024-5560