Supervised learning คืออะไร? หากแปลตรงตัว Supervised Learning จะมีความหมายว่า การเรียนรู้ในรูปแบบที่มีคนคอยควบคุมการเรียนรู้ของปัญญาประดิษฐ์ (AI) ซึ่งการควบคุมในที่นี้ คือควบคุมผ่านการคุมผลลัพธ์ (Output) ของข้อมูล (Input) ที่ได้ป้อนให้ปัญญาประดิษฐ์เรียนรู้ – ถ้าเปรียบเทียบกับการเรียนรู้ของคน กรณีตัวอย่างก็คือการสอนให้รู้ว่าสัตว์ต่างๆ มีลักษณะดังนี้ (Input) จะเรียกว่าอะไร (Output) เช่นสัตว์ที่มีความน่ารัก ตัวยืดๆ ทำตัวขี้เกียจ และมีมนุษย์เป็นทาส (Input) เรียกว่าแมว (Output)
จากกรณีตัวอย่างดังกล่าว จะเห็นได้ว่าความหมายของ Supervised learning เป็นการป้อน Input พร้อมกับ Output เพื่อให้ปัญญาประดิษฐ์หาความเชื่อมโยงโดยข้อมูลที่มีการจับคู่ Input กับ Output เข้าด้วยกันจะเรียกว่า Label Data หรือข้อมูลที่ถูกติดป้ายนั้นเอง
Supervised Learning สามารถแบ่งได้เป็น 2 ประเภทใหญ่ๆ ซึ่งแบ่งตามผลลัพธ์หรือ Output ที่ต้องการ
Classification: Output ในกรณีนี้จะเป็นค่าที่ไม่มีความต่อเนื่อง ยกตัวอย่างเช่น กลุ่มของสี (ม่วง, แดง, เขียว, อื่นๆ) หรือประเภทของสัตว์ (ปลา, หมา, แมว, นก, อื่นๆ)
Regression: Output ในกรณีนี้จะเป็นค่าที่มีความต่อเนื่องยกตัวอย่างเช่น อายุ, ราคาสินค้า
การจำแนก Email ว่าเป็น Spam หรือไม่ – โดยการใช้ Input เป็นข้อมูลของผู้ส่งข้อความ หัวข้อของ Email เนื้อหาของ Email และอื่นๆ และใช้ Output เป็นประเภทของข้อความว่าเป็น Spam หรือไม่เราสามารถใช้ Input และ Output เหล่านี้ในการคาดการณ์ Email ที่ยังไม่เคยเจอว่าเป็น Spam หรือไม่
การประเมินความน่าเชื่อถือของผู้กู้เงิน – โดยการใช้ Input เป็นข้อมูลของผู้คนที่เคยกู้เงินในอดีตเช่น ประวัติของบัญชี รายได้ของผู้กู้ สถานะทางการงาน และ Output เป็นความสามารถในการคืนเงินที่กู้ไป ด้วยกระบวนการดังกล่าว ผู้กู้เงินในอนาคตสามารถถูกประเมินได้ว่ามีความสามารถในการคืนเงินหรือไม่ จากข้อมูลของผู้กู้ดังกล่าวในอนาคต
การแปลงเสียงเป็นข้อความ – โดยการใช้ Input เป็นลักษณะของเสียงได้แก่ Pitch (ระดับเสียง), Amplitude (ความแรงของเสียง), Frequency (ความถี่เสียง) และ Output เป็นข้อความอักษรที่ตรงกับข้อความเสียงเหล่านั้น ด้วยการทำ Supervised Learning ด้วยข้อมูลดังกล่าวจะทำให้ในอนาคตการแปลงเสียงเป็นข้อความอักษรในอนาคตสามารถทำได้ สำหรับข้อความอื่นๆ แม้จะเป็นข้อความที่ตัวปัญญาประดิษฐ์ไม่เคยพบ
ความแตกต่างระหว่าง Supervised Learning และ Unsupervised Learning
ความแตกต่างจะมาจากข้อมูลที่ใช้ในการสอนปัญญาประดิษฐ์โดย Unsupervised learning จะไม่มี Label หรือการแนบ Output ไปพร้อมกับ Input ทำให้เกิดลักษณะดังนี้
โดยสรุป Supervised Learning เน้นที่การหาความสัมพันธ์ระหว่าง Input กับ Output ในขณะที่ Unsupervised Learning เน้นที่การหาความสัมพันธ์ระหว่าง Input ด้วยกันเอง
ประโยชน์ของ Supervised Learning
ข้อจำกัดของ Supervised Learning
ข้อมูลที่จะใช้สำหรับสอนใน Supervised Learning ต้องมีคุณภาพสูงและมีการควบคุมที่ดี ดังนั้นจึงทำให้เกิดข้อจำกัดดังนี้
อย่างไรก็ตาม ข้อจำกัดดังกล่าวจะขึ้นอยู่กับขั้นตอนการเตรียม Supervised Learning และความสัมพันธ์ระหว่าง Input และ Output ที่หาได้ อาจจะ Overfit หรือใช้ได้ดีกับข้อมูลที่เตรียมมา หรืออาจทำนายไม่แม่นสำหรับข้อมูลที่ปัญญาประดิษฐ์ไม่เคยพบ
Supervised Learning เป็นการสอนให้ปัญญาประดิษฐ์เรียนรู้ความสัมพันธ์ระหว่าง Input และ Output ของข้อมูล โดยการใช้ความสัมพันธ์ Output สามารถถูกคาดเดาได้ด้วย Input ถึงแม้จะไม่อยู่ในข้อมูลที่สอนไป แต่หากรูปแบบความสัมพันธ์ระหว่าง Input กับ Output ของข้อมูลที่สอนไปมีความละเอียดมากพอ เพราะฉะนั้นประสิทธิภาพและประเภทของงานที่ดำเนินโดย Supervised Learning มักจะมีมากกว่า Unsupervised Learning แต่มักจะมาด้วยการใช้ทรัพยากรที่มากกว่าสำหรับเตรียม Label และการ Label ต้องมีคุณภาพ เพราะหากข้อมูลมีความผิดพลาดหรือไม่ดีพอ อาจทำให้ลดประสิทธิภาพของปัญญาประดิษฐ์ได้ นอกจากนี้การทำ Supervised Learning ต้องระวัง Overfitting เพื่อการทำนาย Output ในอนาคตสำหรับ Input ที่ไม่เคยเห็นให้แม่นยำขึ้น
Author: Akkanit Pornpattanadul (Data Scientist)
สนใจสอบถามเพิ่มเติมเกี่ยวกับ Supervised Learning เครื่องมือสำหรับการพัฒนา AI ให้พร้อมใช้งานติดต่อเราได้ที่ sales@datawow.io หรือโทร 02-024-5560