Self-Supervised Learning โมเดล AI ที่เรียนรู้ได้เอง

หากใครที่เป็นนักพัฒนาเทคโนโลยี AI จะรู้ว่าการพัฒนา AI ต้องมีโมเดลสำหรับการพัฒนา ซึ่งส่วนใหญ่แล้วมักเป็นการใส่ข้อมูลที่มนุษย์ป้อนให้ AI ได้เรียนรู้ เพราะ AI ยังไม่สามารถเรียนรู้สิ่งต่าง ๆได้เอง 100% 

กระทั่ง 2 ปีที่แล้ว มีรูปแบบโมเดลการพัฒนาแบบใหม่เกิดขึ้น เรียกว่า Self-Supervised Learning ซึ่งเป็นโมเดลการพัฒนาที่จะทำให้ AI สามารถเรียนรู้สิ่งต่าง ๆ และแยกแยะได้ด้วยตนเอง โดยที่มนุษย์ไม่ต้องป้อนข้อมูล

Self-Supervised Learning คืออะไร

Self-Supervised Learning คือหนึ่งใน 3 แนวคิดของกระบวนการแบบ Deep Learning ประกอบด้วย  

  • Supervised Learning รูปแบบที่มนุษย์ต้องสอนผ่านกระบวนการแปะข้อมูล (Label) เช่นรูปภาพนี้คืออะไร ข้อความนี้แปลว่าอะไร
  • Unsupervised Learning เป็นรูปแบบที่ Deep Learning จะเรียนรู้รูปแบบของข้อมูลจาก Input ที่ได้มา จับกลุ่มของข้อมูล และสร้างเป็น Output ขึ้นมาเอง
  • Reinforcement Learning  คือ Deep Learning ที่จะเข้าไปมีปฏิสัมพันธ์กับสิ่งแวดล้อมด้วยตัวเอง คอยเรียนรู้ระบบและการทำงานที่ระบบสามารถลองผิดลองถูกด้วยตัวเองได้

สำหรับ AI ที่ใช้พัฒนาในปัจจุบันมักเป็นการพัฒนาในรูปแบบ Supervised Learning ซึ่งกำลังต่อยอดไปสู่เป็นแนวคิด Self-Supervised Learning แต่ก็ยังมีข้อจำกัด เนื่องจากต้องใช้ทรัพยากรคอมพิวเตอร์สมรรถนะสูงในการประมวลผลและสอนโมเดล และใช้เวลาในการเรียนรู้ที่ค่อนข้างมาก การประมวลผลในแต่ละครั้งจึงสิ้นเปลืองพลังงานไฟฟ้าสูง 

อย่างไรก็ตามข้อดีของ Self-Supervised Learning คือ ย่นระยะเวลาในการพึ่งพาการใส่ข้อมูลโดยมนุษย์ เพื่มความรวดเร็วในการพัฒนาโมเดล AI โดยเฉพาะการพัฒนาเทคโนโลยีด้านความปลอดภัยทางกายภาพ (Physical Security) ที่ต้องอาศัยการประมวลผลจากภาพ การเคลื่อนไหวหรือพฤติกรรมของมนุษย์ และข้อมูลทางชีวภาพต่าง ๆ แต่วิธีการพัฒนาแบบ Self-Supervised Learning  ก็ไม่ได้ใช้การประมวลผลจากภาพอย่างเดียว เพราะยังสามารถนำไปประยุกต์ใช้กับโมเดล AI อื่น ๆ ได้ 

ซึ่งตัวอย่างของการประมวลผลและเรียนรู้ข้อมูลมหาศาลได้ด้วยตนเอง ลดการใส่และแปะข้อมูลจากมนุษย์ นั่นคือ ChatGPT ในโมเดล GPT-3 และ GPT-4o หรือ Bidirectional Encoder Representations from Transformers (BERT) ของ Google 

ขณะที่กรณีศึกษาที่น่าสนใจจากงานวิจัยของ UK Biobank เรื่อง Self-supervised learning for human activity recognition using 700,000 person-days of wearable data ซึ่งศึกษาพฤติกรรมมนุษย์จำนวน 7 แสนคนต่อวัน นำข้อมูลจากสมาร์ทวอทช์หรือสายรัดข้อมือที่บันทึกข้อมูลการเคลื่อนไหว มาประมวลผลเพื่อสร้างแผนผังข้อมูลพฤติกรรมของมนุษย์ ปรับปรุงโมเดลให้เรียนรู้เองได้จนสามารถนำมาปรับใช้ในการวิเคราะห์ทางการแพทย์ เช่น ติดตามการเคลื่อนไหวเพื่อวินิจฉัยโรค หรือหากเป็นเรื่องของ Physical Security ก็อาจใช้สำหรับเรียนรู้พฤติกรรมปกติจากข้อมูลการเคลื่อนไหว (Motion Data) ของคนในพื้นที่ปลอดภัย เช่น พื้นที่โรงงาน สำนักงาน หรือสถานที่สำคัญ รวมถึงตรวจจับพฤติกรรมที่ไม่ปกติ เช่น การเคลื่อนไหวที่ผิดแผน การบุกรุก หรือพฤติกรรมต้องสงสัย เป็นต้น

ที่มา : IBM, Nature

สอบถามข้อมูลผลิตภัณฑ์ “OneFence”

Tel. : 061-462-6414, 02-103-6462
Line : @securitypitch
Email : [email protected]

บทความที่น่าสนใจ