หน้าแรก | โมเดลพยากรณ์ EF | ปัจจัยที่เกี่ยวข้องกับ EF | เกี่ยวกับโครงการ

โมเดลพยากรณ์ EF

โครงการพยากรณ์ EF เด็กปฐมวัย ได้เก็บข้อมูลเด็กปฐมวัยจำนวนประมาณ 2,000 คนในศูนย์พัฒนาเด็กเล็กทั่วทั้งจังหวัดลพบุรี และได้นำข้อมูลที่เก็บได้มาเชื่อมโยงกับผลการประเมิน EF ของเด็กกลุ่มเดียวกันที่ดำเนินงานโดยศูนย์วิจัยประสาทวิทยาศาสตร์, สถาบันชีววิทยาศาสตร์โมเลกุล, มหาวิทยาลัยมหิดล เพื่อสร้างโมเดลพยากรณ์ผล EF ของเด็ก

รายละเอียดในการสร้างโมเดลพยากรณ์ มีดังนี้:

ข้อมูลปัจจัยเพื่อเทรนโมเดล (Features)

หัวเรื่องข้อมูลที่เก็บสำหรับเด็กแต่ละคน รวม 27 หัวเรื่อง จากนั้นคัดเลือก 13 หัวข้อที่มี Correlation สูง (ตัวหนา) เป็นข้อมูลขาเข้า (Input) ให้โมเดลสร้างความสัมพันธ์กับข้อมูลชุด Label ได้แก่:

หมวดที่ 1: ข้อมูลพื้นฐานส่วนตัวของเด็ก 2 ข้อ

หมวดที่ 2: ประวัติสุขภาพของเด็ก 8 ข้อ

หมวดที่ 3: ข้อมูลพื้นฐานเกี่ยวกับครอบครัวของเด็ก 7 ข้อ

หมวดที่ 4: ข้อมูลเกี่ยวกับการเลี้ยงดูและพฤติกรรมของเด็ก 10 ข้อ

การแปลงข้อมูลให้เป็นมาตรฐานและเป็นตัวเลข ทำโดยการแปลงข้อมูลประเภทหมวดหมู่ให้เป็นตัวเลขโดยใช้เทคนิค One-hot encoding ส่วนข้อมูลที่ขาดหายไป ไม่มีการใส่เพิ่มโดยใช้ค่าประมาณ (Impute) แต่ตัดออกอย่างเดียว

ข้อมูลชุดคำตอบ (Label)

มาจากการประเมิน EF เด็กกลุ่มเดียวกัน ที่ดำเนินการโดยศูนย์วิจัยประสาทวิทยาศาสตร์, สถาบันชีววิทยาศาสตร์โมเลกุล, มหาวิทยาลัยมหิดล เมื่อปี 2562-2563 โดยมี 2 ชุด ได้แก่ 1) MU.EF-101 ประเมินพัฒนาการ EF และ 2) MU.EF-102 ประเมินปัญหาพฤติกรรม EF โดยแต่ละแบบได้ผลที่เป็น Label ดังนี้

โดยค่าคะแนนที่ใช้ จะใช้ค่าคะแนนที่ผ่านการแปลงผลเทียบ T-Score กับสถิติจากงานวิจัย "การพัฒนาและหาค่าเกณฑ์มาตราฐานเครื่องมือประเมินการคิดเชิงบริหารในเด็กปฐมวัย" ของทีมวิจัยมหิดล โดยแบ่งเป็น 5 ระดับ ดังนี้

โมเดล

ในช่วงเริ่มพัฒนา ได้ทดลองสร้างโมเดลโดยใช้ Label แบบ Multiclass classification ตามข้อมูลชุดคำตอบโดยตรง โดยทดลองใช้ Algorithm หลากหลายประเภท ตั้งแต่ Logistic regression, Decision Tree, Support Vector Machine, และ Ensemble (เช่น Random Forests, Gradient Boosting) อย่างไรก็ตาม ทุกโมเดลให้ผลที่ไม่ดี คือได้ความแม่นยำเพียงประมาณ 30-40% เท่านั้น และสังเกตว่าความแม่นยำจะลดลงสำหรับการพยากรณ์หมวดหมู่ที่เป็นปัญหา EF (เช่น EF101 พยากรณ์ "ควรปรับปรุง" ได้แม่นยำน้อยกว่าพยากรณ์ "ดีมาก" ส่วน EF102 พยากรณ์ "มีปัญหามาก" ได้แม่นยำน้อยกว่าพยากรณ์ "ไม่มีปัญหาเลย")

สาเหตุที่เป็นเช่นนั้นอาจเป็นเพราะ

ปัญหาเช่นนี้ทำให้ทีมงานต้องพัฒนาแนวทางเพื่อแก้ไข โดยแนวทางที่ใช้ มีรายละเอียดดังต่อไปนี้

ดังนั้น สุดท้ายได้โมเดลที่ทำนายปัญหา EF ที่มีคำตอบได้ 3 แบบ คือ "น่าจะมีปัญหา", "อาจจะมีปัญหา", และ "ไม่มีปัญหา"

ความแม่นยำในการพยากรณ์

การทดสอบความแม่นยำของโมเดล มีหลักการดังนี้:

สำหรับมาตรวัด Recall ของโมเดลที่ใช้ มีดังนี้:

ตามที่ได้อธิบายในส่วน Decision rule เวลาพยากรณ์จริง โมเดล EF101 และ EF102 จะทำงานคู่กัน โดยโมเดล EF101 จะพยากรณ์เพื่อหาโอกาสที่ EF จะ "ดี" ในขณะที่ EF102 จะพยากรณ์เพื่อหาโอกาสที่ EF จะ "มีปัญหา" แล้วนำผลลัพธ์มาเทียบว่าสอดคล้องกันหรือไม่ ถ้าสอดคล้องก็จะให้คำตอบในระดับที่มั่นใจกว่าผลลัพธ์ที่ไม่สอดคล้องกัน อย่างไรก็ตาม แต่ถ้าหากผลลัพธ์ไม่สอดคล้องกัน โมเดลถูกออกแบบให้สื่อสารว่ายังมีโอกาสที่จะมีปัญหา เพื่อไม่ให้พลาดความเป็นไปได้ในการตรวจสอบเด็กที่อาจมีปัญหาให้ละเอียดและใส่ใจขึ้น ซึ่งเป็นหลักการที่สอดคล้องกับหลักการ Recall

ข้อจำกัดและข้อควรระวังในการใช้โมเดลพยากรณ์

ถึงแม้ทีมงานจะได้พยายามอย่างถึงที่สุดที่จะทำให้โมเดลพยากรณ์ EF นี้มีความแม่นยำและใช้ประโยชน์ได้จริง แต่อย่างไรก็ตาม ก็มีข้อจำกัดและข้อควรระวังที่ผู้ใช้โมเดลควรรู้ ดังนี้:

ย้อนกลับไปหน้าแรก