| | |
โมเดลพยากรณ์ EF
โครงการพยากรณ์ EF เด็กปฐมวัย ได้เก็บข้อมูลเด็กปฐมวัยจำนวนประมาณ 2,000 คนในศูนย์พัฒนาเด็กเล็กทั่วทั้งจังหวัดลพบุรี และได้นำข้อมูลที่เก็บได้มาเชื่อมโยงกับผลการประเมิน EF ของเด็กกลุ่มเดียวกันที่ดำเนินงานโดยศูนย์วิจัยประสาทวิทยาศาสตร์, สถาบันชีววิทยาศาสตร์โมเลกุล, มหาวิทยาลัยมหิดล เพื่อสร้างโมเดลพยากรณ์ผล EF ของเด็ก
รายละเอียดในการสร้างโมเดลพยากรณ์ มีดังนี้:
ข้อมูลปัจจัยเพื่อเทรนโมเดล (Features)
หัวเรื่องข้อมูลที่เก็บสำหรับเด็กแต่ละคน รวม 27 หัวเรื่อง จากนั้นคัดเลือก 13 หัวข้อที่มี Correlation สูง (ตัวหนา) เป็นข้อมูลขาเข้า (Input) ให้โมเดลสร้างความสัมพันธ์กับข้อมูลชุด Label ได้แก่:
หมวดที่ 1: ข้อมูลพื้นฐานส่วนตัวของเด็ก 2 ข้อ
- sex (เพศ): ชาย / หญิง
- family_rank (เป็นลูกคนที่เท่าใดของครอบครัว): คนโต / คนกลาง / คนสุดท้อง / คนเดียว
หมวดที่ 2: ประวัติสุขภาพของเด็ก 8 ข้อ
- weight_height (น้ำหนักเทียบส่วนสูง): ปกติ / ค่อยข้างผอม / ผอม / ค่อนข้างอ้วน / อ้วน / แคระแกร็น
- have_disease (มีโรคประจำตัวหรือไม่): ไม่มี / มีและได้รักษา / มีและไม่ได้รักษา
- severe_accident (เคยได้รับอุบัติเหตุรุนแรงจนหมดสติหรือต้องนอนโรงพยาบาลหรือไม่): ไม่เคย / เคย
- early_deliver (คลอดก่อนกำหนดหรือไม่): ไม่ / ใช่
- primary_milk (เลี้ยงลูกด้วยนมอะไรเป็นหลัก): นมแม่ / นมผงหรือนมกล่อง / นมถั่วเหลือง / นมข้น
- night_sleep_hr (ระยะเวลาเฉลี่ยนอนหลับกลางคืน เป็นชั่วโมง)
- day_sleep_hr (ระยะเวลาเฉลี่ยนอนหลับกลางวัน เป็นชั่วโมง)
- excretion (พฤติกรรมการขับถ่ายของเด็ก): ทุกวันปกติ / วันเว้นวัน / สามวันครั้งหรือนานกว่านั้น
หมวดที่ 3: ข้อมูลพื้นฐานเกี่ยวกับครอบครัวของเด็ก 7 ข้อ
- parents_marital (สถานะการอยู่ด้วยกันของพ่อแม่): อยู่ด้วยกัน / แยกกันอยู่ชั่วคราว / หย่าร้าง แยกทาง หรือเสียชีวิต
- primary_carer (ผู้เลี้ยงดูหลัก): พ่อแม่ / แม่ / พ่อ / ญาติหรือคนอื่น
- age_primary_carer (อายุ (หรืออายุเฉลี่ย) ของผู้เลี้ยงดูหลัก)
- occupation_primary_carer (อาชีพของผู้เลี้ยงดูหลัก): รับราชการ / พนักงานบริษัทหรือหน่วยงาน / ธุรกิจส่วนตัว / รับจ้าง / เกษตรกรรม / แม่บ้าน / ไม่ได้ทำงาน
- education_primary_carer (การศึกษาของผู้เลี้ยงดูหลัก เลือกของคนที่ใช้เวลาอยู่กับเด็กนานที่สุด): ปริญญา หรือเทียบเท่า / อนุปริญญา อาชีวะ พาณิชย์ / มัธยมปลาย / มัธยมต้น / ประถมปลาย / ประถมต้น / ไม่ได้เรียนหนังสือ
- income_household (รายได้ครอบครัวต่อปี)
- debt_household (หนี้สินในปัจจุบัน)
หมวดที่ 4: ข้อมูลเกี่ยวกับการเลี้ยงดูและพฤติกรรมของเด็ก 10 ข้อ
- child_character (ลักษณะของเด็ก): ร่าเริงแจ่มใส / เอาแต่ใจ / ขี้กลัว / ขี้กังวล / ขี้อาย / ปรับตัวยาก / ใช้ความรุนแรง
- upbringing_mode (วิธีการเลี้ยงดู): ปกป้อง / ตามใจ / เข้มงวด / ปล่อยปละละเลย
- punishment_mode (วิธีการลงโทษ): สอน บอก / ด่าว่า / ขู่ / ใช้สายตาหรือเงียบเฉย / ตี
- solo_play_duration (ระยะเวลาเฉลี่ยต่อวันที่เด็กเล่นอย่างอิสระ (ไม่รวมเล่นบนหน้าจอทุกชนิด) เป็นชั่วโมง)
- screen_time (ระยะเวลาเฉลี่ยที่เด็กอยู่หน้าจอต่อวัน เช่นมือถือ แทบเล็ต เกม ทีวี เป็นชั่วโมง)
- parent_play_freq (ความถี่ที่ผู้เลี้ยงดูหลักเล่นกับเด็ก): ทุกวัน / สองสามวันครั้ง / ประมาณอาทิตย์ละครั้ง / ประมาณเดือนละครั้ง / แทบไม่เคยเลย
- reading_freq (ความถี่ที่ผู้เลี้ยงดูหลักอ่านนิทานให้เด็กฟัง): ทุกวัน / สองสามวันครั้ง / ประมาณอาทิตย์ละครั้ง / ประมาณเดือนละครั้ง / แทบไม่เคยเลย
- telling_freq (ความถี่ที่ผู้เลี้ยงดูหลักเล่านิทานให้เด็กฟัง): ทุกวัน / สองสามวันครั้ง / ประมาณอาทิตย์ละครั้ง / ประมาณเดือนละครั้ง / แทบไม่เคยเลย
- selfhelp_freq (ความถี่ที่ผู้เลี้ยงดูหลักให้เด็กเหลือตนเองหรือช่วยทำงานบ้านเล็กๆ น้อยๆ): ทุกวัน / สองสามวันครั้ง / ประมาณอาทิตย์ละครั้ง / ประมาณเดือนละครั้ง / แทบไม่เคยเลย
- loving_contact_freq (ความถี่ที่ผู้เลี้ยงดูหลักอุ้ม กอด บอกรักเด็ก): วันละหลายครั้ง / วันละครั้ง / สองสามวันครั้ง / ประมาณอาทิตย์ละครั้ง / ประมาณเดือนละครั้ง / แทบไม่เคยเลย
การแปลงข้อมูลให้เป็นมาตรฐานและเป็นตัวเลข ทำโดยการแปลงข้อมูลประเภทหมวดหมู่ให้เป็นตัวเลขโดยใช้เทคนิค One-hot encoding ส่วนข้อมูลที่ขาดหายไป ไม่มีการใส่เพิ่มโดยใช้ค่าประมาณ (Impute) แต่ตัดออกอย่างเดียว
ข้อมูลชุดคำตอบ (Label)
มาจากการประเมิน EF เด็กกลุ่มเดียวกัน ที่ดำเนินการโดยศูนย์วิจัยประสาทวิทยาศาสตร์, สถาบันชีววิทยาศาสตร์โมเลกุล, มหาวิทยาลัยมหิดล เมื่อปี 2562-2563 โดยมี 2 ชุด ได้แก่ 1) MU.EF-101 ประเมินพัฒนาการ EF และ 2) MU.EF-102 ประเมินปัญหาพฤติกรรม EF โดยแต่ละแบบได้ผลที่เป็น Label ดังนี้
- การหยุด การยับยั้ง (Inhibitory control - INH): คือการยับยั้งพฤติกรรมตนเองไม่ให้หุนหันพลันแล่น หยุดคิดก่อนทำ หยุดพฤติกรรมที่รบกวนผู้อื่นหรือทำให้ผู้อื่นเดือดร้อน รวมถึงการยับยั้งความคิดไม่ให้คิดเรื่อยเปื่อยในเรื่องที่ไม่เกี่ยวข้อง ควบคุมความคิดให้มีสมาธิจดจ่อในเรื่องที่กำลังทำ
- การเปลี่ยนความคิด (Shift - SHF): คือการเปลี่ยนความคิดไม่ให้ยึดติดความคิดเดียว รู้จักเปลี่ยนมุมมองคิดนอกกรอบได้ สามารถทำงานหลายอย่างสลับไปมาได้ การเปลี่ยนความคิดได้จะพัฒนาช้ากว่าความจำขณะทำงานและการยับยั้งพฤติกรรม
- การควบคุมอารมณ์ (Emotional control - EC): คือความสามารถในการควบคุมอารมณ์ให้แสดงออกอย่างเหมาะสมตามสถานการณ์
- ความจำขณะทำงาน (Working Memory - WM): คือความสามารถในการจำข้อมูลไว้ในใจและจัดการกับข้อมูลเหล่านั้น หรือการนำข้อมูลที่เก็บไว้ในใจมาใช้ในการคิดแก้ปัญหา จำเป็นต้องอาศัยการมีความตั้งใจจดจ่อ (Attention) เป็นพื้นฐานสำคัญ
- การวางแผนจัดการ (Plan/Organise - PO): คือการวางแผนจัดการงานให้เสร็จ ตั้งแต่การตั้งเป้าหมาย จัดลำดับความสำคัญของงาน เริ่มต้นลงมือทำ การไม่ติดกับปัญหาเล็กน้อยจนลืมภาพรวมของงาน การคาดการณ์ผลของการกระทำ การติดตามสะท้อนผลจากการกระทำเพื่อปรับปรุงงานให้ดีขึ้น (2)
โดยค่าคะแนนที่ใช้ จะใช้ค่าคะแนนที่ผ่านการแปลงผลเทียบ T-Score กับสถิติจากงานวิจัย "การพัฒนาและหาค่าเกณฑ์มาตราฐานเครื่องมือประเมินการคิดเชิงบริหารในเด็กปฐมวัย" ของทีมวิจัยมหิดล โดยแบ่งเป็น 5 ระดับ ดังนี้
- MU.EF-101 แบ่งเป็น ดีมาก / ดี / ปานกลาง / ควรพัฒนา / ควรปรับปรุง
- MU.EF-102 แบ่งเป็น มีปัญหามาก / เริ่มมีปัญหา / ปานกลาง / แทบไม่มีปัญหา / ไม่มีปัญหาเลย
โมเดล
ในช่วงเริ่มพัฒนา ได้ทดลองสร้างโมเดลโดยใช้ Label แบบ Multiclass classification ตามข้อมูลชุดคำตอบโดยตรง โดยทดลองใช้ Algorithm หลากหลายประเภท ตั้งแต่ Logistic regression, Decision Tree, Support Vector Machine, และ Ensemble (เช่น Random Forests, Gradient Boosting) อย่างไรก็ตาม ทุกโมเดลให้ผลที่ไม่ดี คือได้ความแม่นยำเพียงประมาณ 30-40% เท่านั้น และสังเกตว่าความแม่นยำจะลดลงสำหรับการพยากรณ์หมวดหมู่ที่เป็นปัญหา EF (เช่น EF101 พยากรณ์ "ควรปรับปรุง" ได้แม่นยำน้อยกว่าพยากรณ์ "ดีมาก" ส่วน EF102 พยากรณ์ "มีปัญหามาก" ได้แม่นยำน้อยกว่าพยากรณ์ "ไม่มีปัญหาเลย")
สาเหตุที่เป็นเช่นนั้นอาจเป็นเพราะ
- จำนวนรายการข้อมูลที่ใช้ มีเพียง 2,000 รายการ ถือว่าน้อย ควรมีมากกว่า 10,000 รายการ
- การกระจายของข้อมูลเมื่อเทียบกับ Label มีความไม่สมมาตร คือเอนไปในทาง "ปกติ" มากกว่าด้านที่ "ไม่ปกติ" เป็นอย่างมาก ข้อมูลที่มีการกระจายไม่สมมาตรทำให้เกิดปัญหาทำให้โมเดลที่ทำนายฝั่งที่มีข้อมูลน้อย มีความไม่แม่นยำ
- กลุ่มตัวอย่างที่เก็บข้อมูล อาจมีปัจจัยที่หลากหลายไม่แน่นอนที่เกี่ยวข้องกับการมีปัญหา EF ส่วนประกอบของปัจจัยต่างๆ อาจแปรผันซับซ้อนจน Algorithm ไม่สามารถหากฎเกณฑ์ที่ดีในการพยากรณ์ได้ ต่างกับปัจจัยที่เกี่ยวข้องกับการมี EF สูงที่มีความชัดเจนและมีรูปแบบตายตัวกว่า
ปัญหาเช่นนี้ทำให้ทีมงานต้องพัฒนาแนวทางเพื่อแก้ไข โดยแนวทางที่ใช้ มีรายละเอียดดังต่อไปนี้
- Distribution: แก้ปัญหาข้อมูลไม่สมมาตรเมื่อเทียบกับ Label โดยการ Resample ข้อมูล Label ที่มีจำนวนน้อย โดยสุ่มเลือกค่าที่มีความใกล้เคียงกับค่าเดิมที่มีอยู่แล้ว (K-Nearest Neighbors algorithm) เพื่อปรับชุดข้อมูลให้มีจำนวนข้อมูลแต่ละ Label เท่าๆ กัน
- Algorithm: เลือกใช้ XGBoost ซึ่งเป็น Ensemble ที่มีพื้นฐานจาก Logistic regression ทำงานโดยการทำงานหลายๆ ครั้ง โดยแต่ละครั้งแก้ไขข้อผิดพลาดของครั้งก่อนหน้า พบว่าได้ความแม่นยำเฉลี่ยสูงสุดเมื่อเทียบกับ Algorithm อื่นๆ
- Classification type: เปลี่ยนจาก Multiclass classification เป็น Binary classification คือการตั้งเป้าการทำนายให้มีแค่ 2 ค่า คือใช่ หรือ ไม่ใช่ เท่านั้น เช่น EF101 ถือว่า ดีมาก / ดี อยู่ในกลุ่มเดียวกัน เรียกว่ากลุ่ม "ดี" ส่วน "ปานกลาง / ควรพัฒนา / ควรปรับปรุง" จัดรวมกันเป็นกลุ่ม "ปกติ" ในขณะที่ EF102 จัด มีปัญหามาก / เริ่มมีปัญหา / ปานกลาง เป็นกลุ่ม "มีปัญหา" ส่วน แทบไม่มีปัญหา / ไม่มีปัญหาเลย เป็นกลุ่ม "ไม่มีปัญหา" การทำเช่นนี้ทำให้ Algorithm มีโอกาสสูงขึ้นในการจำแนกรูปแบบที่แตกต่างกันอย่างชัดเจนขึ้นสำหรับเป้าหมายกลุ่มต่างๆ
- Decision rule: ใช้ระบบ Voting โดยตัดสินใจจากการเทียบคำพยากรณ์ของทั้งสองโมเดลว่าสอดคล้องกันหรือไม่ เช่น EF101 ทำนายว่า "ปกติ" (คือไม่ "ดี") ในขณะที่ EF102 ทำนายว่า "มีปัญหา" ก็จะถือว่าข้อมูลรายการนี้ "น่าจะมีปัญหา" เพราะทั้งสองโมเดลทำนายสอดคล้องกัน แต่ถ้าทำนายไม่สอดคล้องกัน จะถือว่าข้อมูลรายการนี้ "อาจมีปัญหา" เพื่อให้ผู้ที่เกี่ยวข้องเฝ้าระวัง ไม่ละเลย ส่วนถ้าสองโมเดลต่างทำนายไปในทางที่ไม่มีปัญหา ก็จะถือว่า "ไม่มีปัญหา"
ดังนั้น สุดท้ายได้โมเดลที่ทำนายปัญหา EF ที่มีคำตอบได้ 3 แบบ คือ "น่าจะมีปัญหา", "อาจจะมีปัญหา", และ "ไม่มีปัญหา"
ความแม่นยำในการพยากรณ์
การทดสอบความแม่นยำของโมเดล มีหลักการดังนี้:
- จำนวนข้อมูลที่ใช้ทดสอบ: ก่อนจะเทรน ได้กันข้อมูล 35% ไว้เป็นชุดทดสอบ โดยเลือกแบบสุ่ม
- มาตรวัดที่ใช้ทดสอบ ให้ความสำคัญกับ Recall ต่อรายการที่มีปัญหา EF โดย Recall บ่งชี้ว่า ในกลุ่มที่มีปัญหาจริง โมเดลพยากรณ์ว่ามีปัญหากี่เปอร์เซ็นต์ สาเหตุที่เลือกมาตรวัดนี้ เพราะจุดมุ่งหมายของโมเดลพยากรณ์ EF คือการต้องการหาเด็กที่มีพัฒนาการ EF ต่ำ เพื่อให้ผู้ที่เกี่ยวข้องสามารถแก้ไขได้อย่างทันท่วงที ในกรณีนี้ Recall มีความสำคัญมากกว่า Precision ซึ่งบ่งบอกว่าในกลุ่มที่ถูกพยากรณ์ว่ามีปัญหา เป็นเด็กที่มีปัญหาจริงๆ กี่เปอร์เซ็นต์ เพราะโมเดลที่มี Precision ต่ำ อย่างมากก็จะทำให้เด็กที่จริงๆ แล้ว EF ปกติ ถูกคัดไปเป็นกลุ่ม EF ต่ำ ทำให้เสียเวลาและโอกาสไปบ้าง แต่ในขณะที่โมเดลที่มี Recall ต่ำ จะทำให้เด็กที่ EF จริงๆ ต่ำ ถูกทำนายเข้ามาน้อย คือการพลาดที่จะพบเด็กที่ในความเป็นจริงต้องการความช่วยเหลือ
สำหรับมาตรวัด Recall ของโมเดลที่ใช้ มีดังนี้:
- EF101 INH ทำนาย "ดี": Recall 83.61%
- EF102 INH ทำนาย "มีปัญหา": Recall 57.04%
- EF101 SHF ทำนาย "ดี": Recall 80.55%
- EF102 SHF ทำนาย "มีปัญหา": Recall 49.13%
- EF101 EC ทำนาย "ดี": Recall 83.86%
- EF102 EC ทำนาย "มีปัญหา": Recall 56.81%
- EF101 WM ทำนาย "ดี": Recall 71.50%
- EF102 WM ทำนาย "มีปัญหา": Recall 60.92%
- EF101 PO ทำนาย "ดี": Recall 87.78%
- EF102 PO ทำนาย "มีปัญหา": Recall 69.73%
ตามที่ได้อธิบายในส่วน Decision rule เวลาพยากรณ์จริง โมเดล EF101 และ EF102 จะทำงานคู่กัน โดยโมเดล EF101 จะพยากรณ์เพื่อหาโอกาสที่ EF จะ "ดี" ในขณะที่ EF102 จะพยากรณ์เพื่อหาโอกาสที่ EF จะ "มีปัญหา" แล้วนำผลลัพธ์มาเทียบว่าสอดคล้องกันหรือไม่ ถ้าสอดคล้องก็จะให้คำตอบในระดับที่มั่นใจกว่าผลลัพธ์ที่ไม่สอดคล้องกัน อย่างไรก็ตาม แต่ถ้าหากผลลัพธ์ไม่สอดคล้องกัน โมเดลถูกออกแบบให้สื่อสารว่ายังมีโอกาสที่จะมีปัญหา เพื่อไม่ให้พลาดความเป็นไปได้ในการตรวจสอบเด็กที่อาจมีปัญหาให้ละเอียดและใส่ใจขึ้น ซึ่งเป็นหลักการที่สอดคล้องกับหลักการ Recall
ข้อจำกัดและข้อควรระวังในการใช้โมเดลพยากรณ์
ถึงแม้ทีมงานจะได้พยายามอย่างถึงที่สุดที่จะทำให้โมเดลพยากรณ์ EF นี้มีความแม่นยำและใช้ประโยชน์ได้จริง แต่อย่างไรก็ตาม ก็มีข้อจำกัดและข้อควรระวังที่ผู้ใช้โมเดลควรรู้ ดังนี้:
- Validity: โมเดลพยากรณ์ ถูกออกแบบเพื่อบ่งชี้ถึง "ความเป็นไปได้" ที่จะเกิดผลลัพธ์ที่สนใจ ไม่ใช่สูตรตายตัวที่มีความแม่นยำหรือได้รับการค้นคว้า วิจัยมาโดยตรง ดังนั้นผู้ใช้โมเดลจึงควรนำผลพยากรณ์ของโมเดลไปประกอบกับการพิจารณาปัจจัยอื่นๆ ก่อนที่จะดำเนินการตามผลลัพธ์นั้นๆ
- Scope: โมเดลพยากรณ์นี้ สร้างขึ้นจากข้อมูลที่เก็บจากพื้นที่จังหวัดลพบุรี จำนวน 2,000 รายการ เท่านั้น ดังนั้น การพยากรณ์จึงอาจไม่แม่นยำเท่ามาตรวัดของโมเดลเมื่อนำไปใช้ในพื้นที่อื่นๆ เพราะโมเดลเป็นภาพสะท้อนของรูปแบบที่เกิดขึ้นในจังหวัดลพบุรีเพียงจังหวัดเดียว วิธีแก้ไข คือต้องเก็บข้อมูลทั้งประเทศ ซึ่งยังไม่อยู่ในวิสัยที่จะดำเนินการได้ในขณะนี้ แต่ถ้าหากมีผู้สนใจ ทีมงานยินดีให้คำแนะนำในการวางแผนและดำเนินงาน
- Correlation VS. Causation: ในส่วนการวิเคราะห์ระดับความสัมพันธ์ระหว่างปัจจัยต่างๆ กับผล EF พึงระลึกเสมอว่าระดับความสัมพันธ์ (Correlation) ไม่จำเป็นที่จะต้องเป็น "เหตุและผล" (Causation) เช่น ในหลายๆ ตัวบ่งชี้ EF พบว่า เด็กที่มีนิสัยร่าเริงแจ่มใส มักจะมี EF ดี แต่นั่นอาจไม่ได้หมายความว่า ความร่าเริงแจ่มใสของเด็กเป็นปัจจัยที่ส่งผลให้ EF ดีโดยตรง แต่อาจะเป็นเพราะเด็กที่มี EF ดี มักจะมีพ่อแม่ที่อยู่ด้วยกัน ใส่ใจ ให้เวลา เด็กจึงร่าเริงแจ่มใสก็เป็นไปได้ การร่าเริงแจ่มใส (และปัจจัยอื่นๆ) จึงเป็นปัจจัยที่มีระดับความเกี่ยวข้องกับ EF ในทางบวก แต่ไม่จำเป็นที่จะต้องเป็นเหตุโดยตรงของระดับ EF
ย้อนกลับไปหน้าแรก