บัญชา ธนบุญสมบัติ
นักวิทยาศาสตร์
สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.)
มาทำความเข้าใจการแปลผลการทดสอบ GT200 เมื่อวันอาทิตย์ที่ 14 กุมภาพันธ์ 2553 กันครับ
เพราะการทดลองในลักษณะเดียวกันนี้อาจต้องใช้กับเครื่องอื่น เช่น ALPHA-6 เป็นต้น
คณิตศาสตร์เบื้องหลังการทดสอบ GT200
บัญชา ธนบุญสมบัติ
buncha2509@gmail.com
http://portal.in.th/buncha
ผลการทดสอบประสิทธิภาพการใช้งาน GT200 ซึ่งนายกฯ ได้แถลงข่าวเมื่อวันอังคารที่ 16 กุมภาพันธ์ 2553 ว่า ตรวจพบกล่องที่มีวัตถุระเบิดจำนวน 4 ครั้ง (จาก 20 ครั้ง) และนำไปสู่การยกเลิกการจัดซื้อเพิ่มเติม อาจทำให้หลายท่านสงสัยว่าหลักเกณฑ์การตัดสินใจว่า GT200 ใช้ได้หรือไม่นั้นน่าจะเป็นเช่นไร
วิธีการทดสอบโดยย่อคือ ทำการซ่อน-ค้นหาทั้งสิ้น 20 ครั้ง แต่ละครั้งใช้กล่อง 4 ใบ โดยมีกล่องใบหนึ่งซ่อนวัตถุระเบิด C4 ไว้อย่างสุ่มๆ ดังนั้นในการซ่อน-ค้นหาแต่ละครั้ง โอกาสที่จะพบโดยการสุ่มเลือกมั่วๆ ก็คือ 1 ใน 4 หรือ 25%
นั่นคือ ถ้าทำซ้ำ 20 ครั้ง ค่าเฉลี่ยของโอกาสที่จะพบโดยการสุ่มเลือกมั่วๆ คือ 20 ครั้ง x 25% = 5 ครั้ง
อย่าง ไรก็ดี การตีความผลการทดสอบนี้ไม่ตรงไปตรงมาเพียงแค่ว่า ถ้าผลการค้นหาพบเกินกว่า 5 ครั้ง (เช่น พบ 7 ครั้ง) ก็ถือว่าใช้ได้เพราะสูงกว่าค่าเฉลี่ยจากการสุ่มเลือก เพราะการสุ่มพบ 7 ครั้ง จาก 20 ครั้งนั้นมีโอกาสยังสูงถึง 11.2% กล่าวคือ หากทำการทดสอบอุปกรณ์ที่ทำงานมั่วๆ โดยใช้วิธีการเดียวกันนี้ซ้ำแล้วซ้ำเล่า 100 รอบ (อาจจะทำวันละ 1 รอบ รวม 100 วัน) ก็จะพบว่า มีอยู่ 11 วัน ซึ่งจะสุ่มพบกล่องที่มีวัตถุระเบิดจำนวน 7 กล่อง
ลองเปรียบเทียบการทดสอบ GT200 โดยให้ลิงตัวหนึ่งทำข้อสอบ 20 ข้อ แต่ละข้อมี 4 ตัวเลือก (เช่น ก ข ค & ง ซึ่งเทียบได้กับกล่อง 4 ใบ ซึ่งจะมีอยู่ตัวเลือกเดียวที่ถูกต้อง) ลิงตัวนี้กาเลือกมั่วๆ จนครบ
หากให้ตัวแปร n (ตัวอักษรเอ็นเล็ก) แทนจำนวนข้อที่ลิงกา (มั่ว) ถูก ผลลัพธ์ที่อาจเป็นไปได้มีตั้งแต่ n = 0 (กาผิดหมด) n = 1 (ถูก 1 ข้อ) n = 2 (ถูก 2 ข้อ) ไปเรื่อยๆ จนถึง n = 20 (ลิงมั่วถูกหมด ได้คะแนนเต็ม) รวมทั้งสิ้น 21 แบบ
ตาราง & กราฟแสดงความน่าจะเป็นในการสุ่มตรวจพบจำนวนกล่องที่มีวัตถุระเบิด
ตารางและกราฟที่ให้ไว้แสดงโอกาสหรือ ความน่าจะเป็น (probability) ของจำนวนข้อที่ลิงตัวนี้จะมั่วข้อสอบถูก เช่น โอกาสที่ลิงตอบผิดหมด (n = 0) เท่ากับ 0.317% กล่าวคือ หากให้ลิง 1,000 ตัวทำข้อสอบแบบนี้ ก็จะมีประมาณ 3 ตัวที่ตอบผิดหมดทุกข้อ
จากข้อมูลในตารางและในกราฟ มีจุดสำคัญอย่างน้อย 2 จุด ดังนี้
จุดสำคัญที่หนึ่ง – ผลลัพธ์ที่มีโอกาสสูงสุดเจ็ดอันดับแรก (เรียงจากมากไปหาน้อย) ได้แก่
- ตอบถูก 5 ข้อ (20.2%)
- ตอบถูก 4 ข้อ (19.0%)
- ตอบถูก 6 ข้อ (16.9%)
- ตอบถูก 3 ข้อ (13.4%)
- ตอบถูก 7 ข้อ (11.2%)
- ตอบถูก 2 ข้อ (6.7%)
- ตอบถูก 8 ข้อ (6.1%)
หากรวมโอกาสที่จะตอบถูกใน 7 อันแรกนี้จะมีโอกาสสูงถึง 93.5% (จริงๆ แล้วหากรวมโอกาสที่จะตอบถูกเพียง 5 อันดับแรกก็จะมีโอกาสสูงถึง 80.7% แล้ว)
ความหมายสำหรับกรณีการทดสอบ GT200 :
หากมีสมมติฐานว่า GT200 ไม่สามารถตรวจหาระเบิดได้จริงดังอ้าง โอกาสที่ผลการทดสอบจะตกอยู่ในช่วงการพบกล่อง 2 ถึง 8 ครั้ง ก็จะมีสูงถึง 93.5% (หากทดสอบ 10 วัน จะพบกรณีนี้ 9 วัน)
จุดสำคัญที่สอง – ผลรวมของโอกาสที่ลิงตัวหนึ่งจะมั่วถูกเกิน 5 ข้อ คือ ตอบถูกตั้งแต่ 6 ข้อขึ้นไปจนตอบถูกหมด มีค่าสูงถึง 38.3% โดยค่านี้ได้มาจากโอกาสตอบถูก 6 ข้อ (16.9%) + โอกาสตอบถูก 7 ข้อ (11.2%) + …. + โอกาสตอบถูก 20 ข้อ
ความหมายสำหรับกรณีการทดสอบ GT200 :
เราไม่สามารถใช้เกณฑ์ง่ายๆ เพียงแค่ว่า หากผลการทดสอบที่ได้สูงกว่าค่าเฉลี่ย (คือ 5 กล่อง) ก็ถือได้ว่าเครื่อง GT200 สามารถทำงานค้นหาวัตถุระเบิดได้จริง เพราะเกณฑ์นี้มีโอกาสเกิดขึ้นสูงถึง 38.3% หรือเกือบ 40% ทีเดียว
โปรด สังเกตตัวเลข 38.3% นี้ไว้ เพราะจะปรากฏอีกครั้งเมื่อเราใช้เป็นตัวเลขระดับความผิดพลาดที่ยอมรับได้ใน การกำหนดเกณฑ์ตัดสินว่าเครื่อง GT200 ใช้งานได้หรือไม่
การกำหนดเกณฑ์สำหรับตัดสินว่า GT200 ใช้งานได้จริงหรือไม่?
เมื่อเข้าใจความหมายของตารางและกราฟนี้แล้ว คราวนี้ก็มาถึง เกณฑ์ในการตัดสินว่า เราจะถือว่า GT200 สามารถตรวจหาวัตถุระเบิดได้หรือไม่
การเลือกเกณฑ์ดังกล่าวมีหลายวิธี โดยวิธีที่อ้างอิงกับข้อมูลจากตารางนี้โดยตรงจะใช้ระดับความผิดพลาดที่เรายอมรับได้ ดังนี้
จำนวนกล่องที่หาระเบิดพบ ระดับความผิดพลาด (%)
“จำนวนข้อต่ำสุดที่ลิงตอบถูก” “โอกาสที่ลิงมั่วคำตอบถูก”
--------------------------------- ----------------------------
6 38.3%
7 21.4%
8 10.2%
9 4.1%
10 1.39%
11 0.394%
12 0.094%
13 0.018%
ตัวอย่างเช่น
- หากเรายอมรับระดับความผิดพลาดว่าต้องไม่เกิน 10% จำนวนกล่องใส่วัตถุระเบิดต่ำสุดที่พบในการทดลองก็จะต้องอย่างน้อย 9 กล่อง
(เพราะหากพบแค่ 8 กล่อง ก็ยังอาจผิดพลาดได้ 10.2% ซึ่งเกิน 10%) - หากเราต้องการให้มั่นใจยิ่งขึ้น โดยยอมรับระดับความผิดพลาดได้ไม่เกิน 1% ก็ต้องหากล่องใส่วัตถุระเบิดให้พบอย่างน้อยที่สุด 11 กล่อง
น่าสนใจว่า เมื่อปี ค.ศ.2002 ห้องปฏิบัติการแห่งชาติแซนเดีย (Sandia National Laboratories) ทำการทดสอบอุปกรณ์ MOLE ซึ่งอ้างว่าสามารถตรวจจับวัตถุระเบิดได้ในทำนองเดียวกับ GT200 นี้ เกณฑ์ที่ใช้คือ 13 กล่อง เพื่อให้ได้ระดับความผิดพลาด 0.018% หรือผิดพลาดประมาณ 2 ครั้งในการทำการทดสอบ 10,000 ครั้ง แต่จากการทดสอบตรวจพบเพียงแค่ 6 กล่อง จึงถือว่าการตรวจหาวัตถุระเบิดด้วย MOLE ไม่แตกต่างจากกระบวนการเดาสุ่ม
น่ารู้ไว้ด้วยว่าอุปกรณ์ MOLE นี้ ก็ผลิตโดย Global Technical Ltd. ซึ่งเป็นผู้ผลิต GT200 เช่นกัน!
สรุป
เมื่อได้ทราบเช่นนี้แล้ว ก็คงไม่แปลกใจว่า เหตุใดผลการทดสอบพบ 4 ครั้ง จาก 20 ครั้ง จึงทำให้นายกฯ แถลงว่า ผลการทดสอบ GT200 ไม่ต่างจากการเลือกอย่างเดาสุ่มและตัดสินใจสั่งระงับการจัดซื้อ GT200 เพิ่มเติม
ผลการทดสอบนี้ยังสอดคล้องกับข้อสังเกตที่ว่าข้อมูลทาง เทคนิคของ GT200 ขัดกับหลักทางฟิสิกส์และขีดความสามารถทางเทคโนโลยีในปัจจุบัน ดังที่ผมเคยเสนอไว้ในบันทึก ‘เหตุใด GT200 จึงเข้าข่ายวิทยาศาสตร์จอมปลอม?’
ที่เล่ามานี้เป็นแก่นสาระของการทดสอบ GT200 โดยหลักการทางสถิติเท่านั้น
อย่าง ไรก็ตามการตรวจสอบอย่างเต็มรูปแบบในทางวิทยาศาสตร์และวิศวกรรมที่ควรทำก็คือ การแกะอุปกรณ์ หรือ “ผ่า” เพื่อทำให้เราเข้าใจหลักการทำงานของอุปกรณ์นั้น จะได้หมดสิ้นข้อกังขา
การกล่าวอ้างถึงข้อติดขัดทางกฎหมายสำหรับ กรณี GT200 นี้ส่อพิรุธ นั่นคือ ของที่เราซื้อมาด้วยเงินของเรา ทำไมจะทำอะไรกับมันไม่ได้? เรื่องนี้คงต้องฝากให้ผู้รู้ทางกฏหมายหาทางออกที่เกิดประโยชน์ต่อสังคมไทย มากที่สุด
กรณี GT200 เป็นตัวอย่างหนึ่งของการใช้วิทยาศาสตร์จอมปลอม (Pseudo-Science) มาแอบอ้างเพื่อขายสินค้า ทำให้หลายภาคส่วนในสังคมไทยต้องตกเป็นเหยื่อ แต่หากมองในแง่ดีก็คือ เรายังมีนักวิชาการและผู้สนับสนุนที่มีความกล้าหาญทางจริยธรรมในการออกมาทำ ให้สังคมไทยได้รู้เท่าทัน
ประวัติของบทความ
- ตีพิมพ์ครั้งแรกในคอลัมน์ Event Horizon นสพ. กรุงเทพธุรกิจ เซ็คชั่น จุดประกาย เสาร์สวัสดี เสาร์ 20 ก.พ. 2553
ขุมทรัพย์ทางปัญญา
- บทความจาก Sandia National Laboratories : http://www.justnet.org/Lists/JUSTNET%20Resources/Attachments/440/moleeval_apr02.pdf
บันทึกใน GotoKnow ที่เกี่ยวข้อง
คณิตศาสตร์ที่เกี่ยวข้อง - แนะนำโดย คุณศล แห่งห้องหว้ากอ Pantip.com
บล็อกของคุณศล
ข้อคิดเห็นในกระทู้ห้องหว้ากอ
- Hypothesis Test กับ GT200 (ความเห็นที่ 4 กับ 7)
- (GT200) มีคนคิดเหมือนพวกเราเรื่องการทดสอบด้วยครับ แถม Alpha6 อยากโดนด้วย (ความคิดเห็นที่ 25)
--
โปรดอ่านบล็อก
http://www.pridiinstitute.com
http://www.nakkhaothai.com
http://apps.facebook.com/blognetworks/index.php
http://www.roundfinger.com/
http://twitter.com/sweetblog
http://twitter.com/oknewsblog
http://twitter.com/okblogger
http://twitter.com/sat191
http://www.pacc.go.th/
http://twitter.com/okblogchan
http://twitter.com/sun1951
http://twitter.com/smeblogger
http://twitter.com/seminarblog
http://twitter.com/sunnewsblog
http://twitter.com/okworldblog
http://twitter.com/ktblogger
http://twitter.com/sundayblog
http://twitter.com/mondayblog
http://twitter.com/tuesdayblog
http://twitter.com/wednesdayblog
http://twitter.com/thursdayblog
http://twitter.com/fridayblog
http://twitter.com/saturdayblog
http://www.deepsouthwatch.org/node/687
http://www.tu.ac.th/org/ofrector/tu_council/record/nopporn.htm
ไม่มีความคิดเห็น:
แสดงความคิดเห็น