Net9: กรณี GT200 : คณิตศาสตร์ที่อยู่เบื้องหลังการทดสอบ

บัญชา ธนบุญสมบัติ
นักวิทยาศาสตร์
สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.)

มาทำความเข้าใจการแปลผลการทดสอบ GT200 เมื่อวันอาทิตย์ที่ 14 กุมภาพันธ์ 2553 กันครับ

เพราะการทดลองในลักษณะเดียวกันนี้อาจต้องใช้กับเครื่องอื่น เช่น ALPHA-6 เป็นต้น

คณิตศาสตร์เบื้องหลังการทดสอบ GT200

บัญชา ธนบุญสมบัติ
buncha2509@gmail.com
http://portal.in.th/buncha

ผลการทดสอบประสิทธิภาพการใช้งาน GT200 ซึ่งนายกฯ ได้แถลงข่าวเมื่อวันอังคารที่ 16 กุมภาพันธ์ 2553 ว่า ตรวจพบกล่องที่มีวัตถุระเบิดจำนวน 4 ครั้ง (จาก 20 ครั้ง) และนำไปสู่การยกเลิกการจัดซื้อเพิ่มเติม อาจทำให้หลายท่านสงสัยว่าหลักเกณฑ์การตัดสินใจว่า GT200 ใช้ได้หรือไม่นั้นน่าจะเป็นเช่นไร

วิธีการทดสอบโดยย่อคือ ทำการซ่อน-ค้นหาทั้งสิ้น 20 ครั้ง แต่ละครั้งใช้กล่อง 4 ใบ โดยมีกล่องใบหนึ่งซ่อนวัตถุระเบิด C4 ไว้อย่างสุ่มๆ ดังนั้นในการซ่อน-ค้นหาแต่ละครั้ง โอกาสที่จะพบโดยการสุ่มเลือกมั่วๆ ก็คือ 1 ใน 4 หรือ 25%

นั่นคือ ถ้าทำซ้ำ 20 ครั้ง ค่าเฉลี่ยของโอกาสที่จะพบโดยการสุ่มเลือกมั่วๆ คือ 20 ครั้ง x 25% = 5 ครั้ง

อย่าง ไรก็ดี การตีความผลการทดสอบนี้ไม่ตรงไปตรงมาเพียงแค่ว่า ถ้าผลการค้นหาพบเกินกว่า 5 ครั้ง (เช่น พบ 7 ครั้ง) ก็ถือว่าใช้ได้เพราะสูงกว่าค่าเฉลี่ยจากการสุ่มเลือก เพราะการสุ่มพบ 7 ครั้ง จาก 20 ครั้งนั้นมีโอกาสยังสูงถึง 11.2% กล่าวคือ หากทำการทดสอบอุปกรณ์ที่ทำงานมั่วๆ โดยใช้วิธีการเดียวกันนี้ซ้ำแล้วซ้ำเล่า 100 รอบ (อาจจะทำวันละ 1 รอบ รวม 100 วัน) ก็จะพบว่า มีอยู่ 11 วัน ซึ่งจะสุ่มพบกล่องที่มีวัตถุระเบิดจำนวน 7 กล่อง

ลองเปรียบเทียบการทดสอบ GT200 โดยให้ลิงตัวหนึ่งทำข้อสอบ 20 ข้อ แต่ละข้อมี 4 ตัวเลือก (เช่น ก ข ค & ง ซึ่งเทียบได้กับกล่อง 4 ใบ ซึ่งจะมีอยู่ตัวเลือกเดียวที่ถูกต้อง) ลิงตัวนี้กาเลือกมั่วๆ จนครบ

หากให้ตัวแปร n (ตัวอักษรเอ็นเล็ก) แทนจำนวนข้อที่ลิงกา (มั่ว) ถูก ผลลัพธ์ที่อาจเป็นไปได้มีตั้งแต่ n = 0 (กาผิดหมด) n = 1 (ถูก 1 ข้อ) n = 2 (ถูก 2 ข้อ) ไปเรื่อยๆ จนถึง n = 20 (ลิงมั่วถูกหมด ได้คะแนนเต็ม) รวมทั้งสิ้น 21 แบบ

ตาราง & กราฟแสดงความน่าจะเป็นในการสุ่มตรวจพบจำนวนกล่องที่มีวัตถุระเบิด

ตารางและกราฟที่ให้ไว้แสดงโอกาสหรือ ความน่าจะเป็น (probability) ของจำนวนข้อที่ลิงตัวนี้จะมั่วข้อสอบถูก เช่น โอกาสที่ลิงตอบผิดหมด (n = 0) เท่ากับ 0.317% กล่าวคือ หากให้ลิง 1,000 ตัวทำข้อสอบแบบนี้ ก็จะมีประมาณ 3 ตัวที่ตอบผิดหมดทุกข้อ

จากข้อมูลในตารางและในกราฟ มีจุดสำคัญอย่างน้อย 2 จุด ดังนี้

จุดสำคัญที่หนึ่ง – ผลลัพธ์ที่มีโอกาสสูงสุดเจ็ดอันดับแรก (เรียงจากมากไปหาน้อย) ได้แก่

ตอบถูก 5 ข้อ (20.2%)
ตอบถูก 4 ข้อ (19.0%)
ตอบถูก 6 ข้อ (16.9%)
ตอบถูก 3 ข้อ (13.4%)
ตอบถูก 7 ข้อ (11.2%)
ตอบถูก 2 ข้อ (6.7%)
ตอบถูก 8 ข้อ (6.1%)

หากรวมโอกาสที่จะตอบถูกใน 7 อันแรกนี้จะมีโอกาสสูงถึง 93.5% (จริงๆ แล้วหากรวมโอกาสที่จะตอบถูกเพียง 5 อันดับแรกก็จะมีโอกาสสูงถึง 80.7% แล้ว)

ความหมายสำหรับกรณีการทดสอบ GT200 :

หากมีสมมติฐานว่า GT200 ไม่สามารถตรวจหาระเบิดได้จริงดังอ้าง โอกาสที่ผลการทดสอบจะตกอยู่ในช่วงการพบกล่อง 2 ถึง 8 ครั้ง ก็จะมีสูงถึง 93.5% (หากทดสอบ 10 วัน จะพบกรณีนี้ 9 วัน)

จุดสำคัญที่สอง – ผลรวมของโอกาสที่ลิงตัวหนึ่งจะมั่วถูกเกิน 5 ข้อ คือ ตอบถูกตั้งแต่ 6 ข้อขึ้นไปจนตอบถูกหมด มีค่าสูงถึง 38.3% โดยค่านี้ได้มาจากโอกาสตอบถูก 6 ข้อ (16.9%) + โอกาสตอบถูก 7 ข้อ (11.2%) + …. + โอกาสตอบถูก 20 ข้อ

ความหมายสำหรับกรณีการทดสอบ GT200 :

เราไม่สามารถใช้เกณฑ์ง่ายๆ เพียงแค่ว่า หากผลการทดสอบที่ได้สูงกว่าค่าเฉลี่ย (คือ 5 กล่อง) ก็ถือได้ว่าเครื่อง GT200 สามารถทำงานค้นหาวัตถุระเบิดได้จริง เพราะเกณฑ์นี้มีโอกาสเกิดขึ้นสูงถึง 38.3% หรือเกือบ 40% ทีเดียว

โปรด สังเกตตัวเลข 38.3% นี้ไว้ เพราะจะปรากฏอีกครั้งเมื่อเราใช้เป็นตัวเลขระดับความผิดพลาดที่ยอมรับได้ใน การกำหนดเกณฑ์ตัดสินว่าเครื่อง GT200 ใช้งานได้หรือไม่

การกำหนดเกณฑ์สำหรับตัดสินว่า GT200 ใช้งานได้จริงหรือไม่?

เมื่อเข้าใจความหมายของตารางและกราฟนี้แล้ว คราวนี้ก็มาถึง เกณฑ์ในการตัดสินว่า เราจะถือว่า GT200 สามารถตรวจหาวัตถุระเบิดได้หรือไม่
การเลือกเกณฑ์ดังกล่าวมีหลายวิธี โดยวิธีที่อ้างอิงกับข้อมูลจากตารางนี้โดยตรงจะใช้ระดับความผิดพลาดที่เรายอมรับได้ ดังนี้

จำนวนกล่องที่หาระเบิดพบ           ระดับความผิดพลาด (%)
“จำนวนข้อต่ำสุดที่ลิงตอบถูก”      “โอกาสที่ลิงมั่วคำตอบถูก”
---------------------------------      ----------------------------
                      6                       38.3%
                      7                        21.4%
                      8                        10.2%
                      9                         4.1%
                     10                       1.39%
                     11                       0.394%
                     12                       0.094%
                     13                       0.018%

ตัวอย่างเช่น

หากเรายอมรับระดับความผิดพลาดว่าต้องไม่เกิน 10% จำนวนกล่องใส่วัตถุระเบิดต่ำสุดที่พบในการทดลองก็จะต้องอย่างน้อย 9 กล่อง
(เพราะหากพบแค่ 8 กล่อง ก็ยังอาจผิดพลาดได้ 10.2% ซึ่งเกิน 10%)
หากเราต้องการให้มั่นใจยิ่งขึ้น โดยยอมรับระดับความผิดพลาดได้ไม่เกิน 1% ก็ต้องหากล่องใส่วัตถุระเบิดให้พบอย่างน้อยที่สุด 11 กล่อง

น่าสนใจว่า เมื่อปี ค.ศ.2002 ห้องปฏิบัติการแห่งชาติแซนเดีย (Sandia National Laboratories) ทำการทดสอบอุปกรณ์ MOLE ซึ่งอ้างว่าสามารถตรวจจับวัตถุระเบิดได้ในทำนองเดียวกับ GT200 นี้ เกณฑ์ที่ใช้คือ 13 กล่อง เพื่อให้ได้ระดับความผิดพลาด 0.018% หรือผิดพลาดประมาณ 2 ครั้งในการทำการทดสอบ 10,000 ครั้ง แต่จากการทดสอบตรวจพบเพียงแค่ 6 กล่อง จึงถือว่าการตรวจหาวัตถุระเบิดด้วย MOLE ไม่แตกต่างจากกระบวนการเดาสุ่ม

น่ารู้ไว้ด้วยว่าอุปกรณ์ MOLE นี้ ก็ผลิตโดย Global Technical Ltd. ซึ่งเป็นผู้ผลิต GT200 เช่นกัน!

สรุป

เมื่อได้ทราบเช่นนี้แล้ว ก็คงไม่แปลกใจว่า เหตุใดผลการทดสอบพบ 4 ครั้ง จาก 20 ครั้ง จึงทำให้นายกฯ แถลงว่า ผลการทดสอบ GT200 ไม่ต่างจากการเลือกอย่างเดาสุ่มและตัดสินใจสั่งระงับการจัดซื้อ GT200 เพิ่มเติม

ผลการทดสอบนี้ยังสอดคล้องกับข้อสังเกตที่ว่าข้อมูลทาง เทคนิคของ GT200 ขัดกับหลักทางฟิสิกส์และขีดความสามารถทางเทคโนโลยีในปัจจุบัน ดังที่ผมเคยเสนอไว้ในบันทึก ‘เหตุใด GT200 จึงเข้าข่ายวิทยาศาสตร์จอมปลอม?’

ที่เล่ามานี้เป็นแก่นสาระของการทดสอบ GT200 โดยหลักการทางสถิติเท่านั้น
อย่าง ไรก็ตามการตรวจสอบอย่างเต็มรูปแบบในทางวิทยาศาสตร์และวิศวกรรมที่ควรทำก็คือ การแกะอุปกรณ์ หรือ “ผ่า” เพื่อทำให้เราเข้าใจหลักการทำงานของอุปกรณ์นั้น จะได้หมดสิ้นข้อกังขา

การกล่าวอ้างถึงข้อติดขัดทางกฎหมายสำหรับ กรณี GT200 นี้ส่อพิรุธ นั่นคือ ของที่เราซื้อมาด้วยเงินของเรา ทำไมจะทำอะไรกับมันไม่ได้? เรื่องนี้คงต้องฝากให้ผู้รู้ทางกฏหมายหาทางออกที่เกิดประโยชน์ต่อสังคมไทย มากที่สุด

กรณี GT200 เป็นตัวอย่างหนึ่งของการใช้วิทยาศาสตร์จอมปลอม (Pseudo-Science) มาแอบอ้างเพื่อขายสินค้า ทำให้หลายภาคส่วนในสังคมไทยต้องตกเป็นเหยื่อ แต่หากมองในแง่ดีก็คือ เรายังมีนักวิชาการและผู้สนับสนุนที่มีความกล้าหาญทางจริยธรรมในการออกมาทำ ให้สังคมไทยได้รู้เท่าทัน

ประวัติของบทความ

ตีพิมพ์ครั้งแรกในคอลัมน์ Event Horizon นสพ. กรุงเทพธุรกิจ เซ็คชั่น จุดประกาย เสาร์สวัสดี เสาร์ 20 ก.พ. 2553

ขุมทรัพย์ทางปัญญา

บทความจาก Sandia National Laboratories : http://www.justnet.org/Lists/JUSTNET%20Resources/Attachments/440/moleeval_apr02.pdf

บันทึกใน GotoKnow ที่เกี่ยวข้อง

กรณี GT200 : เหตุใด GT200 จึงเข้าข่ายวิทยาศาสตร์จอมปลอม?

คณิตศาสตร์ที่เกี่ยวข้อง - แนะนำโดย คุณศล แห่งห้องหว้ากอ Pantip.com

บล็อกของคุณศล

ข้อคิดเห็นในกระทู้ห้องหว้ากอ

Net9

"เชิญชวนทุกท่านร่วมสร้างสรรค์กฎหมายเพื่อชีวิตที่ดีขึ้นของทุกคน"

Suthichai Online - ข่าวประจำวัน

วันเสาร์ที่ 13 มีนาคม พ.ศ. 2553

กรณี GT200 : คณิตศาสตร์ที่อยู่เบื้องหลังการทดสอบ

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

ผู้ติดตาม

คลังบทความของบล็อก

เกี่ยวกับฉัน

หน้าเว็บ

เพลง วันชาติ (24 มิถุนา)