BlogGang.com : : leptonline

Lepton Blog ..... For Your Better Life

Group Blog

Mathmatics

All Blogs

สถิติกับการทดสอบGT200

สถิติกับการทดสอบGT200

สวัสดีครับ หลังจากเขียนบล็อกไร้สาระมาหลายอันอยู่ วันนี้ก็เลยจะลองทำบทความที่(ดู)มีสาระหน่อยก็แล้วกัน

ที่ผ่านมา ประเด็นร้อนอันหนึ่งที่ได้รับความสนใจอย่างมากของเมืองไทยตอนนี้ก็คงจะไม่พ้นเรื่อง การทดสอบประสิทธิภาพอุปกรณ์ตรวจสารพัดอย่างทั้งระเบิด ศพ ยาเสพติด (ไม่แน่นะอีกหน่อยอาจทำรุ่นที่หาเนื้อคู่ขึ้นมาใครจะรู้) ที่เครื่องหนึ่งราคาถึงหลักล้านทีเดียว

            และการทดสอบที่จัดขึ้นในวันที่ 14กุมภาพันธ์ (วันวาเลนไทน์และวันตรุษจีนซะด้วย) ก็ได้ผลออกมาเรียบร้อยแล้ว สิ่งที่น่าสนใจสำหรับผมก็คือมีการใช้ หลักสถิติ เข้ามาเป็นหัวใจสำคัญของการทดสอบนี้เลยทีเดียว ประกอบกับเทอมนี้ผมได้เรียนสถิติมาตัวหนึ่ง (สถิติธุรกิจ) ก็เลยอยากจะลองภูมิตัวเองรวบรวมเนื้อหาที่เรียนมา กับการค้นคว้าเพิ่มเติมเล็กน้อยบวกจินตนาการอีกนิด อยากรู้ว่าตัวเองจะมีน้ำยาทำให้คนอ่านเข้าใจเนื้อหานี้ได้มากแค่ไหน

            สิ่งที่ผู้อ่านจำเป็นต้องรู้มาก่อนก็คือเนื้อหาคณิตศาสตร์ม.ปลายครับ อย่างเรื่องความน่าจะเป็นนิดหน่อย ทวินาม สถิติเบื้องต้น ถ้าไม่รู้จักมาก่อนควรศึกษาเพิ่มเติม เพราะท่านอาจจะมึนที่สุด

ภาพจาก//www.andrew-drummond.com/tag/andrew-drummond/

            หน้าตาของ GT200 ก็เหมือนที่ท่านเห็นในภาพ มีด้ามจับ สำหรับผู้ใช้ถือ เสาอากาศ เมื่อผู้ใช้ถือเครื่องนี้แล้วเดิน(ตามวิธีการใช้) เสาอากาศจะแกว่ง(ด้วยผลจากแรงโน้มถ่วงของโลก) ผู้ผลิตอ้างว่ามันจะชี้ไปยังวัตถุต้องสงสัย เหนือด้ามจับจะเป็นแท่ง (ซึ่งทำจากพลาสติก) อย่าหวังว่าจะได้เห็นแผงวงจรอยู่ข้างใน เพราะมันกลวง ที่ด้านล่างจะเป็นที่ใส่การ์ด ซึ่งผู้ผลิตอ้างว่าสามารถตรวจวัตถุที่ระบุบนการ์ดได้ เช่นศพ ระเบิด ยาเสพติดฯลฯ อันที่จริงมันก๊องแก๊งมากเลย เพราะตามวิธีใช้นั้นต้องใส่การ์ดแล้วเขย่าด้วย จากนั้นผู้ใช้จะเดินแล้วใช้เครื่องนี้ชี้หา “ขอบเขต”ที่เชื่อว่าจะมีวัตถุต้องสงสัยอยู่ เอาล่ะขี้เกียจพูดถึงมันแล้ว เพราะหาอ่านเองได้เยอะ(แล้วจะพูดทำไมเนอะ) ไปดูการทดสอบดีกว่า

            การทดสอบนี้ถูกออกแบบขึ้นภายใต้สมมติฐานที่ว่า “เครื่อง GT200 นี้ เป็นเครื่องค้นหาแบบสุ่มใช่หรือไม่ใช่” เพื่อที่จะไปถึงคำตอบนั้น จำเป็นต้องใช้วิธีทางสถิติเข้ามาทดสอบ โดยจะทดสอบจากตัวอย่าง อ้างอิงไปถึงประชากร

ทั้งนี้ การอ้างอิงไปยังประชากรนั้นเกิดความผิดพลาดได้ ตัวอย่างเช่นส่วนสูงเฉลี่ยของคนไทย(ประชากรคือคนไทยทุกคน) ในขณะที่เราไม่สามารถวัดส่วนสูงของทุกคนได้ เราจะสุ่มตัวอย่างมาซัก1,000คน (นี่คือตัวอย่างของเรา) แล้วหาความสูงเฉลี่ยของตัวอย่างกลุ่มนี้ แล้วนำไปประมาณความสูงเฉลี่ยของคนไทยได้ ทั้งนี้อาจบอกเป็นช่วงค่าเฉลี่ยโดยต้องระบุระดับความเชื่อมั่นลงไปด้วย เช่นหากเราวัดความสูงเฉลี่ยของตัวอย่างพันคนได้170ซม. เราไม่สามารถบอกได้ว่าคนไทยทุกคนสูง 170ซม. แต่บอกได้ว่า ด้วยความเชื่อมั่น90% เรามั่นใจว่าความสูงเฉลี่ยของคนไทยอยู่ระหว่าง 165-175ซม.

ที่อธิบายมาทั้งหมดคือจะชี้ให้เห็นว่า การทดสอบใดๆย่อมมีโอกาสผิดพลาดได้เสมอ เราจึงต้องระบุระดับความเชื่อมั่นของเราลงไปด้วย ที่นิยมใช้กันก็คือ 90% 95% 99%

ถึงตรงนี้ การทดสอบประสิทธิภาพการใช้งานของเจ้าเครื่องGT200 นี้ถูกออกแบบให้อยู่บนสมมติฐานที่ว่า เครื่องนี้ทำงานแบบเดาสุ่มหรือไม่ ตัวอย่างเช่น หากใส่ระเบิดไว้ในกล่อง1 กล่อง โดยมีกล่องที่ภายนอกเหมือนกัน(แต่ไม่มีระเบิด)อีก1กล่อง หากเครื่องนี้ทำงานโดยการ “เดาสุ่ม”จริง โอกาสที่มันจะชี้ถูกจะเป็น 1ใน2หรือ0.5 ในทำนองเดียวกัน มีระเบิด1กล่อง และกล่องเปล่า9กล่อง หากมันเดาสุ่ม โอกาสที่มันจะชี้ถูกก็จะเป็น1ใน10หรือ0.1 สำหรับการทดสอบครั้งนี้ กำหนดให้มีระเบิด1กล่อง และกล่องเปล่าอีก3กล่อง ความน่าจะเป็นที่มันจะชี้ถูกก็คือ1ใน4หรือ0.25

อย่างไรก็ดีการทดสอบเพียงครั้งเดียว โอกาสที่มันจะชี้ถูกก็มีสูงถึง25% ที่ทำกันโดยทั่วไปก็คือการทำซ้ำเพื่อให้จำนวนการทดลอง(n)มากขึ้นพอที่จะอ้างอิงได้ สำหรับการทดสอบครั้งนี้กำหนดให้n=20ซึ่งอาจจะดูน้อย แต่เดี๋ยวจะอธิบายว่าจำนวนการทดลองเพียง20 ครั้งนั้นไม่น้อยเลย อันที่จริงถ้าเปรียบเทียบกันเรื่องที่คุ้นเคยกันดีและจะทำให้เข้าใจในเรื่องที่จะอธิบายต่อไปได้ง่ายยิ่งขึ้น ขอให้จินตนาการถึงการทำข้อสอบปรนัยแบบ4ตัวเลือก 20ข้อ (หากว่าคุณเดามั่วทุกข้อ โอกาสที่คุณจะผ่าน10คะแนนก็น้อยมากๆ)

สำหรับการแจกแจงความน่าจะเป็นในการทดสอบนี้ จะเป็นการแจกแจงความน่าจะเป็นแบบทวินาม(Binomial Probability Distribution) มารู้จักการแจกแจงแบบนี้ก่อน ลักษณะของมันก็คือเป็นการแจกแจงตัวแปรเชิงสุ่มแบบไม่ต่อเนื่อง ผลลัพธ์ที่เป็นไปได้จากการทดลองแต่ละครั้งมีเพียง2ทางเท่านั้น และแต่ละทางก็จะเกิดร่วมกันไม่ได้ และเกิดพร้อมกันไม่ได้ด้วย ตัวอย่างเช่น การโยนเหรียญจะออกได้เพียงหัวหรือก้อยเท่านั้น สินค้าที่ดีหรือชำรุด นักเรียนมาเรียนหรือขาด เจอระเบิดหรือไม่เจอ

สำหรับการทดสอบเจ้าเครื่องGT200 นี้มีทางเลือก2ทางคือชี้ถูก(โอกาส1ใน4)และชี้ไม่ถูก(โอกาส3ใน4) โดยมีตัวแปรเชิงสุ่ม(ผลลัพธ์ที่เป็นไปได้ทั้งหมด)ซึ่งก็คือจำนวนครั้งที่เครื่องนี้สามารถชี้กล่องที่มีระเบิดได้ถูกต้องจากทั้งหมด20ครั้ง คือมีตั้งแต่0ครั้ง(ชี้ไม่ถูกเลย) ถูก1ครั้ง ถูก2ครั้ง ไปเรื่อยๆจนถึงชี้ถูกกล่องทุกครั้งคือ20ครั้ง ซึ่งความน่าจะเป็นที่ผลลัพธ์จะออกมาเป็นตัวแปรเชิงสุ่มต่างๆ(0-20)ก็ย่อมแตกต่างกัน ทั้งนี้การแจกแจงความน่าจะเป็นของตัวแปรเชิงสุ่มจะเป็นไปตามการแจกแจงแบบทวินาม

ถ้ายังจำกันได้ สมัยม.2 เรารู้จักเอกนาม monomial(สัมประสิทธิ์คูณตัวแปรที่ยกกำลังn) รู้จักพหุนามpolynomial(เอกนามหลายๆพจน์ที่อยู่ในรูปการบวก) ทวินามbinomialก็คือพหุนามที่มีเอกนามเพียง2พจน์ การแจกแจงทวินามก็คือการนำทวินามมายกกำลังn(จำนวนนับ)ซึ่งจะมีการแจกแจงที่เฉพาะตัวยกตัวอย่างเช่น กำลัง2สมบูรณ์(perfect square) กำลัง3สมบูรณ์ ซึ่งจะเป็นไปตามทฤษฎีบททวินาม และสามเหลี่ยมปาสคาล ส่วนการแจกแจงความน่าจะเป็นแบบทวินามนั้น ใช้ตัวแปรเป็นp(ความน่าจะเป็นที่ผลลัพธ์จะสำเร็จ) และq(ความน่าจะเป็นที่ผลลัพธ์จะล้มเหลว =1-p) อาจเขียนได้ว่า (p+q)ⁿ=1 โดยการกระจายพจน์ต่างๆก็คือการแจกแจงแบบทวินามนั่นเอง ซึ่งมีสูตรหาความน่าจะเป็นสำหรับตัวแปรเชิงสุ่ม k ใดๆคือ

ทั้งนี้ ความน่าจะเป็นรวมของทุกตัวแปรเชิงสุ่มจะเท่ากับ1

            เมื่อนำค่าต่างๆ(n=20,p=0.25,k=ตัวแปรเชิงสุ่มตั้งแต่0ถึง20)ไปแทนในสูตรข้างต้น จะได้ความน่าจะเป็นของตัวแปรเชิงสุ่มต่างๆดังนี้

            จากตารางสามารถอ่านค่าได้ว่าความน่าจะเป็นที่เครื่องGT200จะเลือกไม่ถูกสักกล่องเดียวจาก20กล่องเป็น0.00317(0.317%) ความน่าจะเป็นที่จะถูก3กล่องเป็น0.06695 จะสังเกตว่าผลลัพธ์ที่มีความน่าจะเป็นสูงสุดคือ5ครั้งเป็น0.20233(ประมาณ20%)รองลงมาคือ4ครั้งเป็น0.18969(ประมาณ19%) ส่วนผลลัพธ์ตั้งแต่12เป็นต้นไปมีโอกาสเกิดน้อยมากๆๆๆ ยิ่งถ้ามากกว่า16ก็จะน้อยกว่า1ในล้านเลยทีเดียว ดังนั้นหากเครื่องนี้สามารถเลือกถูกมากกว่า11กล่องก็พอจะสรุปได้ว่าเครื่องนี้ไม่ได้ใช้วิธีเดาสุ่ม

            นำค่าความน่าจะเป็นมาแสดงในแผนภูมิได้ดังนี้

            พอลองหาแนวโน้มก็พบว่ามันใกล้เคียงการแจกแจงปกติทีเดียว แต่อย่างไรก็ตามเราจะไม่ไปยุ่งกับการแจกแจงปกติ เพราะจะทำให้การสรุปผลคาดเคลื่อนได้

            ที่กล่าวมาข้างต้นนั่นก็คือการออกแบบการทดลอง ทีนี้มาดูการทดสอบสมมติฐานกัน ที่บอกไว้แล้วว่าเราตั้งไว้แต่ต้นว่าเครื่องGT200นี้ทำงานแบบเดาสุ่มหรือไม่ การตั้งสมมติฐานเพื่อทดสอบทำได้ดังนี้

1.       Null Hypothesis (H0,สมมติฐานที่ต้องทำการทดสอบ) คือ เครื่องนี้ทำงานแบบสุ่ม ความน่าจะเป็นในการเลือกกล่องที่ถูกจะ<หรือ= 0.25

2.       Alternative Hypothesis (H1,สมมติฐานแย้ง) คือ เครื่องนี้ไม่ได้ทำงานแบบสุ่ม ความน่าจะเป็นในการเลือกล่องถูกจะ>0.25

เห็นได้ว่าเป็นการทดสอบด้านเดียว ทั้งนี้จะต้องกำหนดระดับความเชื่อมั่นไว้ด้วย โดยระดับความเชื่อมั่นจะเป็นตัวกำหนดขอบเขตการปฏิเสธH0(Rejection Region) เราจะพิจารณาจากตารางแจกแจงความน่าจะเป็นแบบสะสมข้างต้น จะเห็นว่าที่ผลลัพธ์เป็นการเลือกถูก7กล่อง ความน่าจะเป็นสะสมอยู่ที่ประมาณ 90% อธิบายได้ว่า การทดลองทั้ง20ครั้ง หากเลือกกล่องถูกน้อยกว่าหรือเท่ากับ7กล่อง เราจะยอมรับสมมติฐาน H0 คือยอมรับว่าเครื่องนี้ทำงานโดยการเดาสุ่ม แต่ถ้าเลือกถูกตั้งแต่8กล่องเป็นต้นไป เราจะปฏิเสธH0แต่ยอมรับH1คือยอมรับว่าเครื่อง GT200 ไม่ได้ทำงานแบบสุ่ม ทั้งนี้ จะต้องอยู่บนระดับความเชื่อมั่น 90% เท่ากับความน่าจะเป็นสะสม

ในทำนองเดียวกันพิจารณาที่ผลลัพธ์คือเลือกถูกถึง10กล่อง ความน่าจะเป็นสะสมอยู่ที่ประมาณ 99% ดังนั้น หากผลการทดสอบออกมาว่าเลือกกล่องถูกน้อยกว่าหรือเท่ากับ10กล่อง เราจะยอมรับH0แต่ถ้าเลือกถูกตั้งแต่11กล่องขึ้นไป เราจะยอมรับH1 ที่ระดับความเชื่อมั่น99%

สำหรับผลการทดสอบที่ออกมาพบว่าเครื่องGT200นั้นเลือกกล่องที่มีระเบิดถูกเพียง 4 ครั้ง จากการทดลอง20ครั้ง พูดง่ายๆว่าคนที่ไม่ต้องมีความรู้เรื่องสถิติก็สามารถเข้าใจโดยใช้ตับ(ไม่ต้องใช้สมอง) ว่ามันใช้การไม่ได้หรอกนะ จะดริฟท์ไปถึงไหนกัน

แต่ถ้าจะสรุปเป็นภาษาสถิติสวยๆก็คงจะเป็นว่า “ยอมรับ H0ที่ระดับความมั่นใจ99% ไม่มีหลักฐานทางสถิติที่แสดงว่าความน่าจะเป็นในการเลือกกล่องถูกมากกว่า0.25อย่างมีนัยสำคัญทางสถิติ (เครื่องGT200ทำงานโดยการเดาสุ่ม และเดาได้ห่วยแตกกว่านักเรียนทำข้อสอบเสียอีกนะจะบอกให้)”

อย่างไรก็ตาม น่าแปลกใจที่ผมมีแหล่งข่าวใกล้ตัว (คนในบ้าน)บอกว่าเครื่องมือนี้เคยพิสูจน์ให้เห็นกับตามาแล้วว่าสามารถทำงานได้ถึง50% ทีเดียว ...มึนที่สุด

ขอบคุณข้อมูลบางส่วนจาก

//www.gt200.org/

//en.wikipedia.org/wiki/Binomial_distribution

Create Date : 17 กุมภาพันธ์ 2553

Last Update : 17 กุมภาพันธ์ 2553 0:42:23 น.

Counter : 694 Pageviews.

2 comment

Share
Tweet