Thursday, May 28, 2020

บทที่ 1 บทนำ สถิติเบื้องต้น

ข้อมูลเป็นองค์ประกอบที่ส าคัญส าหรับการตัดสินใจ เช่น การวางแผนในชีวิตประวันที่ เกี่ยวข้องกับคนเพียงคนเดียว หรือเกี่ยวข้องกับคนเป็นจำนวนมาก ทำให้ มีการพัฒนาวิธีการจัดการ ข้อมูลเพื่อให้ได้ผลลัพธ์ที่สอดคล้องกับความต้องการ ของผู้ใช้โดยเริ่มจากการ การวางแผนการเก็บ รวบรวมข้อมูล การอธิบายเกี่ยวกับข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูล การวัดแนวโน้มเข้าสู่ ส่วนกลาง การวัดการกระจายของข้อมูล การหาค่าความน่าจะเป็น การประมาณค่า การทดสอบสมมติฐาน การวิเคราะห์ความสัมพันธ์ การพยากรณ์ เป็นต้น  สำหรับในบทนี้จะกล่าวถึงสถิติเบื้องต้นที่เกี่ยวกับ ความหมายของสถิติ วิธีการทางสถิติ คำศัพท์ที่ควรทราบ ประเภทของข้อมูล ข้อมูลสถิติการแบ่งข้อมูล ระดับของข้อมูล การเก็บรวบรวม ข้อมูล เป็นต้น

ความหมายของสถิติ สถิติศาสตร์ (Statistics) หมายถึง ศาสตร์หรือวิชาที่ว่าด้วยวิธีทางการทางสถิติแขนงหนึ่งที่ ประกอบไปด้วยระเบียบวิธีการ 4 ขั้นตอน คือ (1) การเก็บรวบรวมข้อมูล (Collection of data) ซึ่งรวมถึงการด าเนินการเพื่อให้ได้มาซึ่ง ข้อมูล เช่น วิธีการสุ่มตัวอย่าง วิธีการเก็บรวบรวมข้อมูลอาจจะโดยการสัมภาษณ์ การโทรศัพท์ การส่งไปรษณีย์ เป็นต้น (2) การน าเสนอข้อมูล (Presentation of data) เป็นวิธีการน าเสนอข้อมูลแบบต่างๆ เช่น การน าเสนอโดยใช้บทความ ตารางแจกแจงความถี่ การน าเสนอด้วยแผนภูมิแท่งหรือกราฟ เป็นต้น (3) การวิเคราะห์ข้อมูล (Analysis of data) เป็นการวิเคราะห์หรือด าเนินการเกี่ยวกับข้อมูล ซึ่งเป็นการวิเคราะห์ขั้นต้น เช่น การหาค่าเฉลี่ย การหาค่าส่วนเบี่ยงเบนมาตรฐาน และ การวิเคราะห์ขั้นสูง เช่น การประมาณค่า การทดสอบสมมติฐาน การหาสหสัมพันธ์ เป็นต้น (4) การตีความหมายของข้อมูล (Interpretation of data) เป็นการน าข้อมูลที่วิเคราะห์แล้วมา ตีความหมายหรือการอธิบายความหมาย เพื่อเป็นการสรุปเกี่ยวกับลักษณะของตัวอย่างหรือประชากร


ิธีการทางสถิติ การแบ่งวิธีการทางสถิติตามวิธีการด าเนินการหรือการกระท าเกี่ยวกับข้อมูล แบ่งเป็น 2 ประเภท คือ 1. สถิติเชิงพรรณนา (Descriptive statistics) วิธีการทางสถิติที่เกี่ยวกับการอธิบาย การบรรยายหรือการวัดลักษณะต่าง ๆ ของ ตัวอย่างหรือประชากรเช่น 1.1 การจัดระเบียบข้อมูล เป็นการจัดข้อมูลให้เป็นหมวดหมู่ เช่น แผนภูมิ ตารางแจก แจงความถี่ เป็นต้น 1.2 การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นการหาค่าที่เป็นตัวแทนของข้อมูลในแต่ละ ชุด เช่น ค่าเฉลี่ยเลขคณิต มัธยฐาน ฐานนิยมหรือค่าเฉลี่ยฮาร์โมนิค เป็นต้น 1.3 การวัดการกระจายของข้อมูล เป็นการวัดความแตกต่างระหว่างข้อมูลแต่ละค่า เช่น พิสัย ส่วนเบี่ยงเบนมาตรฐานและความแปรปรวน สัมประสิทธิ์ความแปรผัน เป็นต้น 1.4 การวัดการแจกแจง เป็นการหารูปแบบหรือลักษณะของข้อมูล เช่น ความเบ้หรือ ความโด่งของข้อมูล การแจกแจงแบบต่างๆ 1.5 การวิเคราะห์ความสัมพันธ์ การหาความสัมพันธ์ระหว่างข้อมูลตั้งแต่สองชุดขึ้น ไป เช่น สัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน สัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมนแรงค์ เป็นต้น 2. สถิติเชิงอนุมาน (Inferential statistics) วิธีการทางสถิติที่เกี่ยวกับการใช้ลักษณะของตัวอย่างในการอ้างอิงถึงลักษณะประชากร โดยใช้ความน่าจะเป็นช่วยในการอ้างอิง สถิติเชิงอนุมานประกอบด้วย การประมาณค่า การสุ่มตัวอย่าง การแจกแจงของตัวแปรสุ่ม การทดสอบสมมติฐาน และแบ่งสถิติเชิงอนุมานออกเป็น 2 ประเภท คือ 2.1 สถิติมีพารามิเตอร์ (Parametric statistics) เป็นวิธีการทางสถิติที่ที่เกี่ยวกับ พารามิเตอร์หรือลักษณะของประชากรโดยมีข้อตกลงเบื้องต้น 2 ประการคือประการแรกตัวแปร ที่ต้องการวัดจะต้องอยู่ในมาตราอันตรภาคชั้น (interval scale) หรือมาตราอัตราส่วน (rational scale) เช่น ปริมาณสินค้า ราคาสินค้า และประการที่สองข้อมูลที่เก็บรวบรวมได้จะต้องมีการแจกแจงเป็นโค้ง


ปกติ สถิติมีพารามิเตอร์ เช่น การทดสอบค่าเฉลี่ย การวิเคราะห์ความแปรปรวน การวิเคราะห์ สหสัมพันธ์และ การวิเคราะห์การถดถอย เป็นต้น 2.2 สถิติไร้พารามิเตอร์ (Nonparametric statistics) เป็นวิธีการทางสถิติที่ไม่มี ข้อจ ากัดเกี่ยวกับลักษณะของประชากรและตัวแปรที่ต้องการวัดจะอยู่ในมาตราไดก็ได้ และข้อมูล ที่เก็บรวบรวมจะมีการแจกแจงแบบใดก็ได้ (free distribution) สถิติไร้พารามิเตอร์ เช่น ไคสแควร์ การ ทดสอบลักษณะสุ่ม เป็นต้น ค าศัพท์ทางสถิติที่ควรทราบ 1. ประชากร (Population) กลุ่มของสิ่งที่เราสนใจทั้งหมด ณ เวลาหนึ่งๆ ซึ่งอาจจะเป็นคน สัตว์หรือสิ่งของ เช่น ผู้ ที่มาใช้สิทธิ์ในการเลือกตั้งสมาชิกองค์การบริหารส่วนต าบลแห่งหนึ่งใน ปี พ.ศ. 2553 จ านวน 5,000 คน เป็นต้น แบ่งประชากรออกเป็น2 ประเภท คือ 1.1 ประชากรจ ากัด (Finite population) หมายถึง กลุ่มประชากรที่สามารถ แจงนับหน่วยย่อยได้ทั้งหมด เช่น สมาชิกขององค์กรหรือหน่วยงาน ร้านค้าที่จดทะเบียน เป็นต้น 1.2 ประชากรอนันต์ (Infinite population) หมายถึง กลุ่มประชากรที่ไม่สามารถแจง นับหน่วยย่อยได้ทั้งหมด เช่น ประชากรปลาในทะเล สัตว์ที่อยู่ในอุทยานแห่งชาติ เป็นต้น 2. ตัวอย่าง (Sample) สมาชิกบางส่วนของประชากรหรือเซตย่อยของประชากรที่ ถูกเลือกโดยวิธีการ ทางสถิติ เช่น ประชากร คือ ผู้ที่มาใช้สิทธิ์ในการเลือกตั้งสมาชิกองค์การบริหารส่วนต าบลแห่งหนึ่งใน ปี พ.ศ. 2553 จ านวน 5,000 คน กลุ่มตัวอย่าง คือ สมาชิกเพียงบางส่วนที่ถูกเลือกมา เป็นตัวอย่างโดย วิธีการหยิบฉลากหรือโดยวิธีอื่นๆ เป็นต้น 3. แหล่งข้อมูล (Source of data)


ข้อมูลทางสถิติแบ่งตามแหล่งหรือที่มามี2 ประเภท คือ 3.1 แหล่งข้อมูลปฐมภูมิ (Primary source) หมายถึง ข้อมูลที่ได้มาจากแหล่งข้อมูล โดยตรงซึ่งมีความแม่นสูง ต้อง ใช้เวลา ในการรวบรวมนาน และ มีค่าใช้จ่ายที่สูง เช่น การเก็บข้อมูลโดยการใช้แบบสอบถามหรือการสัมภาษณ์โดยพนักงานโดยตรง การสังเกต เป็นต้น 3.2 แหล่งข้อมูลทุติยภูมิ (Secondary source) หมายถึง ข้อมูลที่ได้มาจากแหล่งข้อมูล ที่ผ่านการเก็บรวบรวมข้อมูลมาแล้วเป็นการเก็บข้อมูลที่สะดวกและเสียค่าใช้จ่ายน้อยความแม่นย าของ ข้อมูลขึ้นอยู่กับวิธีการในการเก็บรวบรวม ข้อมูล แหล่งข้อมูลทุติยภูมิ เช่น การเก็บรวบรวมข้อมูลจาก ส านักงานสถิติแห่งชาติหรือหอสมุด การเก็บข้อมูลจากพาณิชย์จังหวัด เป็นต้น 4. พารามิเตอร์ (Parameter) คือ ค่าคงที่ที่บอกถึงลักษณะประชากร เป็นค่าที่ได้มาจากการวัดทุกหน่วยของ ประชากร เช่น  แทน ค่าเฉลี่ยของประชากร  แทน ส่วนเบี่ยงเบนมาตรฐานของประชากร P แทน สัดส่วนของประชากร 5. ค่าสถิติ (Statistics) ค่าที่ได้จากตัวอย่างหรือค่าที่ได้จากค านวณเกี่ยวกับตัวอย่าง มักจะใช้เป็นค่าอ้างอิง เกี่ยวกับประชากร เช่น X แทน ค่าเฉลี่ยของตัวอย่าง S แทน ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง p แทน สัดส่วนของตัวอย่าง 6. ค่าสังเกต (Observation)


ค่าที่ได้จากการวัดของแต่ละหน่วยตัวอย่างที่สนใจเช่น ระดับความเห็น ระดับความพึง พอใจ ส่วนสูง คะแนนของลูกค้าแต่ละคน เป็นต้น 7. ตัวแปร (Variable) ลักษณะของสิ่งที่สนใจท าการศึกษา เช่น ปริมาณสินค้า ส่วนสูง น้ าหนัก คะแนน เป็น ต้น ข้อมูลสถิติ ข้อมูล (Data) หมายถึง ข้อเท็จจริงของสิ่งที่ต้องการจะศึกษา เช่น เพศ อายุ สถานภาพ ระดับ ความคิดเห็น เป็นต้น ข้อมูลอาจจะ เป็นตัวเลขที่ มีหน่วยในการวัดได้แก่ อายุ น้ าหนัก เป็นต้น และ ข้อมูลที่ไม่เป็นตัวเลขหรือข้อมูลที่ไม่สามารถวัดเป็นตัวเลขได้และไม่มีหน่วยในการวัด แต่มักจะใช้ ตัวเลขหรือสัญลักษณ์แทนข้อมูล เช่น สถานภาพ หมู่เลือด ศาสนา ระดับความเห็น คุณภาพของสินค้า แบ่งข้อมูลออกเป็น 2 ประเภท 1. ข้อมูลดิบ ข้อมูลดิบ (Raw data) คือ ข้อมูลที่ยังไม่ได้จัดระเบียบหรือยังไม่มีการจัดแบ่งประเภท และหมวดหมู่ เช่น ข้อมูลอาชีพ ชนิดสินค้าที่ลูกค้าต้องการ เป็นต้น 2. ข้อมูลหมวดหมู่(Group data) ข้อมูลที่จัดเป็นหมวดหมู่มีการแจกแจงความถี่ ข้อมูลอาจอยู่ในรูปของตาราง แผนภาพ หรือแผนภูมิ เช่น ตารางแจกแจงความถี่แบ่งตามหมวดอายุ อาชีพ หรือชนิดของสินค้า เป็นต้น การแบ่งข้อมูล 1. ข้อมูลเชิงคุณภาพ (Qualitative data)


ข้อมูลที่ใช้ตัวเลขหรือสัญลักษณ์แทนลักษณะหรือสมบัติของสิ่งต่างๆ ที่สนใจ มักจะ เป็นข้อมูลส าหรับจ าแนกประเภท ไม่สามารถทราบค่าได้ว่ามีค่ามากหรือน้อย อาจจะเป็นข้อความหรือ ตัวเลขที่แทนข้อความ เช่น กลุ่มเลือด - กลุ่มเลือดเอ แทนด้วย A - กลุ่มเลือดบี แทนด้วย B - กลุ่มเลือดโอ แทนด้วย O - กลุ่มเลือดเอบี แทนด้วย AB เพศ - ชาย แทนด้วย 1 - หญิง แทนด้วย 0 ซึ่งตัวเลขเหล่านี้ไม่สามารถจะน ามาเปรียบเทียบ ปริมาณความมากน้อยและด าเนินการ บวก ลบ คูณหรือหารได้ 2. ข้อมูลเชิงปริมาณ (Quantitative data) ข้อมูลสามารถวัดค่าได้และสามารถบอกได้ว่าค่าที่ได้มีมากกว่าหรือน้อยกว่าเป็น จ านวนเท่าได สามารถน ามาเปรียบเทียบ บวก ลบ คูณหรือหารได้ เช่น ปริมาณน้ ามัน ราคายางพารา อายุ ส่วนสูง เป็นต้น ข้อมูลเชิงปริมาณแบ่งออกเป็น 2 แบบคือ 2.1 ข้อมูลแบบไม่ต่อเนื่อง (Discrete data) คือ ข้อมูลที่เป็นจ านวนเต็มหรือเป็น จ านวนนับ เช่น จ านวนคน จ านวนรถที่ผลิตในแต่ละปี ซึ่งมีค่าเป็น 0 ,1, 2, … 2.2 ข้อมูลแบบต่อเนื่อง (Continuous data) คือ ข้อมูลมีค่าบนทุกๆ จุดในช่วงที่ ก าหนด การวัดเป็นการก าหนดตัวเลขให้กับสิ่งที่ต้องการศึกษาภายใต้กฎเกณฑ์ที่แน่นอน เช่น น้ าหนัก ส่วนสูง ระยะทาง ระยะเวลา เป็นต้น ระดับของข้อมูล การเลือกวิธีวิเคราะห์ทางสถิติที่เหมาะสมส าหรับข้อมูลแต่ละชุด ต้องมีการแบ่งระดับของ ข้อมูลหรือมาตราวัดระดับข้อมูลแบ่งออกเป็น 4 ระดับคือ


1. มาตรานามบัญญัติ(Nominal scale) การก าหนดตัวเลขหรือสัญลักษณ์ให้กับสมบัติ ลักษณะหรือเหตุการณ์ต่างๆที่เกิดขึ้น เพื่อจ าแนกกลุ่มหรือพวกของข้อมูล เป็นระดับข้อมูลที่หยาบที่สุดและมีสมบัติที่ส าคัญ คือ ตัวเลขหรือ สัญลักษณ์ที่ก าหนดให้ข้อมูลเพียงแต่ชี้ให้เห็นว่าข้อมูลอยู่คนละกลุ่มกันหรือคนละพวกเท่านั้น และ ตัวเลขมิได้ใช้เป็นเครื่องแสดงว่าข้อมูลกลุ่มใดมีค่ามากกว่าหรือน้อยกว่ากัน หรือส าคัญกว่ากัน ไม่ สามารถน าตัวเลขาเรียงล าดับหรือค านวณได้ เช่น เพศ สถานภาพ กลุ่มเลือด มักจะแทนด้วยตัวแปร ดังนี้ เพศ - 0 แทน เพศชาย - 1 แทน เพศหญิง กลุ่มเลือด - 1 แทน กลุ่มเลือด A - 2 แทน กลุ่มเลือด B - 3 แทน กลุ่มเลือด AB - 4 แทน กลุ่มเลือด O โดยส่วนมากแล้วข้อมูลในกลุ่มนี้จะใช้กับสถิติไร้พารามิเตอร์เป็นส่วนใหญ่ เช่น การ หาค่าความถี่ การทดสอบความเป็นอิสระ เป็นต้น 2. มาตราเรียงอันดับ (Ordinal scale) คือ การก าหนดตัวเลขหรือสัญลักษณ์ให้กับเหตุการณ์หรือลักษณะที่สามารถจะน ามา เรียงล าดับได้ มีคุณสมบัติที่ส าคัญ คือ ตัวเลขหรือสัญลักษณ์ที่ได้สามารถบอกทิศทางของความ แตกต่างหรือล าดับของความส าคัญได้ว่าตัวเลขที่แทนมีค่ามากหรือน้อย สูงหรือต่ า เก่งหรืออ่อน แต่ ไม่สามารถบอกปริมาณของความแตกต่างได้ว่าแต่ละล าดับแตกต่างกันเป็นจ านวนเท่าใด ระดับความพึงพอใจ แบ่งได้ 5 ระดับ - ไม่พอใจ แทนด้วย 1 - พอใจน้อย แทนด้วย 2 - พอใจปานกลาง แทนด้วย 3


- พอใจมาก แทนด้วย 4 - พอใจมากที่สุด แทนด้วย 5 ระดับการศึกษา - ระดับประถมหรือต่ ากว่า แทนด้วย 1 - ระดับมัธยม แทนด้วย 2 - ระดับปริญญาตรี แทนด้วย 3 - ระดับปริญญาโทหรือสูงกว่า แทนด้วย 4 3. มาตราอันตรภาคชั้น (Interval scale) การก าหนดตัวเลขให้กับเหตุการณ์หรือลักษณะต่างๆ สามารถบอกได้ว่าปริมาณของ ความแตกต่างห่างกันเป็นระยะเท่าใดและสามารถน ามาบวก ลบ คูณ หาร กันได้ แต่ไม่สามารถบอกได้ ว่าเป็นกี่เท่าของกันและกัน และเป็นมาตราที่มีศูนย์เทียมคือมีเลข 0 แต่มีค่าไม่เท่ากับศูนย์ เช่น ระดับ อุณหภูมิ ถ้าระดับอุณหภูมิเท่ากับศูนย์องศาไม่ได้หมายความว่าไม่มีความร้อน เพราะยังมีความร้อน แฝงเหลืออยู่ และไม่สามารถบอกได้ว่าความร้อน 50 องศาเป็นสองเท่าของความร้อน 25 องศา คะแนน สอบ ถ้าคะแนนสอบได้ 0 คะแนน ไม่ได้หมายความว่านักศึกษาไม่มีความรู้เลยและในท านองเดียวกัน ไม่สามารถบอกได้ว่ารับความรู้ของคนที่ได้คะแนน 40 คะแนนจะมีระดับความรู้มากกว่าคนที่ได้ คะแนน 20 คะแนนเป็นสองเท่า เป็นต้น 4. มาตราอัตราส่วน (Rational scale) การก าหนดตัวเลขให้กับเหตุการณ์หรือลักษณะที่สามารถจะน ามาเรียงล าดับได้ สามารถบอกได้ว่าแต่ละล าดับห่างกันเป็นระยะเท่าใด และบอกได้ว่าเป็นกี่เท่าของกันและกันและเป็น ระดับที่มีศูนย์จริง ตัวเลขในระดับนี้สามารถน ามา บวก ลบ คูณ หาร และอัตราส่วนได้ เช่น น้ าหนัก ระยะทาง ส่วนสูง พื้นที่ เป็นต้น การเก็บรวบรวมข้อมูล การเก็บรวบรวมข้อมูลจากหน่วยแจงนับของตัวอย่างหรือประชากรที่ศึกษา แบ่งเป็น 2 ประเภท คือ การส ามะโน (census) เป็นการการเก็บข้อมูลจากทุกหน่วยของประชากรที่สนใจศึกษา


เช่น ถ้าประชากรที่ต้องการศึกษามี 500 หน่วย ก็ต้องท าการศึกษาประชากรทุกหน่วย และ การส ารวจตัวอย่าง (Sample Survey) เป็นการเก็บรวบรวมข้อมูลเพียงบางส่วนของหน่วยประชากร เช่น เลือกส ารวจตัวอย่างเพียง 50 หน่วย จากประชากรทั้งหมด 500 หน่วย เป็นต้น และ มีวิธีการเก็บ รวบรวมข้อมูลที่ส าคัญดังนี้ 1. การสัมภาษณ์ (Interview) การที่ผู้วิจัยส่งพนักงานสัมภาษณ์ไปการเก็บรวบรวมข้อมูลจากแหล่งข้อมูลโดยตรง ถ้า ผู้ตอบไม่เข้าใจค าถามพนักงานสัมภาษณ์สามารถอธิบายรายละเอียดให้กับผู้ถูกสัมภาษณ์ได้ทันที ถ้า เป็นโครงการใหญ่เพื่อให้พนักงานสัมภาษณ์มีความเข้าใจตรงกันก็ควรจัดให้มีการอบรมพนักงานก่อน ออกสัมภาษณ์จริง ข้อดีของการสัมภาษณ์คือท าให้ได้ข้อมูลที่รวดเร็วแต่มีข้อเสียคือท าให้เสียค่าใช้จ่าย สูง 2. การส่งทางไปรษณีย์ การที่ผู้วิจัยส่งแบบสอบถามทางไปรษณีย์ไปให้กลุ่มตัวอย่างแล้วให้กลุ่มตัวอย่างที่เป็น ผู้ตอบแบบสอบถามส่งแบบสอบถามคืนมาทางไปรษณีย์ แต่โดยส่วนมากแล้วผู้ตอบแบบสอบถามจะ ไม่ส่งแบบสอบถามคืนมาให้ ข้อดีคือ ประหยัดค่าใช้จ่ายแต่มีข้อเสียคือได้ข้อมูลที่ช้าหรืออาจ 3. การทอดแบบ การที่ผู้วิจัยน าแบบสอบถามไปให้กลุ่มตัวอย่างแล้วนัดวันจะมารับแบบสอบถามคืน ส่วนมากแล้วผู้ตอบแบบสอบถามจะให้ความร่วมมือข้อดีคือประหยัดค่าใช้จ่าย แต่มีข้อเสีย คืออาจจะ เป็นข้อมูลที่ตัวอย่างไม่ได้ตอบเอง 4. โทรศัพท์ การที่ผู้วิจัยหรือพนักงานโทรศัพท์โทรไปสอบถามกลุ่มตัวอย่างโดยตรง มีข้อดี คือ ประหยัดและได้ค าตอบเร็วแต่มีข้อเสียคือสอบถามได้เฉพาะผู้ที่มีโทรศัพท์เท่านั้น


5. การชั่ง ตวง วัด หรือนับ การที่ผู้วิจัยใช้เครื่องมือทางวิทยาศาสตร์ช่วยท าให้ได้ตัวเลขที่แน่นอนและ มีความแม่นย าสูง เช่น การชั่งน้ าหนัก การวัดส่วนสูง การวัดระยะทาง การนับจ านวนสินค้า เป็นต้น การน าเสนอข้อมูล เมื่อเก็บรวบรวมข้อมูลหรือวิเคราะห์ข้อมูลจะน าเสนอข้อมูลได้หลายวิธี เช่น เสนอในรูป ของข้อความ เสนอในรูปแผนภูมิหรือแผนภาพ หรือเสนอในรูปกราฟ โดยความเหมาะสมของ การน าเสนอจะขึ้นอยู่กับลักษณะของข้อมูลที่จะน าเสนอเป็นส าคัญ 1. การน าเสนอในรูปข้อความ คือ การใช้ข้อความหรือตัวเลขประกอบกัน เช่น จากการส ารวจพบว่า ประชาชนอายุ 18 ปีขึ้นไป ส่วนใหญ่ประมาณร้อยละ 65.7 ทราบหรือเคยได้ยินเกี่ยวกับการปฏิรูประบบราชการ และ อีกร้อยละ 34.3 ไม่เคยทราบหรือไม่เคยได้ยิน ส าหรับสื่อที่ท าให้ทราบหรือเคยได้ยินเกี่ยวกับการปฏิรูป ระบบราชการมากที่สุด คือโทรทัศน์ ซึ่งมีผู้ที่รับทราบจากสื่อนี้ประมาณร้อยละ 87.9 รองลงมาคือ หนังสือพิมพ์ มีผู้ที่ทราบจากสื่อนี้ประมาณร้อยละ 32.9 วิทยุ ร้อยละ 24.2 เจ้าหน้าที่ของรัฐ ร้อยละ 16.6 ญาติหรือเพื่อน ร้อยละ 9.7 เอกสารหรือแผ่นปลิว ร้อยละ 4.9 ส าหรับผู้ที่รับทราบจากอินเตอร์เน็ต มี เพียงร้อยละ 1.7 และอีกร้อยละ 0.8 รับทราบจากสื่ออื่น ๆ


 2. การน าเสนอในรูปตาราง การน าเสนอโดยการจัดข้อมูลเป็นกลุ่มหรือเป็นหมวดหมู่เพื่อให้กะทัดรัดและสะดวก ต่อการเปรียบเทียบข้อมูลที่เกี่ยวข้องกัน จึงมีการระบุจ านวนหรือความถี่ของข้อมูลในแต่ละหมวดหมู่ ว่ามีจ านวนเท่าใด เช่น สถานภาพของแรงาน แบ่งออกเป็น ก าลังแรงงานปัจจุบันซึ่งก็คือผู้ที่มีงานท าอยู่ แล้ว ก าลังแรงงานที่รอฤดูกาลซึ่งส่วนมากเป็นผู้ที่ท าการเกษตร และผู้ไม่อยู่ในก าลังแรงงานซึ่งก็คือผู้ที่ ก าลังเรียนหนังสือ วัยชรา หรือแม่บ้าน เป็นต้น ส่วนประกอบที่ส าคัญของตารางจะประกอบด้วย หมายเลขตาราง ชื่อตาราง หัวขั้ว หัวเรื่อง ตัวเรื่องและแหล่งที่มาของข้อมูล ดังตารางที่ 1.1 ตารางที่ 1.1จ านวนประชากรจ าแนกตามสถานภาพแรงงาน พ.ศ. 2544 สถานภาพแรงงาน พ.ศ. 2544 รอบที่ 1 (ม.ค. - มี.ค.) 1. ก าลังแรงงานปัจจุบัน 32,027.1 1.1 ผู้มีงานท า 30,444.7 1.1.1 ท างาน 28,630.6 1.1.2 ไม่ได้ท างานแต่มีงานประจ า 1,814.1 1.2 ผู้ไม่มีงานท า 1,582.4 1.2.1 ก าลังหางานท า 443.5 1.2.2 ไม่หางานท าแต่พร้อมที่จะท างาน 1,139.0 2. ก าลังแรงงานที่รอฤดูกาล 1,184.8 3. ผู้ไม่อยู่ในก าลังแรงงาน ที่มีอายุ 15 ปีขึ้นไป 13,614.4 4. ผู้ที่มีอายุต่ ากว่า 15 ปี 15,914.8 ที่มา : รายงานผลการส ารวจภาวะ การท างานของประชากร พ.ศ. 2544 ส านักงานสถิติแห่งชาติ


3. การน าเสนอในรูปแผนแผนภูมิ การน าเสนอด้วยแผนภูมิที่นิยมกันทั่วไปมีอยู่ 2 ชนิด คือ แผนภูมิแท่ง (bar chart) มี รูปร่างเป็นแท่ง แผนภูมิวงกลม (pie chart) มีรูปร่างเป็นรูปวงกลม แผนภูมิประกอบด้วย เลขที่ของ แผนภูมิ ชื่อแผนภูมิ และแหล่งที่มาของข้อมูล 3.1 แผนภูมิแท่ง (Bar chart or Bar graph) แผนภูมิแท่งประกอบด้วยแท่ง รูปสี่เหลี่ยมผืนผ้าที่วางบนแกนตามแนวตั้งหรือแนวนอน โดยกราฟแต่ละแท่งจะมีความกว้างเท่ากัน และความสูงของแท่งกราฟจะแทนขนาดของข้อมูลที่ต้องการเปรียบเทียบและแผนภูมิแท่งแบ่งเป็น 3 ชนิด คือ แผนภูมิแท่งเชิงเดี่ยว (simple bar chart) เป็นการเปรียบเทียบข้อมูลเพียงลักษณะเดียว แผนภูมิ แท่งเชิงซ้อน (multiple bar charts) เป็นการเปรียบเทียบข้อมูลตั้งแต่ 2 ลักษณะขึ้นไป แผนภูมิแท่งหลาย ส่วนประกอบ (component bar charts) เป็นแผนภูมิแท่งเชิงเดี่ยวหรือเชิงซ้อน ที่แสดงรายละเอียดของข้อมูลมากกว่าเดิม และแผนภูมิแท่งซ้อนกัน (overlapping bar chart) เป็นแผนภูมิที่จัดเรียงแท่งซ้อนกันเพื่อความสะดวกในการเปรียบเทียบและประหยัดพื้นที่ ตัวอย่างเช่น จากตาราง 1.1 สร้างแผนภูมิแท่งได้ดังภาพที่ 1.1 ภาพที่1.1 จ านวนประชากร จ าแนกตามสถานภาพแรงงาน พ.ศ. 2544 3.2 แผนภูมิวงกลม (Pie diagram or Circle graph)แผนภูมิวงกลมหรือแผนภูมิกง ประกอบด้วยวงกลมที่แบ่งออกเป็นส่วนๆ ซึ่งแสดงการเปรียบเทียบอัตราเป็นเปอร์เซ็นต์หรือร้อยละ โดยให้หนึ่งเปอร์เซ็นต์เท่ากับ 3.6 องศา ตัวอย่างเช่น จากตาราง 1.1 สร้างแผนภูมิวงกลม ได้ดัง ภาพที่


 สถานภาพแรงงาน จ านวน ร้อยละ องศา 1. ก าลังแรงงานปัจจุบัน 32,027.1 51.05 183.77 2. ก าลังแรงงานที่รอฤดูกาล 1,184.8 1.89 6.80 3. ผู้ไม่อยู่ในก าลังแรงงาน ที่มีอายุ 15 ปีขึ้นไป 13,614.4 21.70 78.12 4. ผู้ที่มีอายุต่ ากว่า 15 ปี 15,914.8 25.37 91.32 ภาพที่1.2จ านวนประชากร จ าแนกตามสถานภาพแรงงาน พ.ศ. 2544 1.2 การน าเสนอข้อมูลในรูปกราฟเส้น (Trend chart or Line graph) การน าเสนอข้อมูลในรูปกราฟเส้นเป็นการน าเสนอเพื่อให้เห็นแนวโน้ม ความสัมพันธ์ของข้อมูลและลักษณะเด่นของข้อมูลได้อย่างชัดเจนโดยส่วนมากมักจะใช้กับข้อมูลที่ เป็นช่วงของเวลา กราฟแบ่งออกเป็น 3 ชนิดคือ กราฟเส้นเชิงเดี่ยว (simple line graph) กราฟเส้น เชิงซ้อน (multiple line graphs) และกราฟเส้นหลายส่วนประกอบ (composite line graph)


ภาพ 1.3 จ านวนประชากร จ าแนกตามสถานภาพแรงงาน พ.ศ. 2544



Saturday, May 23, 2020

บทที่ 2 สถิติขั้นพื้นฐาน

บทที่ 2 สถิติขั้นพื้นฐาน

การบรรยายหรือการอธิบายลักษณะต่างๆ ของข้อมูลเป็นขั้นตอนขั้นต้น  ที่จะทำให้เกิด ความเข้าใจเกี่ยวกับข้อมูลที่สำคัญ เช่น จำนวนข้อมูล ความถี่ ตำแหน่งข้อมูล สัดส่วน ร้อยละ ค่าวัดแนวโน้มเข้าสู่ส่วนกลาง (ค่าเฉลี่ย มัธยฐาน ฐานนิยม)การกระจายของข้อมูล (ส่วนเบี่ยงเบน มาตรฐาน ความคลาดเคลื่อนมาตรฐาน ) การแจกแจง ความถี่ของข้อมูล การสำรวจลักษณะ ของข้อมูล การสร้างตารางจร เป็นต้น การวิเคราะห์ข้อมูลแจกแจงความถี่ การบรรยายข้อมูลขั้นพื้นฐานสำหรับข้อมูลเชิงคุณภาพหรือข้อมูลมาตรานามบัญญัติและ มาตราเรียงอันดับที่นิยมใช้กันมาก คือ การนับจำนวนข้อมูลและร้อยละของข้อมูลในแต่ละกลุ่มหรือ ระดับ เป็นต้น และแบ่งการแจกแจงความถี่ของข้อมูลได้ 2 แบบ คือ 1. การแจกแจงความถี่ทางเดียว การแจกแจงของข้อมูลตามลักษณะที่สนใจเพียงปัจจัยเดียวเท่านั้น เช่น การแจกแจง ข้อมูลจำแนกตามเพศ การแจกแจงข้อมูลจำแนกตามสถานภาพ เป็นต้น เช่น

ตารางที่ 2.1 จ านวนและร้อยละของผู้ตอบแบบประเมินจ าแนกตามเพศ
เพศ จ านวน ร้อยละ ชาย 142 39.4 หญิง 218 60.6 รวม 360 100.0


2. การแจกแจงความถี่หลายทาง การแจกแจงของข้อมูลตามลักษณะที่สนใจมากกว่าหนึ่งปัจจัย เช่น การแจกแจงข้อมูล จำแนกตามเพศและระดับการศึกษา การแจกแจงข้อมูลจำแนกตามระดับการศึกษาและระดับรายได้ เป็นต้น เช่น ตารางที่ 2.2 จำนวนและร้อยละของผู้ตอบแบบประเมินจำแนกตามเพศ และระดับความเห็นต่อ การวางแผนฝึกอบรมแก่สมาชิกผู้ใช้น้ า เพศ การวางแผนฝึกอบรมแก่สมาชิกผู้ใช้น้ า รวม ไม่เห็นด้วย อย่างยิ่ง ไม่เห็นด้วย เห็นด้วย เห็นด้วย อย่างยิ่ง ชาย 2 29 40 7 78 100.0% 48.3% 74.1% 70.0% 61.9% หญิง 0 31 14 3 48 0.0% 51.7% 25.9% 30.0% 38.1% รวม 2 60 54 10 126 100.0% 100.0% 100.0% 100.0% 100.0%

การวิเคราะห์การแจกแจงความถี่ทางเดียว เรียกข้อมูลจากแฟ้มข้อมูล รปม.xls และน าข้อมูลเข้าโดยเริ่มจาก Data  Import data  from Excel, Access …. มีขั้นตอนดังภาพ ตั้งชื่อแฟ้มข้อมูลส าหรับน าข้อมูลเข้าดังภาพ กดปุ่ม จะได้แหล่งของแฟ้มข้อมูลดังภาพ


ขั้นที่ 3 เลือกการค านวณร้อยละจาก Compute Percentages ในแนว - แนวแถว (Row percentages) - แนวสดมถ์ (Column percentages) - รวม (Percentages of total) - ไม่ค านวณร้อยละ (No percentages) ขั้นที่ 4กดปุ่ม จะได้ผลลัพธ์ดังนี้ > .Table <-xtabs data="รปม)" income="" sex=""> .Table income sex 10,001 -15,000 บาท 15,001 บาท ขึ้นไป 5,001 -10,000 บาท ไม่เกิน 5,000 บาท ชาย 72 26 81 33 หญิง 38 18 59 25 > rowPercents(.Table) # Row Percentages income sex 10,001 -15,000 บาท 15,001 บาท ขึ้นไป 5,001 -10,000 บาท ไม่เกิน 5,000 บาท Total Count ชาย 34.0 12.3 38.2 15.6 100.1 212 หญิง 27.1 12.9 42.1 17.9 100.0 140 จากผลลัพธ์สรุปเป็นตารางได้ดังน


ตารางที่ 2.4จ านวนและร้อยละของผู้ตอบแบบประเมินจ าแนกตามเพศและระดับรายได้ การวิเคราะห์แนวโน้มเข้าสู่ส่วนกลาง การน าเสนอข้อมูลหรือการสรุปเกี่ยวกับสิ่งที่สนใจ เช่น ระดับความพึงพอใจหรือระดับ ความเห็น เพื่อประกอบการตัดสินใจจ าเป็นต้องทราบภาพรวมของ ระดับความพึงพอใจหรือระดับ ความคิดเห็นว่าเป็นอย่างไรบ้าง และเรียกภาพรวม นี้ว่าค่ากลาง ฉะนั้นการวัดแนวโน้มเข้าสู่ส่วนกลาง คือ การหาค่ากลางเพื่อเป็นค่าแทนข้อมูลทั้งหมด เช่น ค่าเฉลี่ย ค่ามัธยฐาน ค่าฐานนิยม เป็นต้น โดยมี สถิติที่ส าคัญ คือ ค่าเฉลี่ย ค่าเฉลี่ยเลขคณิตหรือมัชฌิมเลขคณิต คือ ผลรวมของค่าสังเกตหารด้วยจ านวนค่าสังเกต ทั้งหมด การหาค่าเฉลี่ยแบ่งออกเป็นสองกรณี คือ 1. การหาค่าเฉลี่ยของข้อมูลที่ไม่แจกแจงความถี่ การหาค่าเฉลี่ยของประชากร (Population mean) N X N i 1  i  μ  เมื่อ N คือ จ านวนประชากร Xi คือ ค่าสังเกตค่าที่ i


2. การหาค่าเฉลี่ยของตัวอย่าง (Sample mean) n X X n i 1  i   เมื่อ n คือ จ านวนตัวอย่าง Xi คือ ค่าสังเกตค่าที่ i ขั้นตอนการวิเคราะห์หาค่าเฉลี่ย ขั้นที่ 1 เลือกรายการและค าสั่งโดยเริ่มจาก Statistics  Summaries Numerical summaries … มี ขั้นตอนดังภาพ ขั้นที่ 2 เลือกตัวแปรที่ต้องการหาค่าเฉลี่ย (ต้องเป็นตัวแปรเชิงปริมาณเท่านั้น เช่น ระดับความเห็น เป็น ต้น


ขั้นที่ 3กดปุ่ม จะได้ผลลัพธ์ดังนี้ > numSummary(รปม[,c("A1", "A2", "A3", "A4")], statistics=c("mean"), quantiles=c(0,.25,.5,.75,1)) mean n A1 4.215909 352 A2 4.338068 352 A3 4.309659 352 A4 4.534091 352 ตารางที่ 2.6 ค่าเฉลี่ยของระดับความพึงพอใจด้านกระบวนการและขั้นตอนการให้บริการ (n=352) ด้านกระบวนการ/ขั้นตอน ค่าเฉลี่ย ระดับความพึงพอใจ 1. มีระยะเวลาการให้บริการที่เหมาะสม 4.22 มาก 2. การให้บริการเป็นระบบและขั้นตอนที่ชัดเจน 4.33 มาก 3. มีการพัฒนางานบริการทั้งด้านปริมาณและคุณภาพ 4.31 มาก 4. มีการให้บริการเป็นไปตามล าดับ ก่อน-หลัง อย่างยุติธรรม 4.53 มากที่สุด จากขั้นตอนที่ 2ถ้าเลือก Summarize by groups … ท าให้ได้ภาพ