เล่มที่ 6
สถิติ
สามารถแชร์ได้ผ่าน :
การวิเคราะห์และการตีความหมายข้อมูล (Analysis and Interpretation of Data)

ข้อมูลที่ทำการเก็บรวบรวม โดยทั่วไปจะมีจำนวนมาก เมื่อได้ข้อมูลมาแล้ว ก็จะมีการดำเนินกับข้อมูลด้วยวิธีการต่างๆ เช่น การแยกประเภท การจัดชั้น การสังเขป การหาข้อสรุปเกี่ยวกับลักษณะต่างๆ ของข้อมูล การพิจารณาหาว่า ข้อมูลที่เก็บรวบรวมมาได้ มีความสัมพันธ์กับข้อมูลอื่นหรือไม่อย่างไร ตลอดจนอาจทำการพยากรณ์เหตุการณ์ในอนาคต จากข้อมูลที่เก็บรวบรวมได้ กระบวนการต่างๆ เหล่านี้เรียกว่า การวิเคราะห์ข้อมูล ซึ่งจะดำเนินการในรายละเอียดอย่างไร และเพียงไรนั้น ขึ้นอยู่กับลักษณะของข้อมูล และเรื่องที่ต้องการศึกษา ในบางกรณี การวิเคราะห์ข้อมูลก็ทำโดยใช้กราฟ ดังนั้น เมื่อพิจารณาให้ดีจะเห็นว่า บางขั้นตอนของการวิเคราะห์ข้อมูล เช่น การจัดชั้น หรือแยกประเภทของข้อมูล จะต้องเตรียมวางแผนพร้อมกันไปกับการเก็บรวบรวม และการนำเสนอข้อมูล


เมื่อข้อมูลได้รับการวิเคราะห์แล้ว ขั้นสุดท้ายของการดำเนินการทางสถิติก็คือ การตีความหมายข้อมูลเหล่านั้น การตีความหมายก็คือ การพิจารณาหาว่า อะไรคือ ข้อสรุปที่ได้จากการวิเคราะห์ ตัวเลขที่ได้จากการวิเคราะห์ช่วยสนับสนุน หรือปฏิเสธสมมุติฐานที่ตั้งไว้เกี่ยวกับเรื่องนั้นๆ และตัวเลขที่ได้จากการวิเคราะห์ บอกอะไรบางอย่างใหม่ๆ แก่เราบ้าง

การตีความหมายข้อมูลเป็นเรื่องที่ทำได้ไม่ง่ายนัก เนื่องด้วยความรู้ และเอกสารเกี่ยวกับเรื่องที่เกี่ยวข้องมักมีจำกัด ดังนั้น การตีความหมายข้อมูล จึงไม่ควรสรุปลงไปอย่างแน่นอนตายตัวว่า ต้องเป็นอย่างนั้นอย่างนี้ นอกจากนั้นเหตุผลอีกประการหนึ่ง ที่สนับสนุนการกระทำดังกล่าวนี้ ก็คือ ตัวข้อมูลเอง ได้เคยกล่าวไว้แล้วว่า ข้อมูลประกอบด้วยข้อเท็จ และข้อจริง มิใช่ข้อจริงล้วนๆ และตัวเลขที่ได้จากการวิเคราะห์ ก็เป็นเพียงค่าประมาณ ดังนั้นการตีความหมายข้อมูลโดยการสรุปอย่างแน่นอนตายตัว จึงมีโอกาสผิดพลาดได้ง่ายมาก

อย่างไรก็ตาม การตีความหมายที่ดี ขึ้นอยู่กับหลักเกณฑ์ ๔ ประการ ดังต่อไปนี้

๑. มีความตั้งใจแน่วแน่ที่จะค้นหาความจริงทุกอย่างที่ซ่อนเร้นอยู่ในข้อมูล
๒. มีความรู้ความเข้าใจอย่างกว้างขวางในเหตุการณ์หรือเรื่องที่กำลังศึกษา
๓. มีความคิดที่เป็นระเบียบและมีเหตุผลในการทำงาน
๔. มีความสามารถในการใช้ถ้อยคำที่ชัดเจน ทำให้อ่านเข้าใจได้ง่าย

กระบวนการต่างๆ ของการวิเคราะห์ข้อมูล แยกกล่าวเป็นข้อๆ ได้ดังต่อไปนี้

๑. การแยกประเภทข้อมูล (Classification)

ข้อมูลที่เก็บรวบรวมมาได้ อาจมีมากประเภท หรือน้อยประเภท แล้วแต่เรื่องที่ต้องการศึกษา ตัวอย่างข้อมูลเกี่ยวกับชาวนา เช่น จำนวนชาวนา เนื้อที่เพาะปลูก และผลิตผลของข้าว รายได้ เป็นต้น ข้อมูลแต่ละประเภทเหล่านี้อาจจำแนกเป็นชนิดย่อยออกไปอีก ทั้งนี้เพื่อจะได้ศึกษาในรายละเอียดปลีกย่อยต่างๆ ให้มากขึ้นตามความต้องการ เช่น จำนวนชาวนา อาจจำแนกตามเพศ อายุ และชั้นการศึกษา เนื้อที่เพาะปลูก และผลิตผลข้าวอาจจำแนกออกเป็นข้าวเจ้า และข้าวเหนียว รายได้ อาจจำแนกตามแหล่งที่มา เช่น เงินที่ได้จากการขายข้าว ค่าเช่าที่นา ค่าแรงงานรับจ้าง เป็นต้น


การแยกประเภทข้อมูล อาจเป็นขั้นตอนที่พอเพียงสำหรับการวิเคราะห์ข้อมูลบางอย่าง ซึ่งไม่ต้องการศึกษาข้อมูลในขั้นลึกซึ้งนัก แต่สำหรับการศึกษาบางอย่าง การแยกประเภทข้อมูลเป็นเพียงขั้นเตรียมงานเท่านั้น ซึ่งในประการหลังนี้ ลักษณะต่างๆ ของข้อมูลทั้งที่เป็นรายข้อมูล และในส่วนรวมจะต้องได้รับการพิจารณา และศึกษาอย่างละเอียดละออ

๒. การสังเขปข้อมูล (Condensation)

ข้อมูลที่เก็บรวบรวมมาได้ในขั้นแรกจะอยู่ในสภาพที่ไม่เป็นระเบียบเรียบร้อย ยังไม่สามารถทำการหาข้อสรุปของลักษณะต่างๆ ของข้อมูลได้ ข้อมูลที่อยู่ในรูปเช่นนี้มีชื่อเรียกว่า "ข้อมูลดิบ" (Raw data) ดังนั้น เพื่อให้ข้อมูลอยู่ในสภาพพร้อม ที่จะสามารถหาข้อสรุป หรือทำการวิเคราะห์โดยวิธีอื่นๆ ได้ จึงอาจดำเนินการสังเขปข้อมูลดิบ หรือจัดข้อมูลดิบทั้งสิ้น ให้อยู่ในรูปแบบใหม่ ซึ่งเป็นระเบียบเรียบร้อย และมีขนาดกะทัดรัดสะดวกต่อการดำเนินการวิเคราะห์ในขั้นต่อไป การสังเขปข้อมูลตามที่กล่าวมานี้เรียกว่า "การแจกแจงความถี่" (Frequency distribution)


ในกรณีที่ข้อมูลมีจำนวนไม่มากนัก การแจกแจงความถี่อาจแสดงเป็นรายข้อมูลที่เก็บรวบรวมมาได้ พร้อมทั้งความถี่ หรือจำนวนที่ซ้ำๆ กันของข้อมูลตัวนั้นๆ

ตัวอย่าง นักเรียน ๔๐ คน สอบไล่วิชาเลขคณิตได้คะแนน ดังต่อไปนี้


ข้อมูลข้างต้นนี้ เรียกว่า ข้อมูลดิบ เมื่อแจกแจงความถี่เป็นรายข้อมูลจะได้ดังนี้


การแจกแจงความถี่ที่ได้แสดงไว้ข้างบนนี้ ถ้าข้อมูลมีจำนวนมาก ตารางดังกล่าวจะยากมาก ทำให้ต้องเสียเนื้อที่กระดาษ และไม่สะดวก ที่จะทำการวิเคราะห์ในขั้นต่อไป นอกจากนี้ถ้าจะพิจารณาในด้านการกระจายของข้อมูลว่า ข้อมูลส่วนใหญ่มีค่าระหว่างเท่าไรถึงเท่าไร หรือรูปลักษณะการกระจายข้อมูลเป็นอย่างไร ก็จะไม่สามารถแลเห็นรูปลักษณะของการกระจายได้ชัดเจน ดังนั้น จึงอาจจะจัดทำการแจกแจงความถี่ของข้อมูลให้อยู่ในรูปใหม่ ซึ่งมีลักษณะอัดแน่นกว่าตารางข้างต้น กล่าวคือ จัดข้อมูลให้รวมอยู่เป็นกลุ่มๆ แล้วดูว่าข้อมูลค่าต่างๆ อยู่ในกลุ่มหรือชั้นใดบ้าง ให้นับจำนวนข้อมูลเหล่านั้นว่า อยู่ในชั้นใดเป็นจำนวนเท่าใด จำนวนข้อมูลในแต่ละชั้นเรียกว่า ความถี่

อย่างไรก็ตาม ถ้าจัดกลุ่มข้อมูลแต่ละกลุ่มให้มีขนาดใหญ่มาก จำนวนกลุ่ม หรือจำนวนชั้นก็จะมีน้อย และจำนวนข้อมูลในแต่ละกลุ่ม ก็จะอัดกันแน่นมากเกินไป ทำให้ไม่สามารถแลเห็นลักษณะการกระจายของข้อมูลได้ดี แต่ถ้าหากจัดแต่ละกลุ่มให้มีขนาดเล็กมาก จำนวนกลุ่ม หรือจำนวนชั้นก็จะมีมาก ซึ่งจะทำให้การกระจายของข้อมูลมีลักษณะแผ่กว้างมากเกินไป ไม่ช่วยให้แลเห็นลักษณะการกระจายที่ดี ดังนั้น การแจกแจงความถี่แบบจัดข้อมูลให้เป็นกลุ่มๆ นี้ จึงต้องให้แต่ละกลุ่มมีขนาดโตพอดี ที่จะทำให้แลเห็นลักษณะการกระจายของข้อมูลได้อย่างเด่นชัด กล่าวคือ ข้อมูลในกลุ่มจะต้องไม่อัดแน่นมากเกินไป และก็ต้องไม่แผ่กระจายมากจนเกินไปด้วย

ตารางข้างล่างนี้ เป็นตารางการแจกแจงความถี่ที่ได้จัดข้อมูลเป็นกลุ่มๆ โดยได้ใช้ข้อมูลที่ให้ไว้ข้างต้น ตารางดังกล่าวนี้ เป็นแบบอย่างของตารางทั่วไป ที่ใช้ในการวิเคราะห์ข้อมูล


ข้อมูลแต่ละชุดที่เก็บรวบรวมมาได้ อาจมีรูปลักษณะของการแจกแจงความถี่ไม่เหมือนกัน ลักษณะการแจกแจงความถี่ที่พบมากที่สุด ได้แก่ข้อมูลที่มีค่ากลางๆ มีจำนวนมาก ส่วนข้อมูลที่มีค่าสูง และที่มีค่าต่ำมีจำนวนน้อย ถ้านำข้อมูลประเภทนี้มาเขียนกราฟจะได้รูปโค้ง ดังแสดงไว้ในรูปที่ ๑ รูปที่ ๒ และรูปที่ ๓ ข้างล่างนี้



รูปที่ ๑

รูปที่ ๒

รูปที่ ๓

รูปที่ ๑ แสดงให้เห็นว่า ข้อมูลที่มีค่ามาก และข้อมูลที่มีค่าน้อย เมื่อนับจากข้อมูลที่มีค่ากลางจะมีจำนวนเท่าๆ กัน ดูจากรูปจะเห็นว่า ปลายทั้งสองข้างของโค้งมีลักษณะสมมาตร (Symmetrical) รูปการแจกแจงความถี่ของข้อมูลที่มีลักษณะเช่นนี้ เรียกว่า โค้งปกติ (Normal curve) หรือโค้งรูประฆังคว่ำ

สำหรับรูปที่ ๒ และรูปที่ ๓ นั้น เป็นการแจกแจงความถี่ของข้อมูลที่มีลักษณะที่เรียกว่า มีความเบ้ (Skewness) นั่นคือ ข้อมูลค่าน้อยมีจำนวนมากกว่าข้อมูลที่มีค่ามาก หรือที่เรียกว่า เบ้ไปทางบวก (Positively skewed) ซึ่งได้แก่รูปที่ ๒ และข้อมูลค่ามาก มีจำนวนมากกว่าข้อมูลที่มีค่าน้อย หรือที่เรียกว่า เบ้ไปทางลบ (Negatively skewed) ซึ่งได้แก่ รูปที่ ๓

การแจกแจงความถี่ของข้อมูลลักษณะอื่นที่จะยกมาให้ดู นอกจากนี้ก็มีรูปสี่เหลี่ยมผืนผ้า (รูปที่ ๔) รูปตัว U (รูปที่ ๕) รูปตัว J (รูปที่ ๖) และรูปตัว J กลับ (รูปที่ ๗) ดังแสดงไว้ข้างล่างนี้


๓. การหาข้อสรุปเกี่ยวกับลักษณะต่างๆ ของข้อมูล (Summarization)

ข้อมูลแต่ละชุดที่เก็บรวบรวมมาได้ อาจมีลักษณะการแจกแจงความถี่แตกต่างกันไปดังได้กล่าวแล้วในข้อ ๒ ในการวิเคราะห์ข้อมูล เราจำเป็นต้องศึกษาอย่างละเอียดละออว่า ข้อมูลชุดนั้นๆ บอกอะไรแก่เราบ้าง เช่น สมมุติว่า มีข้อมูลเกี่ยวกับรายได้ต่อปีของคนจำนวนหนึ่ง ซึ่งเป็นตัวอย่างของประชากรทั้งประเทศ สิ่งต่างๆ ที่อาจต้องการทราบก็คือ ประชากรมีรายได้ต่อปีเฉลี่ยคนละเท่าไร รายได้ของคนมั่งมี และคนยากจนแตกต่างกันมากหรือไม่ และถ้าคนส่วนใหญ่ค่อนข้างยากจน คนเหล่านี้มีมากเพียงไร ค่าเหล่านี้คือ ค่าซึ่งบอกลักษณะต่างๆ ของข้อมูล ซึ่งเป็นค่าสถิติอย่างหนึ่ง และสามารถคำนวณหาได้

รูปที่ ๘

อันที่จริงค่าต่างๆ เหล่านี้ พอจะทราบได้อย่างคร่าวๆ จากลักษณะการแจกแจงความถี่ของข้อมูล สมมุติว่า รูปที่ ๘ ได้จากการแจกแจงความถี่ของรายได้ต่อปีของประชากรตามที่กล่าวข้างต้น สิ่งที่ทราบได้อย่างคร่าวๆ จากรูปดังกล่าวก็คือ ประชากรที่มีรายได้ปานกลางค่อนไปทางข้างต่ำมีจำนวนมาก ส่วนประชากรที่มีรายได้ต่ำมาก หรือสูงมากมีจำนวนน้อย นอกจากนั้นช่องว่างระหว่างคนร่ำรวย และคนยากจนกว้างมาก ทั้งนี้เพราะปลายทั้งสองข้างของรูปโค้งห่างกันมาก อย่างไรก็ตามในทางสถิติ ข้อสรุปที่มิใช่ตัวเลขมีความหมายน้อย และไม่สามารถจะนำไปใช้ประโยชน์ในขั้นต่อไปได้ ดังนั้น ข้อสรุปทั้งหลายาของข้อมูลจึงต้องแสดงออกเป็นตัวเลข
เนื่องจากการแจกแจงความถี่ของข้อมูลที่พบส่วนมาก มีลักษณะเป็นโค้งรูประฆัง กล่าวคือ ตรงกลางป่อง และโค้งจะลาดลงทั้งสองข้าง ดังนั้นการหาค่าที่บอกลักษณะสำคัญของข้อมูลที่มีการกระจายลักษณะนี้ ได้แก่ การหาค่ากลาง และการหาค่าการกระจายของข้อมูล ซึ่งจะได้กล่าวเป็นเรื่องๆ ต่อไป

๓.๑ การหาค่ากลางของข้อมูล

ค่ากลางของข้อมูลซึ่งมีที่ใช้มากได้แก่ มัชฌิมเลขคณิต (Arithmetic Mean) มัธยฐาน (Median) และฐานนิยม (Mode)

ก) มัชฌิมเลขคณิตของข้อมูลชุดใดๆ คือ ค่าเฉลี่ยของข้อมูลชุดนั้น ซึ่งอาจเขียนให้อยู่ในรูปสูตรได้ดังนี้
มัชฌิมเลขคณิต = ผลบวกของทุกค่าของข้อมูล/จำนวนข้อมูล

ข) มัธยฐานของข้อมูลชุดใดๆ คือ คะแนนหรือค่า ณ ตำแหน่งกึ่งกลางของข้อมูลชุดนั้น ซึ่งข้อมูลทั้งชุดได้รับการเรียงลำดับแล้ว

ค) ฐานนิยมของข้อมูลชุดใดๆ คือ คะแนนหรือค่าที่มีความถี่สูงสุด หรือซ้ำกันมากที่สุดของข้อมูลชุดนั้น
ตัวอย่าง จงหามัชฌิมเลขคณิต มัธยฐาน และฐานนิยมของข้อมูลต่อไปนี้ ๗ ๗ ๘ ๙ ๑๓ ๑๓ ๑๓
มัชฌิมเลขคณิต = ผลบวกของทุกค่าของข้อมูล/จำนวนข้อมูล
= (๗ + ๗ + ๘ + ๙ + ๑๓ + ๑๓ + ๑๓)/๗
= ๑๐
มัธยฐาน = ๙
ฐานนิยม = ๑๓
๓.๒ การหาค่าการกระจายข้อมูล

การกระจายของข้อมูล หมายถึง การที่ข้อมูลชุดหนึ่งชุดใด มีลักษณะแผ่กว้างออกไปตามแนวนอนของแกนพิกัดฉากของกราฟ

สมมุติว่า มีคะแนนซึ่งได้จากการสอบคิดเลขในใจของเด็ก ๒๐ คน ซึ่งแบ่งเป็น ๒ กลุ่ม กลุ่มละ ๑๐ คน ดังนี้
กลุ่มที่ ๑ ได้คะแนน ๔ ๘ ๕ ๖ ๗ ๑๐ ๒ ๗ ๖ ๘
กลุ่มที่ ๒ ได้คะแนน ๖ ๗ ๖ ๕ ๔ ๖ ๗ ๖ ๘ ๕
ถ้านำข้อมูลทั้งสองชุดนี้มาลงจุด จะเห็นว่า คะแนนของนักเรียนกลุ่มที่ ๑ มีลักษณะแผ่กว้างออกไป หรือมีการกระจายมากกว่าคะแนนของนักเรียนกลุ่มที่ ๒ ดังแสดงด้วยรูปที่ ๙ และรูปที่ ๑๐

รูปที่ ๙

รูปที่ ๑๐

วิธีที่ง่ายที่สุดที่จะเปรียบเทียบระหว่างข้อมูล ๒ ชุดว่า ข้อมูลชุดใดมีการกระจายมากกว่ากัน ได้แก่ การตรวจดูค่าแตกต่างระหว่างคะแนนค่าสูงสุด และคะแนนค่าต่ำสุดของข้อมูลแต่ละชุด ค่าแตกต่างดังกล่าวนี้มีชื่อเรียกว่า "พิสัย" (Range) ข้อมูลชุดใดมีค่าพิสัยสูงกว่า แสดงว่า ข้อมูลนั้นน่าจะมีการกระจายมากกว่า
จากตัวอย่างข้อมูลที่ยกมาข้างต้นนี้จะเห็นว่า
ข้อมูลกลุ่มที่ ๑ พิสัย = ๑๐ - ๒ = ๘
ข้อมูลกลุ่มที่ ๒ พิสัย = ๘ - ๔ = ๔

เนื่องจากพิสัยเป็นสถิติที่ใช้วัดการกระจายได้อย่างคร่าวๆ เท่านั้น ดังนั้นจึงมักไม่เป็นที่นิยมใช้กัน

สถิติวัดการกระจายที่สำคัญ และใช้กันทั่วไป คือ ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) ซึ่งหาได้จากการเอาผลต่างระหว่างข้อมูลแต่ละค่า และมัชฌิมเลขคณิตของข้อมูลนั้นมายกกำลังสอง แล้วทำการถัวเฉลี่ยค่ากำลังสองเหล่านั้น จากนั้นจึงถอดกรณฑ์ที่สองของค่าเฉลี่ยที่ได้

จากข้อมูลกลุ่มที่ ๒ หาค่าส่วนเบี่ยงเบนมาตรฐานได้ดังนี้




ค่าที่ได้จากการวัดการกระจายของข้อมูล เป็นสถิติสำคัญที่นำไปใช้ประโยชน์อย่างกว้างขวาง ค่าปานกลางเพียงอย่างเดียว ไม่สามารถใช้บรรยายลักษณะสำคัญของข้อมูลทั้งกลุ่มได้เพียงพอ เช่นคนกลุ่มหนึ่งมีรายได้เฉลี่ยค่อนข้างสูง แต่มิได้หมายความว่า ทุกคนในกลุ่มนั้น จะต้องมีรายได้สูงไปด้วย อาจจะมีบางคน ซึ่งมีรายได้สูงมากและต่ำมากรวมอยู่ด้วย หรือทั้งกลุ่มอาจจะมีรายได้ไล่เลี่ยกัน ไม่แตกต่างกันมากนักก็เป็นได้ ลักษณะเช่นที่ว่านี้จะต้องดูจากการกระจายของ ข้อมูลซึ่งบางกลุ่มก็มีการกระจายมาก บางกลุ่มก็มีน้อย

นอกจากนี้ประโยชน์ที่ได้จากการกระจายของข้อมูล ก็คือการนำไปใช้ใน การควบคุมคุณภาพของผลิตภัณฑ์บางอย่าง โดยพิจารณากำหนดว่า สิ่งของที่ ผลิตได้ อาจจะเบี่ยงเบนไปจากคุณภาพมาตรฐานได้บ้าง แต่ต้องไม่เกินเท่าไร และทำนองเดียวกัน ในด้านของการพยากรณ์ก็จะสามารถใช้ค่าการกระจายเป็น ตัวกำหนดได้ว่า การพยากรณ์นั้นๆ จะเชื่อถือได้มากน้อยเพียงไร และถ้าจะ พยากรณ์คลาดเคลื่อนจากความจริงไปบ้างจะไม่มากหรือน้อยกว่าเท่าไร เป็นต้น

๔. แนวโน้มของข้อมูล (Trend)

ข้อมูลบางชนิดแสดงถึงเหตุการณ์ที่เกิดขึ้นเป็นรายคาบเวลา เช่น ปริมาณสินค้าส่งออกเป็นรายปี จำนวนอุบัติเหตุรถยนต์บนท้องถนนเป็นรายสัปดาห์ ปริมาณน้ำฝนที่ตกเป็นรายเดือน เป็นต้น ข้อมูลประเภทนี้เรียกว่า ข้อมูลอนุกรมเวลา (Time-series data)

ถ้านำข้อมูลประเภทนี้ที่เกิดขึ้นในช่วงเวลาหนึ่งซึ่งยาวนานพอสมควรมาลงจุดจะได้เส้นกราฟ ซึ่งมีลักษณะโดยส่วนรวมอาจชันขึ้น หรือลาดลง หรือมีทั้งชันขึ้นหรือลาดลงในช่วงเวลาหนึ่งเช่นในรอบ ๑ ปี เป็นต้น ลักษณะโดยส่วนรวมที่ชันขึ้น หรือลาดลงของเส้นกราฟในช่วงเวลายาวนานนี้ เรียกว่า แนวโน้มของข้อมูล

วิธีการหาแนวโน้มของข้อมูลอาจแบ่งได้เป็น ๒ วิธีใหญ่ๆ คือ

๑) วิธีการกะประมาณ ซึ่งโดยมากใช้การลากเส้นอย่างอิสระ (Freehandmethod)

๒) วิธีการคำนวณ ที่นิยมใช้ก็มีการถัวเฉลี่ยเคลื่อนที่ (Moving averagemethod) และวิธีกำลังสองน้อยที่สุด (Least squares method) ซึ่งวิธีหลังนี้จะได้แนวโน้มอยู่ในรูปของสมการ

๔.๑ การลากเส้นอย่างอิสระ

การสร้างแนวโน้มด้วยวิธีนี้ คือ การลากเส้น ซึ่งเป็นแนวเรียบผ่านไปในระหว่างเส้นกราฟของข้อมูล ซึ่งปกติจะมีบางตอนหักเหขึ้น และบางตอนหักเหลง เส้นซึ่งเป็นแนวเรียบนี้แสดงถึงความเป็นไปโดยส่วนรวมในระยะยาวของเหตุการณ์ทั้งหมดที่เกิดขึ้น ซึ่งเราเรียกว่า แนวโน้มของข้อมูล การลากเส้นอย่างอิสระนี้ไม่มีกฎเกณฑ์ใดๆ ทั้งสิ้น นอกจากคอยระมัดระวังให้แนวโน้ม แสดงถึงเหตุการณ์ที่เกิดขึ้นในระยะยาวได้ถูกต้องเท่านั้น ดังแสดงด้วยรูปข้างล่างนี้