เรียนรู้เรื่อง Linear Regression with Multiple Variables

Linear regression with multiple variables
การวิเคราะห์การถดถอยพหุคูณ

YouTube Preview Image

Multiple Linear Regression Analysis
การวิเคราะห์การถดถอยเชิงพหุคูณ

ในหัวข้อนี้ จะศึกษาความสัมพันธ์ระหว่าง ตัวแปรตาม (Response ,Dependent variable, Y ) หนึ่งตัวกับตัวแปรอิสระ (Predictor, Independent variable,X ) มากกว่าหนึ่งตัว แต่ความสัมพันธ์ดังกล่าวยังคงเป็นแบบเส้นตรงอยู่ในชีวิตจริงแล้ว จะมีน้อยมากที่ปัจจัยหนึ่งจะขึ้นอยู่กับปัจจัยหนึ่งเพียงอย่างเดียว ส่วนมากแล้วตัวแปรตามมักจะขึ้นอยู่กับตัวแปรอิสระหลายตัว พูดง่ายๆภาษานักสถิติคือ Y มักจะขึ้นอยู่ X หลายตัว

ตัวอย่างที่ 1

ในการจะศึกษาประสิทธิภาพการใช้น้ำมันของรถยนต์ เราไม่สามารถจะเอาขนาดของเครื่องยนต์มาเป็น ตัวกำหนดเพียงอย่างเดียว จะต้องคำนึงถึงน้ำหนักตัวรถ น้ำหนักคนขับ อายุของเครื่องยนต์ ความเสียดทานต่อผิวถนนของล้อรถ พูดง่ายๆคือหากต้องการพยากรณ์อัตราความสิ้น เปลืองของน้ำมันเชื้อเพลิง หรืออัตราการใช้น้ำมัน (กิโลเมตร/ลิตร) แล้วจะต้องคำนึงถึงตัวแปรอิสระมากกว่าหนึ่งตัวแปร

วิธีการคัดเลือกตัวแปรอิสระเพื่อให้ได้สมการถดถอยที่เหมาะสม

1.) Enter Method

เป็นวิธีการเอาตัวแปรอิสระทุกตัวทั้งตัวแปรอิสระที่มีความสัมพันธ์ กับตัวแปรตามอย่างมีนัยสำคัญทางสถิติและไม่มีนัยสำคัญทางสถิติเข้าไปวิเคราะห์ในสมการถดถอย

2.) Stepwise Method

เป็นวิธีการคัดเลือกตัวแปรอิสระเข้าสู่สมการโดยจะนำตัวแปร อิสระที่มีความสัมพันธ์กับตัวแปรตามมากที่สุดเข้าเป็นสมการแรกและทดสอบความมีนัยสำคัญทางสถิติ ถ้าพบว่าไม่มีนัยสำคัญทางสถิติก็จะถือว่าสิ้นสุดการคัดเลือก

3.) Backward Method

P เป็น วิธีการคัดเลือกตัวแปรอิสระออกจากสมการทีละตัวแปร โดยเริ่ม จากการสร้างสมการถดถอยที่รวมเอาตัวแปรอิสระทุกตัวเข้าสสู่ มการแรกก่อนแล้วจึงคัดเลือกตัว แปรอิสระออกทีละตัว โดยพิจารณาตัวแปรอิสระที่มีความสัมพันธ์กับตัวแปรตามน้อยที่สุดถูกคัดออก

4.) Forward Method

เป็นวิธีการคัดเลือกตัวแปรอิสระเข้าสู่สมการทีละตัว ตามลำดับ ความสัมพันธ์กับตัวแปรตาม โดยตัวแปรอิสระที่มีความสัมพันธ์กับตัวแปรตามมากที่สุดจะถูกคัดเลือกเข้าก่อน จากนั้นจะทำการคัดเลือกตัวแปรอิสระที่มีความสัมพันธ์กับตัวแปรตาม อันดับถัดมาเข้าสมการ

5.) Remove Method

เป็นวิธีที่กำหนดให้นำตัวแปรอิสระที่ถูกคัดออกจากการ วิเคราะห์ของสมการพยากรณ์ หลังจากวิเคราะห์โดยวิธี Enter แล้ว

รูปแบบของสมการถดถอย

Regression Equation

ตัวอย่างการเขียนผลการวิเคราะห์

ตาราง ผลการวิเคราะห์การถดถอยพหุคูณแบบ Stepwise ในการพยากรณ์ดัชนีมวลกายของกลุ่มเสี่ยงเบาหวาน

 

ตัวอย่างการเขียนผลการวิเคราะห์

การศึกษาปัจจัยที่สามารถร่วมกันทำนายดัชนีมวลกายของกลุ่มเสี่ยงเบาหวาน พบว่ามีตัวแปรรอบเอวเพศ(หญิง) และ อายุที่ร่วมกันทำนายดัชนีมวลกายของกลุ่มเสี่ยงเบาหวานได้อย่างมีนัยสำคัญทางสถิติ (p value < 0.001) ซึ่งตัวแปรทั้งสองสามารถอธิบายการผันแปรดัชนีมวลกาย ได้ร้อยละ 40.0 (R2 = 0.400)

สามารถเขียนสมการพยากรณ์ในรูปคะแนนดิบได้ดังต่อไปนี้

(ดัชนีมวลกาย) = -10.903 + 0.360 (รอบเอว) + 3.089 (เพศหญิง) + .091(อายุ) เขียนสมการพยากรณ์ในรูปคะแนนมาตรฐานได้ดังต่อไปนี้ Z ดัชนีมวลกาย = 0.515 (Zรอบเอว) + 0.379 (Zเพศหญิง) + 0.203 (Zอายุ)

การวิเคราะห์ข้อมูลเป็นอีกขั้นตอนหนึ่งที่มีความสำคัญมาก เพราะการเลือกใช้สถิติที่เหมาะสมเป็นเรื่องยากแต่ปัจจุบันปัญหาลดน้อยลงเนื่องจากมีเอกสารตำราให้ค้นมากมาย รวมทั้ง มีโปรแกรมสำเร็จรูปให้เลือกใช้ได้หลากหลาย ซึ่งจะช่วยลดเวลาที่ต้องวิเคราะห์เองด้วยมือ รวมทั้ง ลดโอกาสที่จะคำนวณผิดอีกด้วย

 

  •  
  •  
  •  
  •  
  •  
  •  
WEERAWIT SAPMONGKOLPORN
at GlurGeek.Com

Leave a Reply