تحليل الانحدار المتعدد باستخدام ستاتا مقدمة يستخدم الانحدار المتعدد (امتداد الانحدار الخطي البسيط) للتنبؤ بقيمة المتغير التابع (المعروف أيضا باسم متغير النتيجة) استنادا إلى قيمة متغيرين مستقلين أو أكثر (يعرف أيضا باسم متغيرات التنبؤ ). على سبيل المثال، يمكنك استخدام الانحدار المتعدد لتحديد ما إذا كان يمكن توقع القلق الامتحان على أساس علامة الدراسية، وقت المراجعة، حضور المحاضرة والنتيجة إق (أي المتغير التابع سيكون القلق الامتحان، والمتغيرات المستقلة الأربعة ستكون علامة الدراسية، ومراجعة الوقت، محاضرة الحضور والنتيجة إق). بدلا من ذلك، يمكنك استخدام الانحدار المتعدد لتحديد ما إذا كان يمكن توقع الدخل على أساس العمر والجنس والمستوى التعليمي (أي أن المتغير التابع سيكون الدخل، والمتغيرات المستقلة الثلاثة هي العمر والجنس والمستوى التعليمي). إذا كان لديك متغير تابع ثنائي التفرع يمكنك استخدام الانحدار اللوجستي ثنائي الحدين. الانحدار المتعدد يسمح لك أيضا لتحديد تناسب العام (التباين أوضح) من النموذج والمساهمة النسبية لكل من المتغيرات المستقلة إلى التباين الكلي وأوضح. على سبيل المثال، قد تريد أن تعرف كم من التباين في القلق الامتحان يمكن تفسيرها من خلال علامة الدراسية، وقت المراجعة، حضور المحاضرات والنتيجة إق ككل، ولكن أيضا المساهمة النسبية لكل متغير مستقل في شرح التباين. هذا دليل البدء السريع يظهر لك كيفية تنفيذ الانحدار المتعدد باستخدام ستاتا، وكذلك كيفية تفسير والإبلاغ عن نتائج من هذا الاختبار. ومع ذلك، قبل أن نقدم لكم هذا الإجراء، تحتاج إلى فهم الافتراضات المختلفة التي يجب أن تلبي البيانات الخاصة بك من أجل الانحدار المتعدد لتعطيك نتيجة صالحة. نناقش هذه الافتراضات بعد ذلك. الافتراضات هناك ثمانية افتراضات تدعم الانحدار المتعدد. إذا لم يتم استيفاء أي من هذه الافتراضات الثمانية، لا يمكنك تحليل البيانات باستخدام الانحدار المتعدد لأنك لن تحصل على نتيجة صالحة. وبما أن الافتراضين 1 و 2 يتعلقان باختيار المتغيرات، فلا يمكن اختبارهما لاستخدام ستاتا. ومع ذلك، يجب عليك أن تقرر ما إذا كانت دراستك تلبي هذه الافتراضات قبل الانتقال. الافتراض 1: يجب قياس المتغير التابع الخاص بك على المستوى المستمر. ومن أمثلة هذه المتغيرات المستمرة الارتفاع (مقيس بالأقدام والبوصة)، ودرجة الحرارة (المقاسة في 176C)، والراتب (مقيس بالدولار الأمريكي)، ووقت المراجعة (مقيس بالساعات)، والذكاء (المقيس باستخدام درجة الذكاء)، ووقت التفاعل في الملي ثانية)، وأداء الاختبار (المقاسة من 0 إلى 100)، والمبيعات (مقاسة بعدد المعاملات في الشهر)، وهكذا دواليك. إذا لم تكن متأكدا مما إذا كان متغيرك التابع متواصلا (بمعنى أنه يتم قياسه على مستوى الفاصل الزمني أو مستوى النسبة)، فاطلع على أنواع دليل المتغيرات. الافتراض 2: لديك اثنين أو أكثر من المتغيرات المستقلة. والتي ينبغي قياسها على المستوى المستمر أو الفئوية. للحصول على أمثلة للمتغيرات المستمرة. انظر الرصاصة أعلاه. وتشمل الأمثلة على المتغيرات الفئوية نوع الجنس (على سبيل المثال مجموعتين: ذكور وإناث)، والعرق (على سبيل المثال 3 مجموعات: القوقاز، والأمريكيون من أصل أفريقي، والإسبانيون)، ومستوى النشاط البدني (على سبيل المثال 4 مجموعات: المستقرة والمنخفضة والمعتدلة والعالية) 5 مجموعات: جراح، طبيب، ممرضة، طبيب أسنان، المعالج)، وهكذا دواليك. في هذا الدليل، نعرض لك إجراء الانحدار المتعدد لأن لدينا مزيج من المتغيرات المستقلة المستمرة والفئوية. ملاحظة: إذا كان لديك متغيرات مستقلة فقط (أي متغيرات مستقلة مستقلة)، فمن الأكثر شيوعا أن نقترب من التحليل من منظور أنوفا في اتجاهين (لمتغيرين مستقلين كاتيغوريكال) أو أنوفا فاكتوريال (لمدة ثلاثة أو أكثر تصنيفية المتغيرات المستقلة) بدلا من الانحدار المتعدد. لحسن الحظ، يمكنك التحقق من الافتراضات 3، 4، 5، 6، 7 و 8 باستخدام ستاتا. عند الانتقال إلى الافتراضات 3 و 4 و 5 و 6 و 7 و 8، نقترح اختبارها بهذا الترتيب لأنها تمثل أمرا حيث أنه إذا لم يكن هناك انتهاك للافتراض، فلن تتمكن بعد ذلك من استخدام عدة انحسار. في الواقع، لا تفاجأ إذا فشلت البيانات الخاصة بك واحد أو أكثر من هذه الافتراضات لأن هذا هو نموذجي إلى حد ما عند العمل مع البيانات في العالم الحقيقي بدلا من الأمثلة كتاب، والتي غالبا ما تظهر فقط لك كيفية تنفيذ الانحدار الخطي عندما يسير كل شيء على ما يرام. ومع ذلك، لا داعي للقلق لأنه حتى عندما تفشل البيانات الخاصة بك بعض الافتراضات، غالبا ما يكون هناك حل للتغلب على هذا (على سبيل المثال تحويل البيانات الخاصة بك أو باستخدام اختبار إحصائي آخر بدلا من ذلك). تذكر فقط أنه إذا لم تتحقق من أن البيانات تستوفي هذه الافتراضات أو تختبرها بشكل صحيح، فقد لا تكون النتائج التي تحصل عليها عند تشغيل الانحدار المتعدد صالحة. الافتراض 3: يجب أن يكون لديك استقلالية الملاحظات (أي استقلالية البقايا)، والتي يمكنك التحقق في ستاتا باستخدام إحصائية دوربين-واتسون. الافتراض 4: يجب أن تكون هناك علاقة خطية بين (أ) المتغير التابع وكل من المتغيرات المستقلة، و (ب) المتغير التابع والمتغيرات المستقلة بشكل جماعي. يمكنك التحقق من الخطية في ستاتا باستخدام سكاتيربلوتس والمؤامرات الانحدار الجزئي. افتراض 5: البيانات الخاصة بك تحتاج إلى إظهار هوموسداستيسيتي. والتي هي حيث تظل الفروق على طول خط من أفضل تناسب مماثلة كما يمكنك التحرك على طول الخط. يمكنك التحقق من هوموسداستيسيتي في ستاتا عن طريق التآمر بقايا التلميذ ضد القيم المتوقعة غير موحد. الافتراض 6: يجب أن لا تظهر البيانات الخاصة بك مولتيكوليناريتي. الذي يحدث عندما يكون لديك اثنين أو أكثر من المتغيرات المستقلة التي ترتبط ارتباطا وثيقا مع بعضها البعض. يمكنك التحقق من هذا الافتراض في ستاتا من خلال فحص معاملات الارتباط وقيم توليرانسيف. الافتراض 7: يجب ألا تكون هناك قيم متطرفة كبيرة. نقاط نفوذ عالية أو نقاط مؤثرة للغاية. والتي تمثل ملاحظات في مجموعة البيانات الخاصة بك التي هي في بعض الطريق غير عادية. ويمكن أن يكون لذلك تأثير سلبي جدا على معادلة الانحدار المستخدمة للتنبؤ بقيمة المتغير التابع استنادا إلى المتغيرات المستقلة. يمكنك التحقق من وجود القيم المتطرفة ونقاط الرافعة المالية والنقاط المؤثرة باستخدام ستاتا. الافتراض 8: يجب أن تكون البقايا (الأخطاء) موزعة بشكل طبيعي تقريبا. والتي يمكنك التحقق في ستاتا باستخدام الرسم البياني (مع منحنى العادي فرضه) و P - P مؤامرة العادي، أو العادي Q-Q مؤامرة من بقايا الطالب. من الناحية العملية، فإن التحقق من الافتراضات 3 و 4 و 5 و 6 و 7 و 8 ربما يستغرق معظم وقتك عند تنفيذ الانحدار المتعدد. ومع ذلك، فإنه ليس مهمة صعبة، و ستاتا يوفر كل الأدوات التي تحتاج إلى القيام بذلك. في القسم، إجراء الاختبار في ستاتا. فإننا نوضح إجراء ستاتا المطلوب لتنفيذ الانحدار المتعدد بافتراض عدم وجود افتراضات قد انتهكت. أولا، وضعنا المثال الذي نستخدمه لشرح إجراءات الانحدار المتعددة في ستاتا. باحث الصحة يريد أن يكون قادرا على التنبؤ فو 2 ماكس، وهو مؤشر على اللياقة البدنية والصحة. عادة، لتنفيذ هذا الإجراء يتطلب معدات مخبرية باهظة الثمن، وكذلك تتطلب من الأفراد لممارسة إلى أقصى حد لها (أي حتى لم يعد بإمكانهم مواصلة ممارسة بسبب الإرهاق الجسدي). وهذا يمكن أن يؤجل الأفراد الذين ليسوا نشطين جدا وأولئك الذين قد يكونون في خطر أكبر من سوء الصحة (على سبيل المثال كبار السن غير صالحة المواضيع). لهذه الأسباب، كان من المرغوب فيه لإيجاد وسيلة للتنبؤ الأفراد فو 2 كحد أقصى على أساس الصفات التي يمكن قياسها بسهولة أكبر وبتكلفة زهيدة. وتحقيقا لهذه الغاية، قام الباحث بتجنيد 100 مشارك لإجراء أقصى اختبار فو 2 ماكس، ولكن سجلت أيضا سنهم ووزنهم ومعدل ضربات القلب ونوع الجنس. معدل ضربات القلب هو متوسط آخر 5 دقائق من 20 دقيقة، أسهل بكثير، وانخفاض عبء العمل اختبار الدراجات. هدف الباحثين هو أن تكون قادرة على التنبؤ فو 2 ماكس على أساس هذه الصفات الأربع: العمر والوزن ومعدل ضربات القلب والجنس. ملاحظة: المثال والبيانات المستخدمة لهذا الدليل وهمية. لقد أنشأناها للتو لأغراض هذا الدليل. الإعداد في ستاتا في ستاتا، أنشأنا خمسة متغيرات: (1) فو 2 كحد أقصى. وهي القدرة الهوائية القصوى (أي المتغير التابع) و (2) العمر. وهو عمر المشاركين (3) الوزن. وهو وزن المشاركين (من الناحية الفنية، فمن كتلتها) (4) القلب. الذي هو معدل ضربات القلب المشاركين و (5) الجنس. وهو نوع الجنس (أي المتغيرات المستقلة). بعد إنشاء هذه المتغيرات الخمسة، دخلنا الدرجات لكل منها في الأعمدة الخمسة من جدول البيانات (تحرير) محرر البيانات، كما هو موضح أدناه: تم نشره بإذن كتابي من ستاتاكورب لب. إجراء الاختبار في ستاتا في هذا القسم، نعرض لك كيفية تحليل البيانات الخاصة بك باستخدام الانحدار المتعدد في ستاتا عندما الافتراضات الثمانية في القسم السابق، الافتراضات. لم تنتهك. يمكنك تنفيذ الانحدار المتعدد باستخدام رمز أو ستاتاس واجهة المستخدم الرسومية (غوي). بعد أن تقوم بتحليلك، نعرض لك كيفية تفسير نتائجك. أولا، اختر ما إذا كنت تريد استخدام رمز أو ستاتاس واجهة المستخدم الرسومية (غوي). تأخذ التعليمات البرمجية لتنفيذ الانحدار المتعدد على البيانات الخاصة بك شكل: ريجريس ديبندنتفاريابل المستقلةVariable1 مستقلVariable2 مستقلVariable3 مستقلVariable4 باستخدام مثالنا حيث المتغير التابع هو VO2max والمتغيرات المستقلة الأربعة هي العمر. وزن. ونوع الجنس. يكون الرمز المطلوب هو: ريجريس VO2max العمر الوزن هيرتريت i. gender ملاحظة: سترى من التعليمات البرمجية أعلاه أن المتغيرات المستقلة المستمرة يتم إدخالها ببساطة كما هي، في حين أن المتغيرات المستقلة الفئوية لها البادئة i (على سبيل المثال العمر بالنسبة للعمر، متغير مستقل مستقل، ولكن i. gender للجنس، لأن هذا هو متغير مستقل قاطع). لذلك، أدخل رمز، تراجع VO2max العمر الوزن القلب i. gender. واضغط على زر ريتورننتر على لوحة المفاتيح. يمكنك أن ترى الإخراج ستاتا التي سيتم إنتاجها هنا. واجهة المستخدم الرسومية (غوي) الخطوات السبعة المطلوبة لتنفيذ الانحدار المتعدد في ستاتا مبينة أدناه: انقر على نماذج غت ستاتيستيكش غت وما يرتبط بها من الانحدار الخطي غ في القائمة الرئيسية، كما هو موضح أدناه: تم نشره بإذن كتابي من ستاتاكورب لب. ملاحظة: لا تقلق أن كنت اختيار الاحصائيات غ نماذج الخطية وما يتصل بها من الانحدار الخطي غ في القائمة الرئيسية، أو أن مربعات الحوار في الخطوات التالية لها عنوان، الانحدار الخطي. لم تكن قد ارتكبت خطأ. كنت في المكان الصحيح لتنفيذ إجراء الانحدار متعددة. هذا هو العنوان الذي يعطيه ستاتا، حتى عند تشغيل إجراء الانحدار المتعدد. سيتم تقديمك مع تراجع - الخطي مربع الحوار الانحدار، كما هو مبين أدناه: نشرت بإذن خطي من ستاتاكورب لب. حدد المتغير التابع، VO2max. من المتغير التابع: مربع وحدد المتغيرات المستقلة المستمرة، العمر. الوزن و هيرتريت من المتغيرات المستقلة: مربع، وذلك باستخدام زر المنسدلة، كما هو مبين أدناه: نشرت بإذن خطي من ستاتاكورب لب. حدد المتغير المستقل الفئوي، الجنس. من المتغيرات المستقلة: مربع، عن طريق النقر أولا على زر. هذا سوف يقدم لكم مع مربع الحوار التالي حيث المتغيرات المستقلة المستقلة (العمر الوزن و هيرتريت) قد دخلت بالفعل في فارليست: مربع: نشرت بإذن خطي من ستاتاكورب لب. اترك متغير عامل محدد في ناداشيب من منطقة فاريابلنداش. بعد ذلك، في منطقة فرادابلنداش عامل نداشاد، ترك المحدد في المربع المواصفات:. الآن، حدد الجنس في المربع المتغيرات باستخدام الزر المنسدل، ثم حدد افتراضي في المربع قاعدة. وأخيرا، انقر على الزر. سيتم تقديمك مع مربع الحوار التالي حيث المتغير المستقل الفئوية، i. gender. وقد تم إدخالها في فارليست: مربع: نشرت بإذن خطي من ستاتاكورب لب. انقر على الزر. سوف تعاد إلى تراجع - الخطي مربع الحوار الانحدار، ولكن مع متغير مستقل قاطع، i. gender. دخلت الآن في المتغيرات المستقلة: مربع، كما هو مبين أدناه: نشرت بإذن خطي من ستاتاكورب لب. انقر على الزر. وهذا سوف يولد الإخراج. التفسير والإبلاغ عن مخرجات ستاتا من تحليل الانحدار المتعدد ستولد ستاتا قطعة واحدة من الإخراج لتحليل الانحدار المتعدد استنادا إلى التحديدات المذكورة أعلاه، على افتراض أن الافتراضات الثمانية المطلوبة للانحدار المتعدد قد تحققت. ويمكن تحديد مدى ملاءمة النموذج R 2 والتعديل R 2 لتحديد مدى ملاءمة نموذج الانحدار للبيانات: يمثل صف R-سكارد قيمة R 2 (وتسمى أيضا معامل التحديد)، وهي النسبة من التباين في المتغير التابع الذي يمكن تفسيره من قبل المتغيرات المستقلة (من الناحية الفنية، هو نسبة التباين التي يمثلها نموذج الانحدار أعلاه وبعد النموذج المتوسط). يمكنك أن ترى من قيمتنا 0.577 أن متغيراتنا المستقلة تفسر 57.7 من متغير المتغير التابع لدينا، فو 2 كحد أقصى. ومع ذلك، تحتاج أيضا إلى أن تكون قادرا على تفسير أدج R - تربيع (أدج R2) لتقرير بدقة البيانات الخاصة بك. الأهمية الإحصائية اختبار F - ratio ما إذا كان نموذج الانحدار العام هو مناسب تماما للبيانات. يظهر الإخراج أن المتغيرات المستقلة تتنبأ إحصائيا بشكل كبير بالمتغير التابع، F (4، 95) 32.39، p لوت .0005 (بمعنى أن نموذج الانحدار مناسب تماما للبيانات). معاملات النموذج المقدرة الشكل العام للمعادلة للتنبؤ فو 2 ماكس من العمر. وزن. هيرتريت والجنس هو: توقع فو 2 ماكس 87.83 ندش (0.165 س العمر) ندش (0.385 × الوزن) ندش (0.118 x هيرت) (13.208 × الجنس) يتم الحصول على هذا من سيف. كما هو مبين أدناه: تشير المعامالت غير القياسية إلى مدى تباين المتغير التابع مع متغير مستقل، عندما تكون جميع المتغيرات المستقلة األخرى ثابتة. النظر في تأثير العمر في هذا المثال. معامل غير قياسي، B 1. بالنسبة للعمر يساوي -0.165 (انظر الصف الأول من العمود سيف). وهذا يعني أن لكل زيادة 1 سنة في العمر، وهناك انخفاض في فو 2 ماكس من 0.165 ملمينكغ. الدلالة الإحصائية للمتغيرات المستقلة يمكنك اختبار الدلالة الإحصائية لكل من المتغيرات المستقلة. هذا الاختبار ما إذا كانت المعاملات غير القياسية (أو موحدة) تساوي 0 (صفر) في السكان. إذا كان لوت .05، يمكنك استنتاج أن المعاملات إحصائيا مختلفة بشكل ملحوظ إلى 0 (صفر). و t - value و p-فالو المقابلة تقع في العمودين t و بت، على التوالي، كما هو موضح أدناه: يمكنك أن ترى من عمود بت أن جميع المعاملات المتغيرة المستقلة تختلف إحصائيا بشكل ملحوظ عن 0 (صفر). على الرغم من أن اعتراض، B 0. يتم اختبارها لأهمية إحصائية، وهذا نادرا ما تكون مهمة أو مثيرة للاهتمام. الإبلاغ عن مخرجات تحليل الانحدار المتعدد يمكنك كتابة النتائج على النحو التالي: تم تشغيل الانحدار المتعدد للتنبؤ فو 2 ماكس من الجنس والعمر والوزن ومعدل ضربات القلب. هذه المتغيرات تنبأت إحصائيا بشكل كبير فو 2 ماكس، F (4، 95) 32.39، p لوت .0005، R 2 .577. جميع المتغيرات الأربعة أضافت إحصائيا إلى حد كبير للتنبؤ، p لوت .05. تحليل الانحدار الخطي باستخدام ستاتا مقدمة الانحدار الخطي، المعروف أيضا باسم الانحدار الخطي البسيط أو الانحدار الخطي ثنائي المتغير، يستخدم عندما نرغب في التنبؤ بقيمة متغير تابع يعتمد على قيمة متغير مستقل. على سبيل المثال، يمكنك استخدام الانحدار الخطي لفهم ما إذا كان يمكن توقع أداء الامتحان بناء على وقت المراجعة (أي أن المتغير التابع الخاص بك سيكون أداء الامتحان، ويقاس من 0-100 علامة، والمتغير المستقل الخاص بك سيكون وقت المراجعة، ويقاس بالساعات) . بدلا من ذلك، يمكن أن تستخدم الانحدار الخطي لفهم ما إذا كان يمكن التنبؤ استهلاك السجائر على أساس مدة التدخين (أي المتغير التابع الخاص بك سيكون استهلاك السجائر، ويقاس من حيث عدد السجائر المستهلكة يوميا، والمتغير المستقل الخاص بك سيكون مدة التدخين، قياس في الايام). إذا كان لديك متغيرين مستقلين أو أكثر، بدلا من متغير واحد فقط، تحتاج إلى استخدام الانحدار المتعدد. بدلا من ذلك، إذا كنت ترغب فقط في تحديد ما إذا كانت هناك علاقة خطية، يمكنك استخدام بيرسونس الارتباط. ملاحظة: ويشار إلى المتغير التابع أيضا باسم متغير النتيجة أو الهدف أو المعيار، في حين أن المتغير المستقل يشار إليه أيضا باسم المتنبأ، متغير تفسيرية أو رجعية. في نهاية المطاف، أيهما المصطلح الذي تستخدمه، فمن الأفضل أن تكون متسقة. وسوف نشیر إلی ھذه المتغیرات المستقلة والمستقلة في ھذا الدلیل. في هذا الدليل، نعرض لك كيفية تنفيذ الانحدار الخطي باستخدام ستاتا، وكذلك تفسير والإبلاغ عن نتائج هذا الاختبار. ومع ذلك، قبل أن نقدم لكم لهذا الإجراء، تحتاج إلى فهم الافتراضات المختلفة التي يجب أن تلبي البيانات الخاصة بك من أجل الانحدار الخطي لتعطيك نتيجة صالحة. نناقش هذه الافتراضات بعد ذلك. الافتراضات هناك سبعة افتراضات تدعم الانحدار الخطي. إذا لم يتم استيفاء أي من هذه الافتراضات السبعة، فلا يمكنك تحليل بياناتك باستخدام خطية لأنك لن تحصل على نتيجة صالحة. وبما أن الافتراضين 1 و 2 يتعلقان باختيار المتغيرات، فلا يمكن اختبارهما لاستخدام ستاتا. ومع ذلك، يجب عليك أن تقرر ما إذا كانت دراستك تلبي هذه الافتراضات قبل الانتقال. الافتراض 1: يجب قياس المتغير التابع الخاص بك على المستوى المستمر. ومن أمثلة هذه المتغيرات المستمرة الارتفاع (مقيس بالأقدام والبوصة)، ودرجة الحرارة (المقاسة بالساعة C)، والراتب (مقيس بالدولار الأمريكي)، ووقت المراجعة (مقيس بالساعات)، والذكاء (المقيس باستخدام درجة الذكاء)، ووقت التفاعل ( مقاسة بالميلي ثانية)، وأداء الاختبار (يقاس من 0 إلى 100)، والمبيعات (مقاسة بعدد المعاملات في الشهر)، وهكذا دواليك. إذا لم تكن متأكدا مما إذا كان متغيرك التابع متواصلا (بمعنى أنه يتم قياسه على مستوى الفاصل الزمني أو مستوى النسبة)، فاطلع على أنواع دليل المتغيرات. الافتراض 2: يجب قياس متغيرك المستقل على المستوى المستمر أو الفئوي. ومع ذلك، إذا كان لديك متغير مستقل قاطع، فمن الأكثر شيوعا لاستخدام اختبار تي مستقل (لمجموعتين) أو في اتجاه واحد أنوفا (ل 3 مجموعات أو أكثر). في حال لم تكن متأكدا، تشمل أمثلة المتغيرات الفئوية نوع الجنس (على سبيل المثال مجموعتين: ذكور وإناث)، والعرق (على سبيل المثال 3 مجموعات: قوقازي، أمريكان أفريكان، وإسبانيون)، ومستوى النشاط البدني (على سبيل المثال 4 مجموعات: مستقرة، منخفضة، معتدلة و عالية)، والمهنة (على سبيل المثال 5 مجموعات: الجراح، الطبيب، ممرضة، طبيب الأسنان، المعالج). في هذا الدليل، نعرض لك إجراء الانحدار الخطي والإخراج ستاتا عندما تم قياس كل من المتغيرات التابعة والمستقلة على مستوى مستمر. لحسن الحظ، يمكنك التحقق من الافتراضات 3 و 4 و 5 و 6 و 7 باستخدام ستاتا. عند الانتقال إلى الافتراضات 3 و 4 و 5 و 6 و 7، نقترح اختبارها بهذا الترتيب لأنها تمثل أمرا إذا لم يعد من الممكن استخدام الانتهاك الخطي إذا لم يكن هناك انتهاك للافتراض. في الواقع، لا تفاجأ إذا فشلت البيانات الخاصة بك واحد أو أكثر من هذه الافتراضات لأن هذا هو نموذجي إلى حد ما عند العمل مع البيانات في العالم الحقيقي بدلا من الأمثلة كتاب، والتي غالبا ما تظهر فقط لك كيفية تنفيذ الانحدار الخطي عندما يسير كل شيء على ما يرام. ومع ذلك، لا داعي للقلق لأنه حتى عندما تفشل البيانات الخاصة بك بعض الافتراضات، غالبا ما يكون هناك حل للتغلب على هذا (على سبيل المثال تحويل البيانات الخاصة بك أو باستخدام اختبار إحصائي آخر بدلا من ذلك). تذكر فقط أنه إذا لم تتحقق من أن البيانات تستوفي هذه الافتراضات أو تختبرها بشكل غير صحيح، فقد لا تكون النتائج التي تحصل عليها عند تشغيل الانحدار الخطي صالحة. الافتراض 3: يجب أن تكون هناك علاقة خطية بين المتغيرات التابعة والمستقلة. في حين أن هناك عددا من الطرق للتحقق مما إذا كانت هناك علاقة خطية بين المتغيرين، نقترح إنشاء سكاتيربلوت باستخدام ستاتا، حيث يمكنك رسم المتغير التابع ضد متغير مستقل. يمكنك ثم فحص بصريا سكاتيربلوت للتحقق من الخطية. قد يبدو سكاتيربلوت الخاص بك شيئا مثل واحد مما يلي: إذا كانت العلاقة المعروضة في سكاتيربلوت الخاص بك ليست خطية، سيكون لديك إما تشغيل تحليل الانحدار غير الخطية أو تحويل البيانات الخاصة بك، والتي يمكنك القيام به باستخدام ستاتا. الافتراض 4: لا ينبغي أن تكون هناك قيم متطرفة كبيرة. القيم المتطرفة هي ببساطة نقاط بيانات واحدة ضمن بياناتك التي لا تتبع النمط المعتاد (على سبيل المثال في دراسة 100 طالب درجات الذكاء، حيث كانت النتيجة المتوسطة 108 مع اختلاف بسيط فقط بين الطلاب، وكان طالب واحد على درجة 156، والتي هو غير عادي جدا، وربما حتى وضعها في أعلى 1 من درجات الذكاء على الصعيد العالمي). تسلط النقاط العشوائية التالية الضوء على التأثير المحتمل للقيم المتطرفة: المشكلة مع القيم المتطرفة هي أنها يمكن أن يكون لها تأثير سلبي على معادلة الانحدار المستخدمة للتنبؤ بقيمة المتغير التابع استنادا إلى المتغير المستقل. سيؤدي ذلك إلى تغيير الناتج الذي ينتجه ستاتا ويقلل من الدقة التنبؤية لنتائجك. لحسن الحظ، يمكنك استخدام ستاتا لإجراء تشخيصات كاسويس لمساعدتك في الكشف عن القيم المتطرفة المحتملة. الافتراض 5: يجب أن يكون لديك استقلالية الملاحظات. والتي يمكنك التحقق بسهولة باستخدام إحصائية دوربين واتسون. وهو اختبار بسيط لتشغيل باستخدام ستاتا. افتراض 6: البيانات الخاصة بك تحتاج إلى إظهار هوموسداستيسيتي. والتي هي حيث تظل الفروق على طول خط من أفضل تناسب مماثلة كما يمكنك التحرك على طول الخط. يقدم النموذجان التاليان أمثلة بسيطة للبيانات التي تتوافق مع هذا الافتراض وتلك التي تفشل في الافتراض: عند تحليل البيانات الخاصة بك، سوف تكون محظوظا إذا كان سكاتيربلوت الخاص بك يشبه أي من الاثنين أعلاه. في حين أن هذه تساعد على توضيح الاختلافات في البيانات التي تفي أو تنتهك افتراض التماثل، والبيانات في العالم الحقيقي غالبا ما تكون أكثر فوضى. يمكنك التحقق ما إذا كانت البيانات الخاصة بك أظهرت هوموسداستيسيتي من خلال التآمر المخلفات موحدة الانحدار ضد الانحدار موحدة القيمة المتوقعة. الافتراض 7: وأخيرا، تحتاج إلى التحقق من أن المخلفات (أخطاء) من خط الانحدار يتم توزيعها بشكل طبيعي تقريبا. هناك طريقتان شائعتان للتحقق من هذا الافتراض تشمل استخدام رسم بياني (مع منحنى عادي مركب) أو مؤامرة P-P عادية. في الممارسة العملية، فإن التحقق من الافتراضات 3 و 4 و 5 و 6 و 7 ربما يستغرق معظم وقتك عند تنفيذ الانحدار الخطي. ومع ذلك، فإنه ليس مهمة صعبة، و ستاتا يوفر كل الأدوات التي تحتاج إلى القيام بذلك. في القسم، الإجراء. نوضح إجراء ستاتا المطلوب لتنفيذ الانحدار الخطي بافتراض عدم وجود افتراضات قد انتهكت. أولا، وضعنا المثال الذي نستخدمه لشرح إجراءات الانحدار الخطي في ستاتا. وتظهر الدراسات أن ممارسة يمكن أن تساعد في منع أمراض القلب. في حدود معقولة، وكلما كنت تمارس، وأقل خطر لديك من يعانون من أمراض القلب. إحدى الطرق التي تقلل من التمارين الرياضية من خطر الإصابة بأمراض القلب هي تقليل الدهون في الدم، وتسمى الكوليسترول. وكلما كنت تمارس، وانخفاض تركيز الكولسترول. وعلاوة على ذلك، فقد تبين مؤخرا أن مقدار الوقت الذي تقضيه في مشاهدة التلفزيون ندش مؤشرا على نمط الحياة المستقرة ندش قد يكون مؤشرا جيدا لأمراض القلب (أي أن أكثر تف تشاهد، وزيادة خطر الإصابة بأمراض القلب ). ولذلك، قرر باحث لتحديد ما إذا كان تركيز الكولسترول يرتبط الوقت الذي يقضيه مشاهدة التلفزيون في صحة جيدة الرجال 45-65 سنة (فئة المعرضة للخطر من الناس). على سبيل المثال، كما قضى الناس المزيد من الوقت في مشاهدة التلفزيون، هل تركيز الكولسترول أيضا زيادة (علاقة إيجابية) أو حدث العكس كما أراد الباحث أن يعرف نسبة تركيز الكولسترول أن الوقت الذي يقضيه مشاهدة التلفزيون يمكن أن يفسر، وكذلك يجري قادرة على التنبؤ تركيز الكولسترول. ويمكن للباحث بعد ذلك تحديد ما إذا كان الأشخاص الذين أمضوا ثماني ساعات يقضون مشاهدة التلفزيون في اليوم، على سبيل المثال، لديهم مستويات عالية بشكل خطير من تركيز الكوليسترول مقارنة بالأشخاص الذين يشاهدون ساعتين فقط من التلفزيون. ولتحقيق هذا التحليل، قام الباحث بتجنيد 100 مشارك من الذكور الأصحاء تتراوح أعمارهم بين 45 و 65 سنة. تم تسجيل مقدار الوقت الذي يقضيه مشاهدة التلفزيون (أي المتغير المستقل، الجدول الزمني) وتركيز الكوليسترول (أي المتغير التابع، الكولسترول) لكل 100 مشارك. وأعرب الباحث بعبارات متفاوتة عن رغبته في تراجع الكوليسترول على تيمتف. ملاحظة: المثال والبيانات المستخدمة لهذا الدليل وهمية. لقد أنشأناها للتو لأغراض هذا الدليل. الإعداد في ستاتا في ستاتا، أنشأنا متغيرين: (1) تيميتف. وهو متوسط الوقت اليومي الذي يقضيه مشاهدة التلفزيون في دقائق (أي المتغير المستقل) و (2) الكولسترول. وهو تركيز الكوليسترول في ممول (أي المتغير التابع). ملاحظة: لا يهم ما إذا كنت تقوم بإنشاء المتغير التابع أو المستقل أولا. بعد إنشاء هذين المتغيرين نداش تيميتف والكولسترول ندش دخلنا عشرات لكل في عمودين من محرر البيانات (تحرير) جدول البيانات (أي الوقت في ساعات أن المشاركين مشاهدة التلفزيون في العمود الأيسر (أي تيمتف. متغير مستقل)، وتركيز الكولسترول المشاركين في ممول في العمود الأيمن (أي الكوليسترول، المتغير التابع)، كما هو موضح أدناه: نشرت بإذن كتابي من ستاتاكورب ل. ب إجراء الاختبار في ستاتا في هذا القسم، نعرض لك كيفية تحليل البيانات الخاصة بك باستخدام الانحدار الخطي في ستاتا عندما لم تنتهك الافتراضات الستة في القسم السابق، افتراضات. يمكنك تنفيذ الانحدار الخطي باستخدام كود أو ستاتاس واجهة المستخدم الرسومية (غوي) بعد أن قمت بتحليل الخاص بك، ونحن تظهر لك كيفية تفسير النتائج الخاصة بك: أولا، اختر ما إذا كنت ترغب في استخدام التعليمات البرمجية أو ستاتاس واجهة المستخدم الرسومية (غوي) رمز لتنفيذ الانحدار الخطي على البيانات الخاصة بك يأخذ شكل: ريجرس ديبندنتفاريابل إنديبندنتفاريابل نشرت بإذن كتابي من ستاتاكورب لب. باستخدام مثالنا حيث المتغير التابع هو الكولسترول والمتغير المستقل هو تيميتف. فإن الرمز المطلوب سيكون: تراجعت الكولسترول تيميتف ملاحظة 1: تحتاج إلى أن تكون دقيقة عند إدخال رمز في المربع. الرمز حساس لحالة الأحرف. على سبيل المثال، إذا قمت بإدخال الكولسترول حيث C هو أحرف كبيرة بدلا من صغيرة (أي صغيرة c)، والتي ينبغي أن تكون، سوف تحصل على رسالة خطأ مثل ما يلي: ملاحظة 2: إذا كنت لا تزال تحصل على رسالة خطأ في ملاحظة 2 : أعلاه، يجدر التحقق من الاسم الذي قدمته لمتغيرين في محرر البيانات عند إعداد الملف (أي الاطلاع على شاشة محرر البيانات أعلاه). في المربع الموجود على الجانب الأيسر من شاشة محرر البيانات، هي الطريقة التي تكتب بها المتغيرات في القسم، وليس القسم الذي تحتاج إلى إدخاله في الشفرة (انظر أدناه للمتغير التابع لدينا). قد يبدو هذا واضحا، ولكنه خطأ يتم أحيانا، مما يؤدي إلى الخطأ في الملاحظة 2 أعلاه. لذلك، أدخل رمز، تراجعت الكولسترول تيميتف. واضغط على زر ريتورننتر على لوحة المفاتيح. نشرت بإذن خطي من ستاتاكورب لب. يمكنك أن ترى الإخراج ستاتا التي سيتم إنتاجها هنا. واجهة المستخدم الرسومية (غوي) الخطوات الثلاث المطلوبة لتنفيذ الانحدار الخطي في ستاتا 12 و 13 موضحة أدناه: انقر فوق S تاتيستيكش غ النماذج الخطية وما يتصل بها من الانحدار الخطي غ في القائمة الرئيسية، كما هو موضح أدناه: نشرت بإذن خطي من ستاتاكورب LP. سيتم تقديمك مع نداش نرجس الخطي مربع الحوار الانحدار: نشرت مع إذن خطي من ستاتاكورب لب. حدد الكوليسترول من داخل المتغير التابع: المربع المنسدل، و تيميتف من داخل المربع المتغير المستقل: المتغير. سوف ينتهي بك الأمر مع الشاشة التالية: نشرت بإذن كتابي من ستاتاكورب لب. خرج تحليل الانحدار الخطي في ستاتا إذا كانت بياناتك قد اجتازت الافتراض 3 (أي أن هناك علاقة خطية بين المتغيرين)، 4 (أي لم تكن هناك قيم متطرفة كبيرة)، الافتراض 5 (أي كان لديك استقلالية للملاحظات)، الافتراض 6 ( أي أن البيانات الخاصة بك أظهرت هوموسداستيسيتي) والافتراض 7 (أي أن المخلفات (الأخطاء) كانت موزعة بشكل طبيعي تقريبا)، والتي شرحناها سابقا في قسم الافتراضات، سوف تحتاج فقط إلى تفسير الناتج الانحدار الخطي التالي في ستاتا: نشرت بإذن كتابي من ستاتاكورب لب. ويتكون الإخراج من أربع أجزاء مهمة من المعلومات: (أ) تمثل قيمة R 2 (صف R-سكارد) نسبة التباين في المتغير التابع الذي يمكن تفسيره بواسطة متغيرنا المستقل (فنيا تمثل نسبة التغير بواسطة نموذج الانحدار فوق النموذج المتوسط). غير أن R 2 يستند إلى العينة وهو تقدير متحيز إيجابيا لنسبة تباين المتغير التابع الذي يمثله نموذج الانحدار (أي أنه كبير جدا) (ب) قيمة R 2 المعدلة (أدج R - (F) (1، 98))، والأهمية الإحصائية لنموذج الانحدار (بروب غ F الصف)، والذي يصحح التحيز الإيجابي لتوفير قيمة من المتوقع أن تكون في السكان (ج) قيمة F، و (د) معاملات المتغير الثابت والمستقل (عمود كويف)، وهي المعلومات التي تحتاجها للتنبؤ بالمتغير التابع، الكوليسترول. باستخدام المتغير المستقل، تيمتف. في هذا المثال، R 2 0.151. تعديل R 2 0.143 (إلى 3 d. p.)، وهو ما يعني أن المتغير المستقل، تيمتف. يفسر 14.3 من تباين المتغير التابع، الكولسترول. في السكان. R2 المعدل هو أيضا تقدير لحجم التأثير، والتي في 0.143 (14.3)، يدل على حجم التأثير المتوسط، وفقا لتصنيف كوهينز (1988). ومع ذلك، عادة ما يكون R 2 ليس R2 المعدل الذي يتم الإبلاغ عنه في النتائج. في هذا المثال، يكون نموذج الانحدار ذو دلالة إحصائية، F (1، 98) 17.47، p .0001. وهذا يشير إلى أن النموذج المطبق يمكن أن يتنبأ إحصائيا بشكل كبير بالمتغير التابع، الكوليسترول. ملاحظة: نقدم الإخراج من تحليل الانحدار الخطي أعلاه. ومع ذلك، بما أنك يجب أن تختبر بياناتك للافتراضات التي شرحناها سابقا في قسم الافتراضات، ستحتاج أيضا إلى تفسير ناتج ستاتا الذي تم إنتاجه عند اختبار هذه الافتراضات. وهذا يشمل ما يلي: (أ) سكاتيربلوتس التي استخدمتها للتحقق مما إذا كانت هناك علاقة خطية بين المتغيرين الخاصين بك (أي الافتراض 3) (ب) التشخيص الكاسويس للتحقق من عدم وجود قيم متطرفة كبيرة (أي افتراض 4) (ج) the Durbin-Watson statistic to check for independence of observations (ie Assumption 5) (d) a scatterplot of the regression standardized residuals against the regression standardized predicted value to determine whether your data showed homoscedasticity (ie Assumption 6) and a histogram (with superimposed normal curve) and Normal PP Plot to check whether the residuals (errors) were approximately normally distributed (ie Assumption 7). Also, remember that if your data failed any of these assumptions, the output that you get from the linear regression procedure (i. e. the output we discuss above) will no longer be relevant, and you may have to carry out an different statistical test to analyse your data. Reporting the output of linear regression analysis When you report the output of your linear regression, it is good practice to include: (a) an introduction to the analysis you carried out (b) information about your sample, including any missing values (c) the observed F - value, degrees of freedom and significance level (i. e. the p - value) (d) the percentage of the variability in the dependent variable explained by the independent variable (i. e. your Adjusted R 2 ) and (e) the regression equation for your model. Based on the results above, we could report the results of this study as follows: A linear regression established that daily time spent watching TV could statistically significantly predict cholesterol concentration, F (1, 98) 17.47, p .0001 and time spent watching TV accounted for 14.3 of the explained variability in cholesterol concentration. The regression equation was: predicted cholesterol concentration -2.135 0.044 x (time spent watching tv). In addition to the reporting the results as above, a diagram can be used to visually present your results. For example, you could do this using a scatterplot with confidence and prediction intervals (although it is not very common to add the last). This can make it easier for others to understand your results. Furthermore, you can use your linear regression equation to make predictions about the value of the dependent variable based on different values of the independent variable. Whilst Stata does not produce these values as part of the linear regression procedure above, there is a procedure in Stata that you can use to do so.
No comments:
Post a Comment