ناقشت في المقالة السابقة كيفية دراسة العلاقة بين متغيرين باستخدام الرسم البياني (المنحنى التنقيطي) Scatter Diagram والذي يساعدنا على اكتشاف أي علاقة خطية أو غير خطية بين المتغيرين أو اكتشاف عدم وجود أي علاقة. وفي هذه المقالة نتعرض لطرق أخرى لدراسة العلاقة بين متغيرين. هذا الموضوع هو من الأساسيات التي يحتاجها المدير وأي شخص يحتاج لتحليل بيانات ودراسة علاقتها ببعضها.
معامل الارتباط Correlation:
معامل الارتباط هو رقم يتراوح بين -1 و1 وهو يبين وجود علاقة خطية بين متغيرين واتجاه تلك العلاقة كما يلي:
+1 تعنى علاقة طردية بمعنى أنه كلما زاد أ زاد ب وكلما قل أ فإن ب يقل
-1 تعني علاقة عكسية بمعنى انه كلما زاد أ فإن ب يقل وكلما قل أ فإن ب يزيد
صفر يعني عدم وجود أي علاقة بين المتغيرين
عندما يقترب معامل الارتباط من إحدى هذه القيم فإنه يدل على ما تدل عليه هذه القيم ولكن بدرجة أقل. فمثلا +0.9 تدل على وجود علاقة طردية قوية بين المتغيرين ولكنها ليست مطلقة مثل تلك التي تتوقعها عندما يكون معامل الارتباط يساوي+1.
يسمى معامل الارتباط بـمعامل الارتباط لبيرسون Pearson Correlation Coefficient ويشيع تسميته بمعامل الارتباط. . ولمعامل الارتباط تطبيقات عديدة فمثلا في مجال التسويق قد تحب أن تدرس إن كان هناك علاقة بين زيادة مبيعات منتجك وزيادة مبيعات سلعة أخرى أو تحسن درجة الحرارة أو تخفيض السعر. وقد تكون مهندسا يريد أن يعرف ما الذي يؤثر على جودة الغاز المنتج هل هو تغير الضغط أم الحرارة أم جودة أي غاز من الغازات الداخلة في العملية الإنتاجية.
طريقة الحساب:
معامل الارتباط يتم حسابه بسهولة عن طريق الحاسوب ولذلك فلسنا بحاجة للدخول في حسابات مملة ولكن من الضروري أن نلقي نظرة على طريقة الحساب لنفهم معنى معامل الارتباط. يتم حساب معامل الارتباط كالتالي
والبسط في هذه المعادلة هو مجموع حاصل ضرب الفارق بين كل قيمة للمتغير الأول ومتوسطه الحسابي في الفارق بين كل قيمة للمتغير الثاني ومتوسطه الحسابي. والمقام هو حاصل ضرب الانحراف المعياري لكل من المتغيرين في عدد البيانات منقوصا منها واحد. هذا في حال أن لدينا عينة من البيانات كأن نأخذ عينة عشوائية من مجموعة كبيرة (المجتمع) وندرس ظاهرة معينة على هذه العينة. اما عند دراسة المجتمع كله فإن طريقة الحساب تختلف اختلافا طفيفا وتكون كالتالي
في هذه الحالة فإن المقام يكون حاصل ضرب الانحراف المعياري للمجتمع لكل من المتغيرين مضروبا في عدد البيانات.
ماذا نفهم من هذه المعادلة المعقدة؟
أولا المقام هو حاصل ضرب أرقام موجبة (أكبر من الصفر) فالانحراف المعياري هو دائما رقما موجبا وكذلك عدد البيانات. فمتى يكون معامل الارتباط موجبا ومتى يكون سالبا؟ الأمر يتوقف على البسط. فإذا كان الفارق بين قيمة ما للمتغير الأول ومتوسطه الحسابي موجبا وكان الفارق بين القيمة المقابلة والمتوسط الحسابي للمتغير الثاني موجبا كانت النتيجة موجبة لأن حاصل ضرب قيمة موجبة في قيمة موجبة يساوي قيمة موجبة. وإذا كان كل منهما سالبا فإن الناتج يكون موجيا لأن حاصل ضرب قيمة سالبة في قيمة سالبة يساوي قيمة موجبة. ومعنى ذلك (في الحالة الأولى) أنه عند زيادة المتغير الأول عن متوسطه الحسابي فإن المتغير الثاني يزيد عن متوسطه الحسابي هو الآخر وكذلك (في الحالة الثانية) عند نقصان المتغير الأول عن متوسطه الحسابي فإن نفس الأمر يحدث للمتغير الثاني.
وبالتالي فإنه عندما تكون العلاقة عكسية فإن الناتج يكون سالبا لأن أحد الفارقين سيكون موجبا والآخر سالبا. وهذا يجعلنا نفهم القاعدة بأن معامل الارتباط كلما كان أقرب للواحد الصحيح فإن ذلك يعني وجود علاقة طردية قوية وكلما اقترب من -1 فإن ذلك يعني وجود علاقة عكسية قوية. وكلما اقترب من الصفر فإن ذلك يعني عدم وجود علاقة خطية.
شكل العلاقة:
لننظر إلى بعض الرسومات البيانية المرادفة لقيم مختلفة لمعامل الارتباط لنتفهم ما يعنيه هذا الرقم.
كيف نستخدم إكسل لحساب معامل الارتباط:
هناك طريقتان يمكننا استخدامهما.
افترض أن لدينا البيانات التالية:
ونريد حساب معامل الارتباط بين المتغير أ و ب. الطريقة الأولى هي أن نستخدم الدالة المتاحة في إكسل لحساب معامل الارتباط فنكتب ما يلي في أي خلية:
=CORREL(D2:D16,C2:C16)
وبالتالي نحصل على معامل الارتباط بين أ و ب وهو -0.46 . هذه القيمة تعني وجود علاقة عكسية ضعيفة لأن القيمة لا تقترب من -1 بل هي أقرب قليلا إلى الصفر.
الطريقة الثانية تساعدنا في الحصول على معامل الارتباط بين متغيرين أو عدة متغيرات مرة واحدة. هذه الطريقة تتم كالتالي:
اضغط على Tools ثم Data Analysis (أوضحت من قبل كيفية إظهار Data Analysis)
تظهر لك النافذة التالية وعليك ملء Input Range بأسماء الخلايا التي مسجل بها البيانات. وقد علمت على Labels in First Row أي أن أسماء الأعمدة في الصف الأول (أي أو ب وت وث)
نضغط OK فنحصل على النتيجة كالتالي:
هذا الجدول (بالأعلى) يبين أن معامل الارتباط بين ث و ت مثلا هي 0.21 ومعامل الارتباط بين ب و ت هي -0.35 وهكذا. بالطبع فإن العلاقة بين المتغير ونفسه هي 1 فترى في الجدول معامل ارتباط ث بـ ث هو 1 وهي قيمة لا تعنينا في شيء. هذه الطريقة سريعة جدا عندما يكون لدينا أكثر من متغيرين. من هذه النتيجة نرى أن العلاقة الخطية بين أ و ت هي الوحيدة التي يمكن أخذها في الاعتبار لأنها تساوي 0.72 أما باقي القيم فهي صغيرة جدا.
هل لا توجد علاقة؟
ليس معنى أن يكون معامل الارتباط صفرا أو قريبا من الصفر أنه لا توجد أي علاقة بين المتغيرين. فمعامل الارتباط يبين قوة العلاقة الخطية. والعلاقة الخطية هي علاقة في شكل خط مستقيم فهي علاقة ليس بها منحنيات أو طلوع ونزول. فالعلاقة الخطية تكون طردية أو عكسية فقط. وبالتالي فقد يكون معامل الارتباط يساوي صفرا ولكن توجد علاقة قوية بين المتغيرين ولكنها غير خطية أي أنها ليست على شكل خط مستقيم كما في الامثلة التالية:
ففي هذين الشكلين نرى علاقة واضحة بين المتغيرين ولكنها ليست مجرد علاقة طردية أو عكسية ولا يمكن تمثيلها بخط مستقيم. ففي الحالة الأولى نلاحظ تغير المتغير الثاني بشكل دوري مع المتغير الأول. وفي الحالة الثانية نجد علاقة طردية حتى نقطة ما ثم تتحول العلاقة إلى علاقة عكسية. هذه العلاقات هي علاقات غير خطية ولا يمكن التنبؤ بها بمعامل الارتباط.
بهذا نكون قد استطعنا دراسة شكل العلاقة عن طريق منحنى الانتشار (المنحنى التنقيطي) ومعرفة قوة العلاقة الخطية عن طريق معامل الارتباط. في المقالة التالية إن شاء الله نناقش كيفية الوصول لعلاقة رياضية بين متغير وكل المتغيرات التي تؤثر فيه.
مقالات ذات صلة:
الانحدار الخطي المتعدد Multiple Regression
من مراجع الموضوع:
Lean Six Sigma Pocket ToolBook, M. George at al., MCGrawHill, 2005
Applied Statistical Methods, W. Carlson and B. Thorne, Prentice Hall, 1997
السلسلام عليكم
بارك الله فيك استاذ سامح على هذا المجهود و المقالات الرائة و على قدرة توصيل المعلومة في سلاسة
سؤالي لك بارك الله فيك … بعد استخراج معامل الارتباط ل 17 عامل متغيير و الحصول على النتيجة
كيف لي ان استنتج العوامل المستقلة و العوامل المتغيرة من معامل الارتباط؟
الأستاذ يوسف
معامل الارتباط لا علاقة له بكون المتغير مستقل أم تابع، معامل الارتباط هو عملية حسابية بين متغيرين، وأما معرفة المتغير المستق والتابع فينبع من معرفتنا بالحالة التي ندرسها. على سبيل المثال المبيعات متغير تابع والسعر هو متغير مستقل، ووارتفاع درجة حرارة الجو هو متغير مستقل والتابع له هو درجة حرارة ماء البحر.
شكرا
السلام عليكم / بارك الله بجهودك القيمة جدا جدا لأهمية الموضوع وطريقة العرض الواضحة جدا جدا
وسؤالي اود ان لعرف ان كان لديك شرح مشابه عن تحليل التباين لمتغيرين او عدة متغيرات
مع شكري الجزيل واحترامي
اخوكم / سامي محمد
الأستاذ سامي
مع الأسف لم أكتب فيه حتى الآن. أتمنى أن أجد فرصة لذلك.
شكرا
أستاذ سامح لو تكرمت حين تكون درجة ارتباط بيرسون بين متغيرين(42,) وقيمة الدلالة 019,) هل استطيع القول ان العلاقة متوسطة او ضعيفة او اكتفي بقول علاقة طردية فقط؟
بحثي ماجستير بالمحاسبة..
جزاك الله خير
ماذا تعني بقيمة الدلالة؟
شكرا
أخي مستوى دلالة الاختبار وهي عبارة عن اصغر قيمة لرفض الفرضية الصفرية بمعنى انو اذاكان مستوى معنوية الاختبار اكبر من مستوى معنوية الفرضية الصفرية مثلا 0.05 فهذا يعني اننا نقبل الفرضية الصفرية اما اذكان اصغر من مستوى معنوية 0.05 نرفض الفرضية الصفرية ونقصد بمستوى معنوية الفرضية الصفرية وهي اكبر خطا يستطيع الباحث تحمله
شكرا الف شكر انا فعلا تعلمت منك كثير جزاك الله كل الخير
الله يجزاك الف خير
اطلعت واستفدت في بحثي للماجستير
جزاك الله خير
شكرا جدااااااااااااا ع مجهودك
ولكن عندى سؤال
كيفيه حساب معامل الارتباط الذاتى ؟؟؟؟؟؟؟؟؟؟
شكراااااااااااا
http://www.pcreview.co.uk/forums/thread-1988256.php
http://www.ehow.com/how_6168453_calculate-autocorrelation.html
http://www.ehow.com/how_6170168_calculate-autocorrelation-coefficient.html
شكرا
شكرا على المعلومات المفيده
رائع جدددددددددددددددددددددددددددددددددددددددددددددددداَ
السلام عليكم او اسال سؤال اريد ان احب بواسطة علاقة احصائية بين العمر والجنس والتحصيل الدراسي هل بالامكان مساعدتي وشكرا مقدما .
الأستاذ namer
مع الأسف ليس لدي دراسة عن هذا الموضوع
شكرا
السلام عليكم اخي
اشكرك جدا على معلوماتك القيمة صدقا انا ممنونك
ارجوك لقد قرأت وفهمت ما ذكرت عن المتغيرات ومعامل الارتباط ولكنني فشلت في استخدامها لتحليل بعض المعلومات الاحصائية في بحثي ارجو ان تساعدني بان ارسل لك المعلومات وهي قليلة جدا وموجودة على برنامج اكسل فقط اريد ان تتاكد من صحة ما عملت وتقول لي ما هو تحليلك لانني واثق انك سوف تحلل بمهارة افضل مني.
هناك بعض المصطلحات لم اعرف ماهيتها او استخدامها مثل
Unstandardized Coefficient B
Std. Error
Standardized Coefficient Beta
T value*هل استطيع ان ارسل لك البيانات وهي فعلا قليلة ومعبأة على برنامج الاكسل يمكنني ان ارسلة بالايميل ؟
ارجو الرد في اقرب وقت
شكرا جزيلا
محمد
الأستاذ محمد
أرسلت لك رسالة على البريد الإلكتروني
شكرا
انا في سنة رابعة علم نفس احمل مادة الاحصاء من السنة الثالثة وانا انهيت تقريبا السة الرابعة و لكني رسبت في مادة الاحصاء ولا استطيع الحصول على الاجازة الجامعية ما لم انجح بهذه المادة….المشكلة عندي هي انني لم اتمكن من حضور دروس الاحصاء طيلة السنة الدراسية وذلك لارتباطي بالعمل… المطلوب:اذا اططلعتك على المنهاج هل تستطيع مساعدتي؟ (ان معامل الارتباط التي تفضلت بشرحها هنا هي من ضمن المنهاج عندي وقد اعجبتني طريقة شرحك لها وهذا ما شجعني على طلب المساعدة…..مع بالغ التقدير والشكر….
الأستاذة angel
لا يمكنني القيام بذلك سوى بنشر بعض المقالات كما أفعل الآن
شكرا