Feeds:
تدوينات
تعليقات

Archive for the ‘تحليل البيانات’ Category

تعرفنا على التوزيع الطبيعي وعلى عدد من التوزيعات الأخرى. في هذه المقالة نستعرض نظرية الحد المركزية والتي تجعلنا نستطيع استخدام التوزيع الطبيعي في حالات لا يتبع فيها توزيع البيانات التوزيع الطبيعي.

نظرية الحد المركزية  Central Limit Theory:

افترض أنك جمعت بيانات عن طول المنتج ووجدها تتبع توزيعا منتظما أو توزيعا أسيِّاً. في هذه الحالة لا تستطيع استخدام التوزيع الطبيعي. ولكن في الواقع فإننا نقوم بقياس 50 قطعة كل ساعتين ثم نسجل متوسط الطول وهكذا. أي أننا نأخذ عينات كل فترة زمنية ونسجل متوسط قيم مفردات هذه العينة. معنى ذلك أننا نتعامل مع متوسط العينات. نظرية الحد المركزية تقول أنه يمكننا أن نستخدم التوزيع الطبيعي في هذه الحالة وفي أي حالة مماثلة. أمر عجيب ورائع. نعم رائع لأن معظم تعاملنا سيكون مع منحنى التوزيع الطبيعي الشهير والسهل ولن نشتت جهدنا بين توزيعات كثيرة وتعقيدات حسابية. وهو أمر عجيب لأننا نقول أن المتغير الذي نقيسه لا يتبع التوزيع الطبيعي ثم نقول أنه يمكننا أن نستخدم التوزيع الطبيعي.

دعنا نفكر في الأمر. افترض أن الطول موزع بانتظام بين 10 و20. ما الذي يحدث عندما نأخذ 50 عينة عشوائية ثم نحسب المتوسط؟

إننا لو رسمنا توزيع الطول لهذه العينة لوجدناه يتبع التوزيع المنتظم. ولكننا لا نفعل ذلك. إننا نحسب متوسط الطول أي نحصل على متوسط 50 قطعة. ما الذي يحدث مع العينة الثانية ثم الثالثة ثم الرابعة. لا نتوقع أن يكون متوسط العينات متساو تماما ولكن نتوقع أن يكون متأرجحا حول قيمة ما هي قيمة المتوسط لكل القطع المنتجة. ولكن هل شكل هذه المتوسطات أي توزيعها سيكون منتظما؟ لا إنه يتبع التوزيع الطبيعي. لماذا؟ لأنك لو أخذت العينات بشكل عشوائي فإن متوسطها سيكون متأرجحا حول متوسط كل العينات أو كل القطع المنتجة خلال عدة أيام.

(المزيد…)

Read Full Post »

تعرفنا على التوزيع الطبيعي ولكن التوزيع الطبيعي ليس وحيدا فهناك توزيعات أخرى مثل التوزيع المنتظم والأسي. فعندما نجمع البيانات ونرسم المدرج التكراري قد نجد أنها تتبع التوزيع الطبيعي أو غيره. في هذه المقالة نتعرف على توزيعات احتمالية أخرى. وهذه التوزيعات الاحتمالية ليست حسابات رياضية معقدة ولا هي أمر نظري لا علاقة له بالعمل. هذه التوزيعات الاحتمالية تستخدم في مجالات شتى من مجالات العمل فهي تستخدم لدراسة سرعة الخدمة ومعدل وصول العملاء وتستخدم لتحليل معدل المشاكل في المعدات وتستخدم لمحاكاة أي عملية وتستخدم لدراسة حجم المبيعات. ويمكننا التعامل مع هذه التوزيعات بدون الدخول في تعقيدات رياضية لأنه يمكننا استخدام الحاسوب.

التوزيع المنتظم Uniform Distribution:

التوزيع المنتظم يختلف عن التوزيع الطبيعي في أن احتمالية وقوع المتغير بين أي قيمتين لا يتغير. فلو كان لدينا توزيع منتظم لطول المنتج من 10.5 إلى 11.00 فإن احتمالية أن يكون طول المنتج بين 10.5 و 10.6 تساوي احتمالية أن يكون طول المنتج بين 10.7 و10.8 وهي نفس احتمالية أن يكون طول المنتج بين 10.8 و10.9 وهكذا. فالتوزيع منتظم ولا يزداد في المنتصف كما في حالة التوزيع الطبيعي.

التوزيع المنتظم هو توزيع يبين أن المتغير يقع بين قيمتين محددتين هما أ و ب. فالرسم أعلاه يبين أن هذا المتغير يقع بين 12 و25 فهو لا يقل عن 12 ولا يزيد عن 25. ويبين كذلك أن وقوع المتغير بين قيمتين مثل 12و 14 تساوي احتمالية وقوع المتغير بين 17 و19 أو بين 21 و23 وهكذا. والمساحة تحت المنحنى كما هي الحالة في منحنى التوزيع الطبيعي تساوي 1 ولذلك فإن الخط الأعلى عند

1 / (ب – أ)

وهو في هذه الحالة = 1/ (25 – 12) =0.08.

المتوسط في منحنى التوزيع المنتظم يساوي (أ + ب) / 2 وهو في هذه الحالة يساوي (12 + 25) / 2 = 18.5. أما الانحراف المعياري فيساوي الجذر التربيعي لـ (ب – أ) 2 / 12 وهو في هذه الحالة يساوي 3.75.

(المزيد…)

Read Full Post »

تعرفنا في المقالة السابقة على منحنى التوزيع الطبيعي وخصائصه. في هذه المقالة نلقي المزيد من الضوء على التوزيع الطبيعي وذلك باستعراض التوزيع الطبيعي القياسي.

التوزيع الطبيعي القياسي (المعياري) ؟

كما تعلم فإن منحنى التوزيع الطبيعي يُعرَّف بالمتوسط µ والانحراف المعياري σ. وقد يأخذ المتوسط أي قيمة ويأخذ الانحراف المعياري أي قيمة موجبة. أما منحنى التوزيع الطبيعي القياسي Standard Normal Distribution فهو توزيع طبيعي له متوسط يساوي الصفر وانحراف معياري يساوي واحد.

ويستخدم  منحنى التوزيع الطبيعي القياسي لتحديد احتمالية أن يأخذ متغيرا يتبع التوزيع الطبيعي قيما في مدى محدد. افترض أننا ندرس متغير ما مثل أخطاء الإنتاج اليومية أو أطوال مجموعة من الناس أو زمن عملية ما ووجدنا أنه يتبع توزيعا طبيعيا بمتوسط يساوي 35 وانحراف معياري يساوي 2 ونريد أن نقدر احتمالية أن تكون قيمة هذا المتغير أكبر من 40. إننا بحاجة لجداول تبين المساحة تحت هذا المنحنى لأن هذه المساحة -كما بينا في المقالة السابقة- تعبر عن الاحتمالات. وبالتالي فإننا سنحتاج جدول لكل منحنى توزيع طبيعي وهذا أمر معقد جدا. لذلك فإننا نستخدم معادلة بسيطة لتحويل قيمة المتغير لمنحنى التوزيع القياسي وبالتالي يمكننا استخدام جدول واحد فقط وهو منحنى التوزيع الطبيعي القياسي.

(المزيد…)

Read Full Post »

المدرج التكراري Histogram هو من الأدوات الشهيرة في تحليل البيانات لبساطته وتوضيحه لتوزيع البيانات. والكثير من التحاليل الإحصائية تبدأ برسم المدرج التكراري لمعرفة توافق توزيع البيانات الحقيقي مع بعض التوزيعات المعروفة مثل التوزيع الطبيعي Normal Distribution. ولهذا الأمر ارتباط بخرائط المراقبة لذلك فضلتُ أن أخصص هذه المقالة لمناقشة المدرج التكراري ثم المقالة التالية لمناقشة منحنى التوزيع الطبيعي ثم نستكمل الرحلة بمشيئة الله مع خرائط المراقبة (الضبط).

المدرج التكراري

المدرج التكراري هو أحد الرسومات البيانية التي تعطي معلومات غزيرة في شكل بسيط. فهو يمكنك من فهم البيانات وتوزيعها وبالتالي يمكننا من تحليل البيانات والوصول إلى قرارات إدارية مهمة. دعنا نستعرض مثالا يوضح الأمر.

افترض أننا سجلنا أعمار مجموعة من الناس خرجوا في رحلة جماعية وكان عددهم 40 شخصا. وبعد جمع البيانات أحببنا أن نعرف عدد الناس الذين سنهم أقل من 10 سنوات وهؤلاء الين سنهم بين 10 و20 عاما ثم بين 20 و30 وهكذا. نقوم بوضع البيانات في جدول كالتالي حيث يمثل العمود الأيسر الشريحة العمرية والعمود الأيمن يمثل عدد الناس فس كل شريحة:

وبعد ذلك يمكننا رسم هذا الجدول في رسم هو ما يسمى بالمدرج التكراري. كل عمود من هذه الأعمدة يبين عدد الناس الذين يقعون في هذه الشريحة العمرية. بنظرة سريعة يمكنك أن تدرك أن معظم هذه المجموعة من الفئة العمرية المتوسطة أي بين العشرين والخمسين. ومن الملاحظ أن هناك قلة متساوية تقريبا من الفئات العمرية الصغيرة والكبيرة. ومن الواضح أن أكبر فئة عمرية هي بين الثلاثين والأربعين. ولاشك أن هذه معلومات مهمة نحصل عليها من الشكل بسرعة وسهولة.

(المزيد…)

Read Full Post »

نستكمل في هذه المقالة موضوع تحليل الانحدار الخطي Linear Regression فنستعرض فرضيات تحليل الانحدار وكيفية التحقق منها. والأسلوب المستخدم للتأكد من تحقق هذه الفرضيات هو تحليل البواقي.

البواقي Residuals

ما هي البواقي؟ البواقي Residuals هي الفرق بين القيمة التي نحسبها من نموذج الانحدار والقيمة الحقيقية. فمثلا إذا قمنا بتحليل الانحدار لحجم المبيعات بناء على سعر البيع والجودة وعدد منافذ البيع  فالباقي هو الخطأ في النموذج. فعند مقارنة حجم المبيعات لإحدى الحالات المعلومة لدينا بنتيجة النموذج فإننا نجد فارقا بينهما وهذا الفارق هو الخطأ في النموذج أو الباقي. يمكن أن نقول أن وجود هذا الفارق أو الخطأ هو من طبيعة تحليل الانحدار فمن النادر أن يكون تحليل الانحدار صحيحا بنسبة مائة بالمائة.

residuals

هذا الشكل يوضح البواقي عند القيام بتحديد خط الانحدار أي تحديد العلاقة الخطية بين خبرة العامل وعدد العيوب في المنتج. البيانات الأساسية التي سجلناها هي عبارة عن النقاط الزرقاء  المبعثرة. وعندما رسمنا خط الانحدار وهو الخط المستقيم باللون البرتقالي فإنه لا ينطبق بطيبعة الحال على كل النقاط. ولذلك فهناك فارق بين البيانات المسجلة وعدد العيوب التي سننتجها من خط الانحدار أو معادلته. هذا الفارق هو الفارق بين كل نقطة من البيانات الأساسية وقيمة خط الانحدار. فعلى سبيل المثال فإنه إذا كانت خبرة العامل هي 25 عاما فإن البيانات المسجلة تبين أن عدد العيوب في المنتج كانت 24 تقريبا ولكننا لو استخدمنا خط الانحدار لوجدناه يعطينا قيمة مختلفة وهي 21 تقريبا. الفارق بين القيمة الحقيقية وتلك التي نحصل عليها من معادلة الانحدار أو خط الانحدار هو الباقي وهو بالنسبة لهذه النقطة يساوي 24 – 21 =3.

(المزيد…)

Read Full Post »

عندما تقوم بإجراء استبيان فإنك تحدد من سيجيب عليه وهنا تواجه سؤلا مهما وهو: هل ستسأل كل من له علاقة بالموضوع (مجتمع الدراسة) أم ستسأل بعضا منهم (عينة)؟ فمثلا إذا كنا سنجري دراسة عن مميزات وعيوب الخدمة التي نقدمها فهل سنسأل كل المستهلكين أم بعضا منهم؟ ربما يبدو سؤال كل المستهلكين كما لو كان الحل الدقيق والواجب ولكن الأمر ليس بهذه البساطة. هل تتصور صعوبة سؤال كل المستهلكين؟ هل تقدر الوقت والتكلفة اللازمين لسؤال كل المستهلكين؟ ما هو تأثير بطء جمع المعلومات على قدرتنا على المنافسة؟ إن سؤال كل المستهلكين هو عملية صعبة تحتاج وقت طويل وتكلفة عالية وتجعل عملية تحليل البيانات أكثر صعوبة. وفي نفس الوقت فإننا إن سألنا عشر المستهلكين أو أقل فما يدرينا أن رأيهم يمثل رأي كل المستهلكين.

samplepopu

يبدو لنا من ذلك أن طرح الاستبيان على عينة محدودة أمر سريع وأيسر من سؤال عدد هائل من الناس ولكن لابد من أن نبحث عن الطرق التي تجعل رأي العينة ممثلا لرأي كل المستهلكين وإلا فإن البيانات التي سنحصل عليها ستقودنا إلى استنتاجات خاطئة.

(المزيد…)

Read Full Post »

ماذا تفعل لكي تقيس رضا العملاء عن المنتج الجديد أو الخدمة؟ ماذا نفعل لتتعرف على ما يعجب العملاء وما لا يعجبهم؟ ماذا تفعل لتتبين مدى ولاء العاملين ورضاهم عن المؤسسة التي يعملون بها؟ ماذا تفعل لتتبين ما يراه العاملون أو العملاء من مشاكل في عملية ما؟ إن أحد الوسائل المستخدمة للإجابة عن مثل هذه الأسئلة هو الاستبيان Questionnaire. الاستبيان هو عبارة عن مجموعة من الأسئلة المكتوبة التي تطلب من العملاء أو العاملين أو مجموعة ما من الناس أن تجيب عليها.

الخطوات الرئيسية لإعداد الاستبيان:

1- تحديد ما نريد قياسه باستخدام هذا الاستبيان

2- تحديد المجتمع (العملاء، العاملين، السياح، السكان…) التي سيتم توجيه هذا الاستجواب لها

3- صياغة الأسئلة التي تخدم الهدف من الاستبيان أي أنها تؤدي إلى قياس ما نريد قياسه

4- تنقيح الصياغة وتقسيم الأسئلة إلى مجموعات بحيث تكون كل مجموعة مقياسا لأحد المؤشرات التي نريد قياسها

5- اختبار الاستبيان عن طريق تجربته على عدد قليل من الأفراد مثل بعض العملاء أو العاملين أو المرضى وذلك للتأكد من وضوح الصياغة وسهولة التعامل مع الاستبيان

6- تنقيح الاستبيان طبقا لما يظهر في الاختبار من أخطاء أو غموض

نوعية الأسئلة:

(المزيد…)

Read Full Post »

Older Posts »

%d مدونون معجبون بهذه: