Posts Tagged ‘Statistics’

تعرفنا على التوزيع الطبيعي وعلى عدد من التوزيعات الأخرى. في هذه المقالة نستعرض نظرية الحد المركزية والتي تجعلنا نستطيع استخدام التوزيع الطبيعي في حالات لا يتبع فيها توزيع البيانات التوزيع الطبيعي.

نظرية الحد المركزية  Central Limit Theory:

افترض أنك جمعت بيانات عن طول المنتج ووجدها تتبع توزيعا منتظما أو توزيعا أسيِّاً. في هذه الحالة لا تستطيع استخدام التوزيع الطبيعي. ولكن في الواقع فإننا نقوم بقياس 50 قطعة كل ساعتين ثم نسجل متوسط الطول وهكذا. أي أننا نأخذ عينات كل فترة زمنية ونسجل متوسط قيم مفردات هذه العينة. معنى ذلك أننا نتعامل مع متوسط العينات. نظرية الحد المركزية تقول أنه يمكننا أن نستخدم التوزيع الطبيعي في هذه الحالة وفي أي حالة مماثلة. أمر عجيب ورائع. نعم رائع لأن معظم تعاملنا سيكون مع منحنى التوزيع الطبيعي الشهير والسهل ولن نشتت جهدنا بين توزيعات كثيرة وتعقيدات حسابية. وهو أمر عجيب لأننا نقول أن المتغير الذي نقيسه لا يتبع التوزيع الطبيعي ثم نقول أنه يمكننا أن نستخدم التوزيع الطبيعي.

دعنا نفكر في الأمر. افترض أن الطول موزع بانتظام بين 10 و20. ما الذي يحدث عندما نأخذ 50 عينة عشوائية ثم نحسب المتوسط؟

إننا لو رسمنا توزيع الطول لهذه العينة لوجدناه يتبع التوزيع المنتظم. ولكننا لا نفعل ذلك. إننا نحسب متوسط الطول أي نحصل على متوسط 50 قطعة. ما الذي يحدث مع العينة الثانية ثم الثالثة ثم الرابعة. لا نتوقع أن يكون متوسط العينات متساو تماما ولكن نتوقع أن يكون متأرجحا حول قيمة ما هي قيمة المتوسط لكل القطع المنتجة. ولكن هل شكل هذه المتوسطات أي توزيعها سيكون منتظما؟ لا إنه يتبع التوزيع الطبيعي. لماذا؟ لأنك لو أخذت العينات بشكل عشوائي فإن متوسطها سيكون متأرجحا حول متوسط كل العينات أو كل القطع المنتجة خلال عدة أيام.

(المزيد…)

Read Full Post »

تعرفنا على التوزيع الطبيعي ولكن التوزيع الطبيعي ليس وحيدا فهناك توزيعات أخرى مثل التوزيع المنتظم والأسي. فعندما نجمع البيانات ونرسم المدرج التكراري قد نجد أنها تتبع التوزيع الطبيعي أو غيره. في هذه المقالة نتعرف على توزيعات احتمالية أخرى. وهذه التوزيعات الاحتمالية ليست حسابات رياضية معقدة ولا هي أمر نظري لا علاقة له بالعمل. هذه التوزيعات الاحتمالية تستخدم في مجالات شتى من مجالات العمل فهي تستخدم لدراسة سرعة الخدمة ومعدل وصول العملاء وتستخدم لتحليل معدل المشاكل في المعدات وتستخدم لمحاكاة أي عملية وتستخدم لدراسة حجم المبيعات. ويمكننا التعامل مع هذه التوزيعات بدون الدخول في تعقيدات رياضية لأنه يمكننا استخدام الحاسوب.

التوزيع المنتظم Uniform Distribution:

التوزيع المنتظم يختلف عن التوزيع الطبيعي في أن احتمالية وقوع المتغير بين أي قيمتين لا يتغير. فلو كان لدينا توزيع منتظم لطول المنتج من 10.5 إلى 11.00 فإن احتمالية أن يكون طول المنتج بين 10.5 و 10.6 تساوي احتمالية أن يكون طول المنتج بين 10.7 و10.8 وهي نفس احتمالية أن يكون طول المنتج بين 10.8 و10.9 وهكذا. فالتوزيع منتظم ولا يزداد في المنتصف كما في حالة التوزيع الطبيعي.

التوزيع المنتظم هو توزيع يبين أن المتغير يقع بين قيمتين محددتين هما أ و ب. فالرسم أعلاه يبين أن هذا المتغير يقع بين 12 و25 فهو لا يقل عن 12 ولا يزيد عن 25. ويبين كذلك أن وقوع المتغير بين قيمتين مثل 12و 14 تساوي احتمالية وقوع المتغير بين 17 و19 أو بين 21 و23 وهكذا. والمساحة تحت المنحنى كما هي الحالة في منحنى التوزيع الطبيعي تساوي 1 ولذلك فإن الخط الأعلى عند

1 / (ب – أ)

وهو في هذه الحالة = 1/ (25 – 12) =0.08.

المتوسط في منحنى التوزيع المنتظم يساوي (أ + ب) / 2 وهو في هذه الحالة يساوي (12 + 25) / 2 = 18.5. أما الانحراف المعياري فيساوي الجذر التربيعي لـ (ب – أ) 2 / 12 وهو في هذه الحالة يساوي 3.75.

(المزيد…)

Read Full Post »

ناقشنا في المقالة السابقة منحنى التوزيع الطبيعي القياسي وهو منحنى له متوسط يساوي صفر وانحراف معياري يساوي 1. ويستخدم هذا المنحنى كوسيلة لتحديد المساحة تحت أي منحنى توزيع طبيعي والتي تمثل احتمالية أن يأخذ المتغير قيما في مدى محدد. نستكمل في هذه المقالة استعراض منحنى التوزيع الطبيعي القياسي فنناقش أنواع جداول منحنى التوزيع الطبيعي القياسي والتي تُعطي المساحة تحت المنحنى لقيم مختلفة لـ Z ثم نستعرض بعض الأمثلة الإضافية لتطبيقات منحنى التوزيع الطبيعي.

أنواع الجداول:

في هذا العصر أصبح من اليسير أن تَحسِب الاحتمالات الخاصة بمنحنى التوزيع الطبيعي باستخدام الحاسوب ولكن في نفس الوقت قد تحتاج أن تستخدم الجداول. وهناك أكثر من أسلوب عرض لهذه الجداول.  فبعض هذه الجداول يعطيك المساحة على يسار القيمة فمثلا عند قيمة Z=0 يعطيك 0.5 لأن المتوسط يقسم المساحة إلى نصفين متماثلين وبالتالي فالمساحة على يمين المتوسط تساوي 0.5 لأن المساحة الكلية تحت المنحنى القياسي تساوي 1. الشكل التالي يبين مفهوم هذا الجدول. فالرقم المناظر لقيمة Z=1 هو 0.8413 وهو المساحة الكلية على يسار Z=1.

(المزيد…)

Read Full Post »

تعرفنا في المقالة السابقة على منحنى التوزيع الطبيعي وخصائصه. في هذه المقالة نلقي المزيد من الضوء على التوزيع الطبيعي وذلك باستعراض التوزيع الطبيعي القياسي.

التوزيع الطبيعي القياسي (المعياري) ؟

كما تعلم فإن منحنى التوزيع الطبيعي يُعرَّف بالمتوسط µ والانحراف المعياري σ. وقد يأخذ المتوسط أي قيمة ويأخذ الانحراف المعياري أي قيمة موجبة. أما منحنى التوزيع الطبيعي القياسي Standard Normal Distribution فهو توزيع طبيعي له متوسط يساوي الصفر وانحراف معياري يساوي واحد.

ويستخدم  منحنى التوزيع الطبيعي القياسي لتحديد احتمالية أن يأخذ متغيرا يتبع التوزيع الطبيعي قيما في مدى محدد. افترض أننا ندرس متغير ما مثل أخطاء الإنتاج اليومية أو أطوال مجموعة من الناس أو زمن عملية ما ووجدنا أنه يتبع توزيعا طبيعيا بمتوسط يساوي 35 وانحراف معياري يساوي 2 ونريد أن نقدر احتمالية أن تكون قيمة هذا المتغير أكبر من 40. إننا بحاجة لجداول تبين المساحة تحت هذا المنحنى لأن هذه المساحة -كما بينا في المقالة السابقة- تعبر عن الاحتمالات. وبالتالي فإننا سنحتاج جدول لكل منحنى توزيع طبيعي وهذا أمر معقد جدا. لذلك فإننا نستخدم معادلة بسيطة لتحويل قيمة المتغير لمنحنى التوزيع القياسي وبالتالي يمكننا استخدام جدول واحد فقط وهو منحنى التوزيع الطبيعي القياسي.

(المزيد…)

Read Full Post »

المدرج التكراري Histogram هو من الأدوات الشهيرة في تحليل البيانات لبساطته وتوضيحه لتوزيع البيانات. والكثير من التحاليل الإحصائية تبدأ برسم المدرج التكراري لمعرفة توافق توزيع البيانات الحقيقي مع بعض التوزيعات المعروفة مثل التوزيع الطبيعي Normal Distribution. ولهذا الأمر ارتباط بخرائط المراقبة لذلك فضلتُ أن أخصص هذه المقالة لمناقشة المدرج التكراري ثم المقالة التالية لمناقشة منحنى التوزيع الطبيعي ثم نستكمل الرحلة بمشيئة الله مع خرائط المراقبة (الضبط).

المدرج التكراري

المدرج التكراري هو أحد الرسومات البيانية التي تعطي معلومات غزيرة في شكل بسيط. فهو يمكنك من فهم البيانات وتوزيعها وبالتالي يمكننا من تحليل البيانات والوصول إلى قرارات إدارية مهمة. دعنا نستعرض مثالا يوضح الأمر.

افترض أننا سجلنا أعمار مجموعة من الناس خرجوا في رحلة جماعية وكان عددهم 40 شخصا. وبعد جمع البيانات أحببنا أن نعرف عدد الناس الذين سنهم أقل من 10 سنوات وهؤلاء الين سنهم بين 10 و20 عاما ثم بين 20 و30 وهكذا. نقوم بوضع البيانات في جدول كالتالي حيث يمثل العمود الأيسر الشريحة العمرية والعمود الأيمن يمثل عدد الناس فس كل شريحة:

وبعد ذلك يمكننا رسم هذا الجدول في رسم هو ما يسمى بالمدرج التكراري. كل عمود من هذه الأعمدة يبين عدد الناس الذين يقعون في هذه الشريحة العمرية. بنظرة سريعة يمكنك أن تدرك أن معظم هذه المجموعة من الفئة العمرية المتوسطة أي بين العشرين والخمسين. ومن الملاحظ أن هناك قلة متساوية تقريبا من الفئات العمرية الصغيرة والكبيرة. ومن الواضح أن أكبر فئة عمرية هي بين الثلاثين والأربعين. ولاشك أن هذه معلومات مهمة نحصل عليها من الشكل بسرعة وسهولة.

(المزيد…)

Read Full Post »

ناقشت في المقالة السابقة بعض الأرقام الإحصائية التي تستخدم لتلخيص مجموعة من البينات وللمقارنة بين فترات مختلفة. نستكمل في هذه المقالة الحديث فنناقش بعض الأرقام التي تعطينا بعض المعلومات الإضافية عن البيانات.

Numbers

القيمة القصوى والقيمة الدنيا Maximum and Minimum: القيمة القصوى هي أكبر قيمة في مجموعة البينات والقيمة الدنيا هي أقل قيمة.

مثال: تم قياس الوقت الذي تستغرقه عملية ما عشر مرات وكانت البيانات كالتالي:

17، 13، 16، 16، 14، 13، 11، 15، 18،  17 ثانية

في هذه الحالة تكون القيمة القصوى هي 18 والقيمة الدنيا هي 11 ثانية. وهذه المعلومة تجعلنا نتصور التغير الذي يحدث في وقت العملية. فهناك فارق بين أن يكون وقت العملية يتراوح بين 11 و18 ثانية وأن يكون يتراوح بين 8 و21 ثانية أو 13 و16 ثانية.

(المزيد…)

Read Full Post »

الإدارة السليمة تعتمد على المعلومات السليمة ولذلك فإن المديرين يحتاجون أن يتعاملوا مع البيانات وأن يستنبطوا منها معلومات تساعدهم على اتخاذ القرارات. على الجانب الآخر فإن المهندسين الصناعيين يستخدمون البيانات في دراساتهم لتحسين العمليات وهم يستخدمون أدوات متقدمة لتحليل البيانات.

أحاول في هذه المقالة والمقالات التالية تقديم بعض الأساليب البسيطة لتلخيص البيانات واستخراج معلومات مفيدة منها.

تلخيص البيانات

افترض أنك حصلت على معلومات حول درجات الطلاب في الامتحان أو درجات حرارة الجو في في كل يوم خلال شهر ما أو حجم المبيعات في كل شهر خلال العام أو عدد العيوب في المنتج خلال فترات دورية أو ما شابه ذلك. كيف يمكننا شرح هذه البيانات باستخدام عدد قليل من الأرقام؟ كيف يمكننا التعليق على هذه البيانات ومقارنتها ببيانات فترة أو فترات سابقة؟ قد يتبادر لذهنك المتوسط الحسابي وهو فعلا أحد وسائل وصف البيانات ولكن هناك أرقاما اخرى تصف لنا هذه البيانات.

المتوسط الحسابي Average or Mean: المتوسط الحسابي هو من الأرقام التي يشيع استخدامها نظرا لبساطته ولكونه مؤشرا عاما يمكن أن يعبر عن كل البيانات. ولكن المتوسط الحسابي لا يعبر تعبيرا كاملا عن البيانات ولذلك فإن هناك أرقاما أخرى لها أهميتها.

المتوسط الحسابي سهل في حسابه فهو حاصل قسمة مجموع البيانات على عددها. على سبيل المثال لو كانت البيانات عبارة عن درجة حرارة الجو خلال ست ساعات وكانت درجة الحرارة في كل ساعة كالتالي:

105، 107، 111، 108، 104، 109

فإن المتوسط الحسابي يكون (105+107+111+108+104+109)\6=  644\6=  107.3 درجة مئوية

وهكذا فإننا نستطيع أن نقول إن درجة الحرارة المتوسطة خلال الست ساعات هي 107.3 درجة مئوية. هذا الرقم يعطينا انطباعا عاما عن درجة الحرارة خلال الفترة كلها. ويمكننا استخدام هذا الرقم لمقارنة درجة حرارة اليوم بالأمس.

(المزيد…)

Read Full Post »

%d مدونون معجبون بهذه: