المدرج التكراري Histogram هو من الأدوات الشهيرة في تحليل البيانات لبساطته وتوضيحه لتوزيع البيانات. والكثير من التحاليل الإحصائية تبدأ برسم المدرج التكراري لمعرفة توافق توزيع البيانات الحقيقي مع بعض التوزيعات المعروفة مثل التوزيع الطبيعي Normal Distribution. ولهذا الأمر ارتباط بخرائط المراقبة لذلك فضلتُ أن أخصص هذه المقالة لمناقشة المدرج التكراري ثم المقالة التالية لمناقشة منحنى التوزيع الطبيعي ثم نستكمل الرحلة بمشيئة الله مع خرائط المراقبة (الضبط).
المدرج التكراري
المدرج التكراري هو أحد الرسومات البيانية التي تعطي معلومات غزيرة في شكل بسيط. فهو يمكنك من فهم البيانات وتوزيعها وبالتالي يمكننا من تحليل البيانات والوصول إلى قرارات إدارية مهمة. دعنا نستعرض مثالا يوضح الأمر.
افترض أننا سجلنا أعمار مجموعة من الناس خرجوا في رحلة جماعية وكان عددهم 40 شخصا. وبعد جمع البيانات أحببنا أن نعرف عدد الناس الذين سنهم أقل من 10 سنوات وهؤلاء الين سنهم بين 10 و20 عاما ثم بين 20 و30 وهكذا. نقوم بوضع البيانات في جدول كالتالي حيث يمثل العمود الأيسر الشريحة العمرية والعمود الأيمن يمثل عدد الناس فس كل شريحة:
وبعد ذلك يمكننا رسم هذا الجدول في رسم هو ما يسمى بالمدرج التكراري. كل عمود من هذه الأعمدة يبين عدد الناس الذين يقعون في هذه الشريحة العمرية. بنظرة سريعة يمكنك أن تدرك أن معظم هذه المجموعة من الفئة العمرية المتوسطة أي بين العشرين والخمسين. ومن الملاحظ أن هناك قلة متساوية تقريبا من الفئات العمرية الصغيرة والكبيرة. ومن الواضح أن أكبر فئة عمرية هي بين الثلاثين والأربعين. ولاشك أن هذه معلومات مهمة نحصل عليها من الشكل بسرعة وسهولة.
فالشكل أعلاه يشبه المدرج أو السلم ومن هنا سمي بالمدرج. وهو يبين تكرار قيمة ما بين مجموعة البيانات فهو في هذا المثال يبين تكرار كل فئة عمرية بين مشتركي الرحلة ولذلك سمي بالتكراري.
افترض أننا قمنا بنفس التحليل ولكن لعينة من 200 فرد من العاملين في مؤسسة ما. انظر إلى الشكل التالي.
هل يمكنك التعليق على ذلك؟ بالطبع لا يوجد أطفال ولا يوجد من تعَدَّوا الستين. هل ترى مشكلة لدى هذه المؤسسة؟ هل المستقبل يبدو مشرقا لهذه المؤسسة؟ لابد أنك لاحظت مشكلة في التوزيع العمري للعاملين فأكبر شريحة هي الشريحة بين الخمسين والستين أي الشريحة التي من المفترض أن تتقاعد في السنوات المقبلة. من الواضح ضعف التعويض من الشباب وبالتالي فهناك خطورة في ضعف أداء العاملين فجأة نتيجة لتقاعد أكثر من 30% من العاملين خلال السنوات العشر المقبلة. معلومات إدارية مفيدة استنتجناها بمجرد النظر لهذا الرسم.
انظر للمدرج التكراري التالي والذي يبين نتيجة قياس زمن تصنيع منتج ما داخل نفس الشركة:
هل تلاحظ شيئا؟ إن هناك منطقتان تتركز فيهما معظم القراءات. فيبدو كأن زمن التصنيع في الغالب حوالي 3 دقائق أو حوالي 9 أو 10 دقائق. أليس هذا غريبا؟ بلى إنه لغريب فالطبيعي أن تكون هناك قيمة متوسطة في المنتصف تقريبا فمثلا يكون الزمن الغالب هو 5 دقائق وأحيانا يقل أو يزيد عن 5. فما معنى ظهور الشكل هكذا؟ إن هذا يبين أن هناك حالتين لهذا المنتج وفي إحداهما نستغرق ما يقترب من 3 دقائق وفي الأخرى نحتاج حوالي 10 دقائق. فما هما الحالتان؟ هذا سؤال علينا كمديرين أو محللين أن نبحث عنه. ربما يكون هناك ماكينتان للإنتاج إحداهما جيدة والأخرى سيئة أو أن بعض العمال يستخدم طريقة محددة في العمل والبعض الآخر يستخدم طريقة أخرى أو أننا نستقبل نوعين من المواد الخام فإحداهما سهلة التصنيع والأخرى صعبة التصنيع. أمور مهمة جدا بدأنا نفكر فيها ونبحث عنها بمجرد النظر للمدرج التكراري.
انظر للمثال التالي الذي يبين نسبة ذكاء مجموعة من الأطفال.
ما هو أوضح شيء في هذا المدرج التكراري؟ إن توزيع نسب الذكاء متساوية من صفر إلى مائة بالمائة. ربما لا يبدو مقنعا ولكن هذا ما نفهمه من هذا المثال الافتراضي. فلو صح ذلك فمعنى هذا أنه لا توجد نسبة ذكاء غالبة بل إن ذكاء هؤلاء الأطفال موزع بالتساوي طريقا بين كل نسب الذكاء. بل يمكن أن تقول إن احتمالية أن يكون ذكاء أي طفل في هذا المجتمع 90% هي كاحتمالية أن يكون ذكاؤه 10% وهي كاحتمالية أن يكون ذكاؤه 40 أو 70%. فالمدرج التكراري يجعلنا نتصور احتمالية حدوث قيمة محددة.
انظر إلى المدرج التكراري الآتي الذي يبين زمن تنفيذ طلبات شراء المواد الخام أي الفترة الزمنية بالأيام من وقت الطلب لوقت وصول المواد. ماذا تلاحظ؟
هل رسم هذا الشكل يفيدنا كمديرين أو كمهندسين صناعيين نحاول تطوير العمليات؟ إن أول ما تلاحظه أن الشكل ليس متماثلا وأن هناك طلبات شراء قليلة تستغرق وقتا طويلا جدا. فبينما تجد أن 10 طلبات يتم تنفيذها في أقل من 10 أيام فإن 3 طلبات يتم تنفيذها في حوالي 100 يوم. ومن الملاحظ أن أكثر الطلبات يتم تنفيذها في حوالي 20 إلى 50 يوما. من هنا يمكننا فهم زمن التقدم Lead Time لطلبات الشراء.
قارن بين الشكل السابق والشكل التالي:
أيهما أفضل من الناحية الإدارية لمؤسسة ما؟ إن الفارق بينهما ضئيل ولكنه مهم. فعلى الرغم من أن معظم الطلبات يتم تنفيذها في حوالي 20 إلى 50 أو 60 يوما في كلا الحالتين فإن الشكل الثاني أفضل لأن مدى التغير أقل. ففي الحالة الثانية لا يوجد طلبات شراء تستغرق أكثر من 70 يوما بينما في الحالة الأولى هناك طلبات شراء يتم تنفيذها في مائة يوم. فالمدرج التكراري يساعدنا على مقارنة حالتين أو أكثر لنرى الصورة بوضوح.
هناك استخدامات متنوعة للمدرج التكراري فيمكن استخدامه لرسم عدد الأعطال أو عدد عيوب الجودة في كل أسبوع أو كل شهر ويمكن استخدامه لرسم حجم المبيعات شهريا.
كيف نرسم المدرج التكراري؟
افترض أننا جمعنا مجموعة بيانات مثل أعمار الناس أو أطوالهم أو عدد العيوب في الإنتاج كل ساعة أو درجات الطلبة أو تقييم الموظفين أو غير ذلك. ونريد أن نرسم المدرج التكراري لكي نحلل هذه البيانات. هناك طريقتان:
الطريقة الأولى:
1- حدد المدى أي الفرق بين أكبر قيمة وأقل قيمة. فمثلا أقل درجة وأعلى درجة أو الفرق بين أقصر شخص في المجموعة وأطول شخص وهكذا حسب نوع البيانات التي نقيسها.
2- قسِّم هذا المدى إلى عدة أقسام. في المثال الأول قسمنا المدى إلى عدة أقسام تمثل كل منها شريحة قدرها عشر سنوات. عملية التقسيم تتطلب توازنا بحيث لا نقسم لأقسام صغيرة جدا فيصبح المدرج التكراري غير واضح خاصة في حالة صغر عدد الملاحظات أو صغر العينة، وألا نجعلها كثيرة جدا بحيث يكون المدرج التكراري غير واضح. فلو قسمنا الأعمار في المثال الأول إلى أقسام بحيث يمثل كل قسم عامين فقط فإننا سنجد أن هناك فراغات في المدرج التكراري نتيجة لأنه ليس هناك أحد في هذه المجموعة يقع سنه في هذه الشريحة. ولو قسمنا المدى إلى ثلاثة أقسام مثلا فسننتهي بثلاثة أعمدة لا تساعدنا حقيقة على فهم البيانات. وأتصور أن عدد الأعمدة يفضل أن يكون بين خمسة وعشرة للبيانات القليلة مثل درجات نجاح 50 طالبا، وربما يزيد إن كان لدينا بيانات كثيرة مثل درجات نجاح ألف طالب.
3- قم بحصر عدد القراءات التي تقع في كل شريحة. فمثلا قم بحصر عدد الأفراد أقل من 10 سنين ثم عدد الأفراد بين 10 و20 سنة وهكذا.
4- ضع نتيجة الحصر في جدول كما في أعلى المقالة.
5- ارسم رسم بياني يعبر عن هذا الجدول. يمكن رسم الجدول يدويا أو باستخدام الحاسوب.
الطريقة الثانية:
الخطوتان الأوليان لا يتغيران. فنبدأ بتحديد مدى القراءات ثم تقسيمها لأقسام. بعد ذلك نستخدم برنامج إكسل أو كالك (في المكتب المفتوح). افترض أن البيانات هي لأعمار مجموعة من الناس.
3- اكتب حد كل قسم في خلية كما بالشكل.
4- استخدم الدالة Frequency لكي يقوم الحاسوب بحصر بيانات كل شريحة بدلا من أن تفعل ذلك بنفسك. ظلل الخلايا المجاورة للخلايا التي سجلت فيها مدى كل شريحة كما بالشكل
صفحات أخرى:
نظرية الحد المركزية … Central Limit Theorem
خرائط المراقبة … Control Charts
من مراجع المقالة:
Lean Six Sigma Pocket ToolBook, George at al., McGraw Hill, 2005
Operations Management, Russel & Taylor, 3rd Edition, Prentice Hall, 2000
هل لابد ان يكون العمود الاول ملتصق بالمحور الصادي ولا ممكن لا
في الحقيقة لا اذكر الان….يمكنك ان تجربي
شكرا علي هذا المجهود الكبير في الشرح الوافي المتكامل السهل الذكي الخبير
الف تحية وإحترام … للجهود الكريمة .
شكرا
مشكور والله يجزيك كل الخير استفدت
جـــــــــــــــــــــــــــــزاك الله خير ،كنت مرررررررررره محتاجه الله يوفقك…
للأسف الشرح غير واضح من ناحية التقسيم classification
جميع الكتّاب العرب آخفقوا فيها / اعتذر عن عدم المجاملة !
فالصراحة اولى بأن تُظهر العيوب لتجنبها وتصحيحها فيما بعد
شكرا على هذا الرأي
اخواني ساعدوني بسرعه الله يرضى عليكم ::
وضح متي يكون أستعمال المدرج التكراري أكتر فائده من استعمال جدول البيانات الفردية ؟
الموضوع مستعجل شوي
المدرج التكراري يساعدنا على معرفة توزيع لبيانات أي كم بالمائة يقع بين قيمة كذا وكذا، أما الجداول فهي تعرض البيانات فقط.
شكرا
متى تكون لدينا جداول نسبة التوزيع فيها اقل من 25% ؟ وما الحل ؟
الأستاذ جمال
مع الأسف لم أفهم السؤال. ما هي المشكلة إذا كان بعض الفئات له نشبة قليلة؟ رجاء التوضيح
شكرا
الله يجزاك الجنة يارب ويسقيك من حوض الرسول آمين
جعلها انشاء الله في موازين حسناتك
جزاك الله خيرا
جزاك اللعه خيرا على المعلومات الرائعة واطلب منكم وضع معادلة المنحنى الطبيعي وطريقة استنتاج معادلته وشرح توزيعات المعاينة وما فائدة العينات من المجتمعات الاحصائية الكبيرة وشكرا جزيلا جزاكم الله عنا كل خير
الأستاذ باسل
شكرا على اهتمامك بهذه المقالة. إن شاء الله أضيف لهذه المواضيع الإحصائية من آن لآخر.
شكرا
جزاك الله خيرا
مشكور اخوي
لو سمحت انا ادرس طب سنة اولى وعندنا مادة بيوستات عن التوزيع الطبيعي والمنحنيات ……..الخ
ما تعرف من وين اقدر احصل على نماذج اسئلة اتدرب واكون شاكر لك
الأستاذ محمد
هناك كتب عديدة في الإحصاء وربما تجد بعض المواقع
شكرا
بارك الله فيك
السلام عليكم
أردت فقط التنويه أن العنوان الفرعي “التوزيع التكراري” كان فيه خطأ في الطباعة علما بأن العنوان الرئيسي في بداية المقال لم يكن فيه هذا الخطأ وهو (Histohramعوضا عن Histogram) وجزاكم الله خيرا على المقال.
الأستاذة زينب
وعليكم السلام ورحمة الله
أشكرك فعلا على التنبه لهذا الخطأ وقد صححته بالفعل.
شكرا
الاستاذ سامح لك اجزل الشكر والتقثدير
Dear Sameh,
Appreciated highly yr good efforts.
Jazak Allah Khayraa
Khaled Hammad
جزاكم الله خيرا ……… 🙂