القياس محكي المرجع
Criterion-Referenced Measurement
مقدمة
وجه علماء القياس التربوي جل اهتماهم في السنوات الاخيرة الماضية الى زيادة فاعلية المنظومة التعليمة وقياس نواتجها وقد كثر بينهم الجدل والنقاس حول افضل طرق واساليب تقويم تحصيل الطلاب وقياس فعلية البرامج التعليمية وانقسم هولاء العلماء الى فريقين فريق يؤديد استمرار استخدام الاختبارات المقننه التي يطلق عليها احياناً الاختبارات جماعية المرجع ويرمز لها اختصاراً بالحروف الانكليزية NRTs وفريق يعارض بل ويهاجم استمرار استخدام هذا النوع من الاختبارات او على الاقل يرى ان يقتصر استخدامها على العرض الاساس الذي بنيت من اجله، وقد تبنى الفريق الثاني معارضته على ان هذه الاختبارات (التوصيلية المقننه) لا تقيس الاهداف التعليمية التي يسعىالمعلم الى تحقيقها في الفصل المدرسي حتى يستطيع المعلم ان يسير الوسائل المعالجة ورفع كفاءة العملية التعليمية.
ولهذا السبب وضع جليزر (Claser) مدخل اخر لقياس نواتج التعليم اطلق عليها اسم ((القياس محكي المرجع)) وقد وضع جليزر نوعين من القياس احدهما القياس جماعي المرجع وينركز الاهتمام فيه على التريب الفرد بالسنبة لاقرانه في القدرة التي يقيسها الاختبار والاخر هو القياس محكي المرجع الذي يهدف الى موازنه اداء الفرد بمستوى اداء مطلق او مستوى كفاية معين دون الحاجه الى موازنة ادائه باداء الافراد الاخرين.
ويعتبر كتاب جميس بابام (Popham) عن الاختبارات محكية المرجع الذي نشره عام 1987 اول كتاب متكامل عن القياس محكي المرجع وتلى ذلك صدور عدة كتب اهمها كتاب (Berk).
تعريف الاختبارات محكي المرجع
اختبار محكي المرجع: هو ذلك اختبار الذي يستخدم لتقرير اداء الفرد في نطاق السلوك (Behavioral Domain) محدد تحديداً جيداً، اي ان عبارة التحديد للنطاق السلوكي هي الركيزه الاساسية لهذا المفهوم.
ويعتمد تحديد النطاق السلوكي على عدد الاهداف او المهارات المطلوب قياسها. وهذا ييتطلب صياغة الاهداف في عبارة سلوكية اي في عبارات تصف التغير احداثه في سلوك الطالب نتيجه ممارسته للخبرة التعليمة بحيث يمكن ملاحظة هذا الساوك وقياسه.
وتختلف درجة هذا التحديد بحسب نوع ومحتوى النطاق السلوكي ومدى تعقد الأهداف التي ستمل عليها لذلك لا نعجب اذا وجنا اسناء مختلفة تشير الى الاختبارات محكية المرجع CRTs في ادبيات القياس المعاصر.
في الحقيقة يرى كثير من العلماء القياس المعاصر المتميزون من امثال بابام وميلمان (Millman)، وهامبلون (Hambeton) انه لايوجد فرق يذكر بين الاختبارات محكية المرجع و الاختبارات المرجعية لنطاق فكلاهما يتطلب التحديد الدقيق لمواصفات النطاق السلوكي الذي تشتق على اساسه مفرادات اختبار. وبذلك فهم يرون انه يجب ان يصبح المفهومان مفهوماً واحد. ويفضلون التسمية الثانية وهي الاختبارات المرجعة لنطاق. واصبحت المشكلة التي تواجه القائمين ييناء هذا النوع من الاختبارات هي كيفية تحديد النطاق السلوكي تحديد لا يحتمل خلافاً في وجهات النظر او بمعنى اخر اصحبت المشكلة ترتبط بكيفية التوصل الى تكتولوجية متقدمة تساعد على تحديد النطاق السلوكي الذي يقيسه الاختبار اي مجموعه المهام او الاهداف السلوكية المعروفة تعريفاً محدداً ودقيقاً.
بناء الاختبارات القياس محكي المرجع لقياس الجانب المعرفي:
يحتاج بناء الاختبارات محكية المرجع الى اعداد حطة تفصيلية دقيقة قبل البدء الفعلي في كتابة المفرادات.
فالاختبارات محكية المرجع تستخدم عادة في تحدد مستوى اداء كل طالب بالنسبة الى نطاق سلوكي من المعارف والمهارات الاساسية المعرفة تعريفاً دقيقاً دون موازنة هذا الاداء باداء غيره من الطلاب فالنطاق السلوكي يكون بمنزلة (المحكCriterion ) الذي ينتسب اليه اداء الطالب كما سبق وهذا بالطبع يجعل تحديد النطاق السلوكي الذي يقيسه اختبار محكي المرجع.
ان المرحلة الاولى في بناء اختبار محكي المرجع هو نحديد المحتوى المراد قياسه ويعتمد هذه التحديد عع طبيعة وحدود هذا المحتوى فاذا كان المحتوى المرد قياسه محدوداً من وحدة دراسية معينة او موضوع دراسي معالمه واضحة فانه يمكن الاكتفاء بمعرفة مكونات هذه الوحدة او هذا المحتوى.
في الحقيقة لا توجد قاعدة ثابته لتقسيم المحتوى المراد قياسه ولكن يجب ان يسمح هذا التقسيم ببناء اختبار او الاختبارات تكون مفرادتها بمثابة عينه ممثله تمثيلاً كافياً للموضوعات المتخلفة التي يشتمل عليها المحنوى كما يجب مراعاة طبيعة الطلاب المختبرين والفنرة اللازمة لتعليم هذا المحتوى.
المرحلة الثانية: هي مرحلة تحديد الأهداف العامة التي سبقتها الاختبار في اطار ححح الذي تحدد في المرحلة الاولى فلكل ححح الهدف مرتبطه به نود قياس مدى تحقيقها لدى الطلاب.
المرحلة الثالثة: وهي تحليل الأهداف العامة الى الأهداف إجرائية، ونعني بذلك اعادة صياغة الأهداف العامة عن طريق وصف عينه من الأهداف السلوكية التي يمكن ان تتخذ دليلاً عع تحقيق كل هدف من الأهداف العامة. عادة يواجه مصمم الاختبار بعض الصعوبات عند اجراء هذا التهليل وهذا يعتمد عع النطاق السلوكي المراد قياسه.
المرحلة الرابعة: وهي تحديد النطاق السلوكي الذي يقسية الاختبار فالأهداف الاجرائية التي نحصل عليها من التحليل السابق لا تكون واضحة بدرجة تسمح بتحديد النطاق مفرادات الاختبار التي تقيس السلوك المطلوب.
المرحلة الخامسة: وهي تكوين مفرادات الاختبار. ويمكن تقسيم هذه المرحلة الى ثلاث خطوات:
(1) احتبار انواع المفرادادت المناسبه لقياس الأهداف.
بعد تحديد مواصفات النطاق السلوكي يجب اختيار افضل انواع المفردات التي تقيس السلوك الذي تم تحديده في المواصفات الخاصه لكل هدف فمن المعلوم ان بعض انواع المفردات صلح لقياس اهداف معينة بدرجة افضل من عيرها.
فمثلاً تصلح مفردات الاختبار من متعدد، و مفردات المزاوجة، ومفردات الخطا والصواب لقياس التذكر والفهم احياناً التطبيق بينما تصلح مفردات المقال لقياس القدرة عع تنظيم المعلومات والاستنتاج والتفسير مراعاة صياغة الافكار.
(2) تحديد العدد المناسب من المفردات.
وفي هذه الخطوه نحاول تحديد العدد المطلوب من مفردات الاختبار التي تقيس الاهداف الممثلة في النطاق السلوكي الذي سبق تحديده ويجب مراعاة العوامل التالية عند انخاذ القرار في هذا الشان.
(أ) العلاقة بين عدد المفردات، وبين الاهمية النسبية للنطاق السلوكي المراد قياسه.
(ب) العلاقة بين عدد المفردات والحد الادنى للشات المطلوب.
ففي حالة الاختبار جماعية المرجع تستخدم لمعادلة العامة لبيرمان لتقدير معامل الاختبار.
(ج) العلاقة بين عدد المفردات وزمن تطبيق الاختبار.
وتعتمد على الزمن اللازم لتطبيق الاختبار وهذه تعتمد على نوع مفردات الاختبار المستخدمة وعلى خصائص الافراد المختبرين.
بناء مفردات الاختبارات القياس محكية المرجع:
الخطوه الرئيسة في بناء الاختبارات والبقايا لسلوك محكية المرجع هي اجراء عملية تحليل لمفرادتها تؤدي الغرض الذي صممت من اجله ويمكن تقسيم هذه الاغراض الى قسمين:
(1) قياس الاهداف التعليمية او السليوكية.
(2) التميز بين الافراد الذين انتقوا هدفاً تعلبماً معيناً والافراد الذين لم يتنقوا ذلك الهدف.
وتقدير صدق المفردات في هذين الفرضين يعتمد على نتائج نوعين مختلفين من التحليلات.
النوع الاول:
يختص بتحديد مدى مطابقة كل مفردة للهدف الذي تقيسه، أي تحديد درجة العلاقة بين كل مفردة والنطاق السلوكي الذي تنشق منه المفردة ويمكن اجراء ذلك باستخدام احدى الطرق التالية:
الطريقة الاولى: معامل تجانس المفردة.
الطريقة الثانية: طريقة المزاوجة.
الطريقة الثالثة: طريقة التمايز اللغوي.
الطريقة الاولى: معامل تجانس المفردة:
للحصول على قيمة تقديرة للاتفاق بين مجموعة من المحكمين حول ما اذا كانت المفردة تقيم بعداًُ معيناً ولا تقيس ابعاداً اخرى يمكن استخدام معامل تجانس المفردة الذي اقتراحه كا من روفينيلي وهامبلون ولاجراء ذلك يمكن تجميع الاهداف التي يقيسها الاختبار في مجموعات متجانسة من حيث المحتوى وتصميم استماره تكتب منها مجموعات الاهداف على يمين الصفحة و مفردات الاختبار الخاصة بهذه الاهداف على يسار الصفحة وتكتب على يمين الصفحة ارقام تناظر ارقام الاهداف وتترك بعض الفراغات على يمين هذه الارقام ثم يطلب من مجموعة من الخبراء (المحكمين) كل على حده ان:
1) يعين الرقم (+1) في الفراغ المناسب اذ كان متاكد ان المفردة لا تقيس الاهداف الاخرى التي في نفس التجمع والرقم (صفر) اذا كان غير متاكد والرقم (-1) اذا كان متاكد ان المفردة تقيس اكثر من هدف واحد في نفس التجمع.
ثم تكون مصفوفة تشمل على (م) من الصفوف التي تناظر عدد المحكمين (ن) من الاعمدة التي تناظر عدد الاهداف في تجمع معين، وتتكون خلايا هذه المصفوفة من تقديرات (م) من المحكمين للمفردة التي ترتيبها (د) على انها تقيس (ن) من الاهداف. وبالطبع تكون مصفوفة لكل المفردة يشتمل عليها الاختبار.
ومن ثم هناك معادلة احصائية يمكننا من الحصول على تقدير صدق محتوى الاختبار
الطريقة الثانية: طريقة المزاوجة.
يمكن استخدام طريقة اخرى في تقدير محتوى الاختبارات محكية المرجع وتعتمد هذه الطريقة الى اعداد قائمتين احدهما تشتمل على مفردات الاختبار والاخرى تشمل على الاهداف او مواصفات الاختبار وتعرض هاتان القائمتان على مجموعة من المحكمين ويطلب من كل منهم ان يتزاوج بين الهدف والمفردة التي تقيسه اذا وجدت ثم تكون جدول مزاوجة او اقتران بين مفردات والاهداف او المواصفات.
يمكن تحلبيل البيانات التقديرية في هذا الجدول باستخدام مربع كاي (x2) لمعرفة استقلالية التقديرات.
الطريقة الثالثة: طريقة التمايز اللغوي.
حيث تستخدام هذه الطريقة في جمع وتحليل تقديرات المكمين حول مدى التطابق بين مفردات و الاهداف.
والاجراء ذلك تعرض على المحكمين قائمة تشتمل على الهدف المطلوب وجميع مفردات او الاسئلة التي تقيس ذلك الهدف.
كما تقدم لهم استمارة تشتمل على ععد من الموازين المدون على كل منها درجات مختلفة لصفة معينة (Adjective scales) ويطلب من كل محكم ان يقرر أي درجة من درجات الصفة تمثل من وجهة نظره العلاقة بين المفردة والهدف الذي يقيسه.
النوع الثاني
يختص بتحديد العلاقة بين ما تقيسيه المفردة وبين استجاب الطلاب لهذه المفردة. ولذلك يسمى هذا المدخل بالمدخل البعدي (Posteriori Approach) او مدخل تحليل مفردات والحقيقة ان هذا المدخل قد حاز على اهتمام كبير من جانب علماء القياس النفسي والتربوي المعاصر. والدليل على ذلك ان هناك الان ما يقرب من (19) مقياساً او احصائياً، يمكن استخدام منها للحصول على تقدير كمي عن صدق مفردات الاختيار او المقياس محكي المرجع.
اختبار المجموعات المحكمة (Criterion Groups )
نظراً الى ان الاختبارات محكي المرجع تستخدم في كثير من الاحيان بغرض التعرف على الطلاب الذين اتقوا مجموعة من الاهداف والطلاب الذين لم يتقنوا هذه الاهداف لذلك فاننا نهتم واختيار مجموعة من الطلاب الذين يستطعون ان يجيبوا عم مفردات الاختبار اجابه صحيحة، أي مجموعة متقنه Masters ومجموعة اخرى لا تستطيع اجابه عن مفردات أي مجموعة غير متقنة.
وبهذا يمكن استخدام هاتيتن المجموعين من الطلاب في اجراء التحليل المفردات ولكن يجب تحديد المحك الذي يتم على اساسه اختيار المجموعتين وتوجد طريقتان لاجراء ذلك.
(1) طرق تعتمد على القياس قبل وبعد التعليم:
تعتمد هذه الطرق في تحليل المفردات على اختبار مجموعة واحدة من الطلاب مرتين احدهما قبل التعليم والاخرى بعد التعليم.
ويمكن الاختبار الطلاب بنفس مفردات الاختبار في المرتين او اختبارهم في المرة الثانية بمجوعة موازية او مكافئه من ال مفردات وتعتبر هذه الطريقة جزءاً منكاملاً من برانامج التعليم القائم على التمكن والاتقان التي نادي بها بلوك Block وكارول Carroll وبلوم Bloom ويمكن استخدام هذه الطرق في التعرف على مقدار التحسن في اداء كل طالب وكذلك التحسن في اداء المجموعة ككل. ولكن يعاب على طرق القياس القبلي البعدي صعوبة تطبيق الاختبار البعدي لانه يتطلب الانتظار حتى ينتهي الطلاب من الوحدة الدراسية المطلوبة. ويمكن التغلب على هذه المشكلة عن طريق بناء صورتين متكافئتين للاختبار اذا امكن او اطالة الفترة الزمنية التي تفصل بين مرتين التطبيق.
(2) طرق تعتمد على قياس اداء مجموعتين من الطلاب:
وتعتمد هذه الطرق في تحليل المفردات على اختبار مجموعتين من الطلاب في نفس الوقت احدهما لم تتلق التعليم والاخرى تلقت التعليم.
ومن مميزات الطرق التي تعتمد قياس مجموعتين من الطلاب انه يمكن استخدامها في تحليل مفردات الاختبار في وقت واحد. ولكن يعاب على هذه الطرق صعوبة تعريف المحك المناسب الذي يتم في ضوئه اختيار كل من المجموعتين وكذلك مشكلة التاكد من تكافؤ هاتين المجموعتين.
مصادر المحك
من اين ياتي المحك الذي يرجع اليه الاختبار.
حتى يكون لدينا تمرير سليم لاعتبار الاختبار ما الاختبار مرجعاً الى المحك فاننا لابد ان نتبع الخطوات التالية في بنائه وترجبعه.
1- يعد تخطيط محتوى (Content outline) بذكر فيه المهارات والمعرفة التي يعتبر الاختبار محاولة قياسها.
2- يميز الاداءات أي المراحل القابلة للقياس التي سوف يكون المفحوص قادراً عليها مع التسليم بان هذا المفحوص قد اكتسب كفاءة في المهارات والمعرفة المقاسة الاختبار.
3- يميز المجال او النظافة الذي يحدده كل مرمى ويكتب العناصر او البنود في الاختبار وفق التفاصيل المعينة في ذلك المجال او النطاق، ثم يختار عشوائياً عنصرين لكل مرمى ليبنى منها الاختبار.
4- يتاكد من صحة حقيقة ان المهارات والمعرفة المقاسة بالاختبار هي في الواقع لازمة للمرامى الادائية او المرامى السلوكيه المميزه المطلوبة في الخطوة الثانية. وقد يكون هذا هو اكثر جوانب هذه العلمية تغيراً ذلك لان عملية اثبات صدق الاختبار بحكم الشخصي الذاتي.
5- يقرر او يحدد درجة قطع (او درجة قاطعة) او درجة محك تعير عن الاداء على الاختبار الذي يجب ان يحصل عليه المختبر ليظهر انه قد احرز كفاءه المهارات والمعرفة ليكون قادراً على اداء الوان سلوكية محكيه.
ملامح الاختبارات مرجعية المحك
1- انها مؤسسة على عدد من المرامي الادائية او السلوكية والتي تعتبر هذه الاختبار ات محاولة لقيلسها.
2- انها مصممة بحبث لها درجة عالية من الملائمة انها قائمة على مرام ومحتواها يرتبط بمرامها.
3- انها تمثل عينات من السلوك او الاداء الواقعي الحقيقي.
4- انه الاداء عليها يمكن ان يغير في ضوء درجات قاطعة محددة سلفاً.
انشاوها واستعمالاتها
الترجيح الى المحك اكثر مناسبة في تطبيقية في مجال اختبار المهاره واشد صعوبة في تطبيق لقياس السلوك المعقد مثل التفكير وحل المشكلة كما يذهب اليه إبيل (Ebel). حيث استخدام الترجيح الى المحك استخداماً اوسع في قياس التحصيل المدرسي سواء بالنسبة الى الاختبارات التي ينشها المدرس، او الاختبارات المنشورة.
ويستخدم الترجيح الى المحك عن طريقين:
1- وضع، واختبار، مجموعة من المرامي تمثل النواتج المرغوب فيها للتدريس.
2- تصميم عناصر او بنود او اختبارها بحيث تقيس كل مرمى قياساً دقيقاً أي يكون هذه العناصر او البنود ممثلة لنطاق المرمى.
3- الاتحديد المسبق لمستويات اداء مقبوله.
4- اعطاء الاختبار لمجموعة من التلاميذ وتقويم ادائهم في ضوء عدد من المرامي التي يستطيعون اداء ما تتطلبه من اداء بنجاح.
مشكلات المحك
ان طريقة حساب معامل الصدق عن طريق المحات تشير بعض المشكلات في مجال الصدق، لاعلاقة بالاختيار نفسه وانما بالمحك، لان اسلوب استخدام المححكات يفنترض صدقه وان هذا الافتراض يتطلب التاكد منه. وهناك ايضاً مشكله مستوى الارتباط بين الاختيار والمحك المقبول، ويشير مدى تاثير الارتباطين الاختيار والمحك بثبات كل منهما هذه المشكلات يحتم ضرورة تصحيح الارتباط بين الاختيار والمحك.
تحيزات المحك
ان التاكد من صدق المحك عن طريق محك اخر امر غير معقول لانه يقود الى سلسلة من المحكات لكل محك، ولذا فان الصدق المنطقي يمكن ان يؤدي دوره في ذلك وعلى الرغم من ذلك الا اننا نجد بعض التحيزات التي تؤثر في صلاحية المحك وتختلف هذه التحيزات من حيث طبيعتها وفي كيفية تداخلها في المحك وتاثيرها على معامل الصدق وتباين انواع التحيز في درجة تاثيرها حيث توثر بعض عوامل التحيز في معاملات الصدق بينما يكون تاثيرها ضيئلاً على ثبات المحك دون الصدق وعموماً يمكن تصنف عوامل التحيز الى:
(1) عيوب المحك والتي تنتج عن استعادة عناصر من المحك تؤدي الى عدم تكامله كان كونه يرتبط بالاختبار.
(2) فساد المحك ويحدث نتيجة اضافة عناصر داخلية للمحك مثل التقديرات المعلمين او الرؤساء لاداء تلاميذهم او مرؤسيهم وتسرب درجات الاختيار للمحكمين.
(3) تحيز وحدات القياس المحكمة الذي يحدث نتيجة عدم تساوي وحدات القياس في المحك سواء كان ذلك نتيجة لاستخدام محك مركب من عدد من المحكات الفرعية ام استخدام عناصر مختلفة في تمثيلها للسمة التي يقيسها الاختيار.
(4) تشويه المحك ويحدث عند استخدام اوزان غير مناسبة كمكونات للمحك مما يترتب اختلال في دلالة الدرجة الكلية للمحك مقارنة بدرجة الاختيار.
تقدير ثبات الاختيارات محكية المرجع
تعتمد طرق تقدير ثبات الاختيارات جماعية المرجع على مفهوم معامل الارتباط بين متغيرين، لذلك نجد قيمة التكافؤ او قيم معامل الاستقرار او قيم معامل الاستقرار والتكافؤ تزداد تباين درجات الاختيار ويمكن ايضاً استخدام هذه الطرق في تقدير ثبات الاختيارات محكية المرجع اذا كان هناك قدراً معقولاً من التباين في الدرجات اما اذا كان توزيع درجات هذه الاختبارات متجانساً، كما هو الحال في معظم الاحيان، وبخاصة اذا كان البرنامج التعليمي الذي يقاس اثره على تحصيل الطلاب فعالاً فانه يمكننا في هذه الحاله تقدير ثبات الاختبار باستخدام احد المقاييس اللامعلمية مثل معامل فاي (f).
Criterion-Referenced Measurement
مقدمة
وجه علماء القياس التربوي جل اهتماهم في السنوات الاخيرة الماضية الى زيادة فاعلية المنظومة التعليمة وقياس نواتجها وقد كثر بينهم الجدل والنقاس حول افضل طرق واساليب تقويم تحصيل الطلاب وقياس فعلية البرامج التعليمية وانقسم هولاء العلماء الى فريقين فريق يؤديد استمرار استخدام الاختبارات المقننه التي يطلق عليها احياناً الاختبارات جماعية المرجع ويرمز لها اختصاراً بالحروف الانكليزية NRTs وفريق يعارض بل ويهاجم استمرار استخدام هذا النوع من الاختبارات او على الاقل يرى ان يقتصر استخدامها على العرض الاساس الذي بنيت من اجله، وقد تبنى الفريق الثاني معارضته على ان هذه الاختبارات (التوصيلية المقننه) لا تقيس الاهداف التعليمية التي يسعىالمعلم الى تحقيقها في الفصل المدرسي حتى يستطيع المعلم ان يسير الوسائل المعالجة ورفع كفاءة العملية التعليمية.
ولهذا السبب وضع جليزر (Claser) مدخل اخر لقياس نواتج التعليم اطلق عليها اسم ((القياس محكي المرجع)) وقد وضع جليزر نوعين من القياس احدهما القياس جماعي المرجع وينركز الاهتمام فيه على التريب الفرد بالسنبة لاقرانه في القدرة التي يقيسها الاختبار والاخر هو القياس محكي المرجع الذي يهدف الى موازنه اداء الفرد بمستوى اداء مطلق او مستوى كفاية معين دون الحاجه الى موازنة ادائه باداء الافراد الاخرين.
ويعتبر كتاب جميس بابام (Popham) عن الاختبارات محكية المرجع الذي نشره عام 1987 اول كتاب متكامل عن القياس محكي المرجع وتلى ذلك صدور عدة كتب اهمها كتاب (Berk).
تعريف الاختبارات محكي المرجع
اختبار محكي المرجع: هو ذلك اختبار الذي يستخدم لتقرير اداء الفرد في نطاق السلوك (Behavioral Domain) محدد تحديداً جيداً، اي ان عبارة التحديد للنطاق السلوكي هي الركيزه الاساسية لهذا المفهوم.
ويعتمد تحديد النطاق السلوكي على عدد الاهداف او المهارات المطلوب قياسها. وهذا ييتطلب صياغة الاهداف في عبارة سلوكية اي في عبارات تصف التغير احداثه في سلوك الطالب نتيجه ممارسته للخبرة التعليمة بحيث يمكن ملاحظة هذا الساوك وقياسه.
وتختلف درجة هذا التحديد بحسب نوع ومحتوى النطاق السلوكي ومدى تعقد الأهداف التي ستمل عليها لذلك لا نعجب اذا وجنا اسناء مختلفة تشير الى الاختبارات محكية المرجع CRTs في ادبيات القياس المعاصر.
في الحقيقة يرى كثير من العلماء القياس المعاصر المتميزون من امثال بابام وميلمان (Millman)، وهامبلون (Hambeton) انه لايوجد فرق يذكر بين الاختبارات محكية المرجع و الاختبارات المرجعية لنطاق فكلاهما يتطلب التحديد الدقيق لمواصفات النطاق السلوكي الذي تشتق على اساسه مفرادات اختبار. وبذلك فهم يرون انه يجب ان يصبح المفهومان مفهوماً واحد. ويفضلون التسمية الثانية وهي الاختبارات المرجعة لنطاق. واصبحت المشكلة التي تواجه القائمين ييناء هذا النوع من الاختبارات هي كيفية تحديد النطاق السلوكي تحديد لا يحتمل خلافاً في وجهات النظر او بمعنى اخر اصحبت المشكلة ترتبط بكيفية التوصل الى تكتولوجية متقدمة تساعد على تحديد النطاق السلوكي الذي يقيسه الاختبار اي مجموعه المهام او الاهداف السلوكية المعروفة تعريفاً محدداً ودقيقاً.
بناء الاختبارات القياس محكي المرجع لقياس الجانب المعرفي:
يحتاج بناء الاختبارات محكية المرجع الى اعداد حطة تفصيلية دقيقة قبل البدء الفعلي في كتابة المفرادات.
فالاختبارات محكية المرجع تستخدم عادة في تحدد مستوى اداء كل طالب بالنسبة الى نطاق سلوكي من المعارف والمهارات الاساسية المعرفة تعريفاً دقيقاً دون موازنة هذا الاداء باداء غيره من الطلاب فالنطاق السلوكي يكون بمنزلة (المحكCriterion ) الذي ينتسب اليه اداء الطالب كما سبق وهذا بالطبع يجعل تحديد النطاق السلوكي الذي يقيسه اختبار محكي المرجع.
ان المرحلة الاولى في بناء اختبار محكي المرجع هو نحديد المحتوى المراد قياسه ويعتمد هذه التحديد عع طبيعة وحدود هذا المحتوى فاذا كان المحتوى المرد قياسه محدوداً من وحدة دراسية معينة او موضوع دراسي معالمه واضحة فانه يمكن الاكتفاء بمعرفة مكونات هذه الوحدة او هذا المحتوى.
في الحقيقة لا توجد قاعدة ثابته لتقسيم المحتوى المراد قياسه ولكن يجب ان يسمح هذا التقسيم ببناء اختبار او الاختبارات تكون مفرادتها بمثابة عينه ممثله تمثيلاً كافياً للموضوعات المتخلفة التي يشتمل عليها المحنوى كما يجب مراعاة طبيعة الطلاب المختبرين والفنرة اللازمة لتعليم هذا المحتوى.
المرحلة الثانية: هي مرحلة تحديد الأهداف العامة التي سبقتها الاختبار في اطار ححح الذي تحدد في المرحلة الاولى فلكل ححح الهدف مرتبطه به نود قياس مدى تحقيقها لدى الطلاب.
المرحلة الثالثة: وهي تحليل الأهداف العامة الى الأهداف إجرائية، ونعني بذلك اعادة صياغة الأهداف العامة عن طريق وصف عينه من الأهداف السلوكية التي يمكن ان تتخذ دليلاً عع تحقيق كل هدف من الأهداف العامة. عادة يواجه مصمم الاختبار بعض الصعوبات عند اجراء هذا التهليل وهذا يعتمد عع النطاق السلوكي المراد قياسه.
المرحلة الرابعة: وهي تحديد النطاق السلوكي الذي يقسية الاختبار فالأهداف الاجرائية التي نحصل عليها من التحليل السابق لا تكون واضحة بدرجة تسمح بتحديد النطاق مفرادات الاختبار التي تقيس السلوك المطلوب.
المرحلة الخامسة: وهي تكوين مفرادات الاختبار. ويمكن تقسيم هذه المرحلة الى ثلاث خطوات:
(1) احتبار انواع المفرادادت المناسبه لقياس الأهداف.
بعد تحديد مواصفات النطاق السلوكي يجب اختيار افضل انواع المفردات التي تقيس السلوك الذي تم تحديده في المواصفات الخاصه لكل هدف فمن المعلوم ان بعض انواع المفردات صلح لقياس اهداف معينة بدرجة افضل من عيرها.
فمثلاً تصلح مفردات الاختبار من متعدد، و مفردات المزاوجة، ومفردات الخطا والصواب لقياس التذكر والفهم احياناً التطبيق بينما تصلح مفردات المقال لقياس القدرة عع تنظيم المعلومات والاستنتاج والتفسير مراعاة صياغة الافكار.
(2) تحديد العدد المناسب من المفردات.
وفي هذه الخطوه نحاول تحديد العدد المطلوب من مفردات الاختبار التي تقيس الاهداف الممثلة في النطاق السلوكي الذي سبق تحديده ويجب مراعاة العوامل التالية عند انخاذ القرار في هذا الشان.
(أ) العلاقة بين عدد المفردات، وبين الاهمية النسبية للنطاق السلوكي المراد قياسه.
(ب) العلاقة بين عدد المفردات والحد الادنى للشات المطلوب.
ففي حالة الاختبار جماعية المرجع تستخدم لمعادلة العامة لبيرمان لتقدير معامل الاختبار.
(ج) العلاقة بين عدد المفردات وزمن تطبيق الاختبار.
وتعتمد على الزمن اللازم لتطبيق الاختبار وهذه تعتمد على نوع مفردات الاختبار المستخدمة وعلى خصائص الافراد المختبرين.
بناء مفردات الاختبارات القياس محكية المرجع:
الخطوه الرئيسة في بناء الاختبارات والبقايا لسلوك محكية المرجع هي اجراء عملية تحليل لمفرادتها تؤدي الغرض الذي صممت من اجله ويمكن تقسيم هذه الاغراض الى قسمين:
(1) قياس الاهداف التعليمية او السليوكية.
(2) التميز بين الافراد الذين انتقوا هدفاً تعلبماً معيناً والافراد الذين لم يتنقوا ذلك الهدف.
وتقدير صدق المفردات في هذين الفرضين يعتمد على نتائج نوعين مختلفين من التحليلات.
النوع الاول:
يختص بتحديد مدى مطابقة كل مفردة للهدف الذي تقيسه، أي تحديد درجة العلاقة بين كل مفردة والنطاق السلوكي الذي تنشق منه المفردة ويمكن اجراء ذلك باستخدام احدى الطرق التالية:
الطريقة الاولى: معامل تجانس المفردة.
الطريقة الثانية: طريقة المزاوجة.
الطريقة الثالثة: طريقة التمايز اللغوي.
الطريقة الاولى: معامل تجانس المفردة:
للحصول على قيمة تقديرة للاتفاق بين مجموعة من المحكمين حول ما اذا كانت المفردة تقيم بعداًُ معيناً ولا تقيس ابعاداً اخرى يمكن استخدام معامل تجانس المفردة الذي اقتراحه كا من روفينيلي وهامبلون ولاجراء ذلك يمكن تجميع الاهداف التي يقيسها الاختبار في مجموعات متجانسة من حيث المحتوى وتصميم استماره تكتب منها مجموعات الاهداف على يمين الصفحة و مفردات الاختبار الخاصة بهذه الاهداف على يسار الصفحة وتكتب على يمين الصفحة ارقام تناظر ارقام الاهداف وتترك بعض الفراغات على يمين هذه الارقام ثم يطلب من مجموعة من الخبراء (المحكمين) كل على حده ان:
1) يعين الرقم (+1) في الفراغ المناسب اذ كان متاكد ان المفردة لا تقيس الاهداف الاخرى التي في نفس التجمع والرقم (صفر) اذا كان غير متاكد والرقم (-1) اذا كان متاكد ان المفردة تقيس اكثر من هدف واحد في نفس التجمع.
ثم تكون مصفوفة تشمل على (م) من الصفوف التي تناظر عدد المحكمين (ن) من الاعمدة التي تناظر عدد الاهداف في تجمع معين، وتتكون خلايا هذه المصفوفة من تقديرات (م) من المحكمين للمفردة التي ترتيبها (د) على انها تقيس (ن) من الاهداف. وبالطبع تكون مصفوفة لكل المفردة يشتمل عليها الاختبار.
ومن ثم هناك معادلة احصائية يمكننا من الحصول على تقدير صدق محتوى الاختبار
الطريقة الثانية: طريقة المزاوجة.
يمكن استخدام طريقة اخرى في تقدير محتوى الاختبارات محكية المرجع وتعتمد هذه الطريقة الى اعداد قائمتين احدهما تشتمل على مفردات الاختبار والاخرى تشمل على الاهداف او مواصفات الاختبار وتعرض هاتان القائمتان على مجموعة من المحكمين ويطلب من كل منهم ان يتزاوج بين الهدف والمفردة التي تقيسه اذا وجدت ثم تكون جدول مزاوجة او اقتران بين مفردات والاهداف او المواصفات.
يمكن تحلبيل البيانات التقديرية في هذا الجدول باستخدام مربع كاي (x2) لمعرفة استقلالية التقديرات.
الطريقة الثالثة: طريقة التمايز اللغوي.
حيث تستخدام هذه الطريقة في جمع وتحليل تقديرات المكمين حول مدى التطابق بين مفردات و الاهداف.
والاجراء ذلك تعرض على المحكمين قائمة تشتمل على الهدف المطلوب وجميع مفردات او الاسئلة التي تقيس ذلك الهدف.
كما تقدم لهم استمارة تشتمل على ععد من الموازين المدون على كل منها درجات مختلفة لصفة معينة (Adjective scales) ويطلب من كل محكم ان يقرر أي درجة من درجات الصفة تمثل من وجهة نظره العلاقة بين المفردة والهدف الذي يقيسه.
النوع الثاني
يختص بتحديد العلاقة بين ما تقيسيه المفردة وبين استجاب الطلاب لهذه المفردة. ولذلك يسمى هذا المدخل بالمدخل البعدي (Posteriori Approach) او مدخل تحليل مفردات والحقيقة ان هذا المدخل قد حاز على اهتمام كبير من جانب علماء القياس النفسي والتربوي المعاصر. والدليل على ذلك ان هناك الان ما يقرب من (19) مقياساً او احصائياً، يمكن استخدام منها للحصول على تقدير كمي عن صدق مفردات الاختيار او المقياس محكي المرجع.
اختبار المجموعات المحكمة (Criterion Groups )
نظراً الى ان الاختبارات محكي المرجع تستخدم في كثير من الاحيان بغرض التعرف على الطلاب الذين اتقوا مجموعة من الاهداف والطلاب الذين لم يتقنوا هذه الاهداف لذلك فاننا نهتم واختيار مجموعة من الطلاب الذين يستطعون ان يجيبوا عم مفردات الاختبار اجابه صحيحة، أي مجموعة متقنه Masters ومجموعة اخرى لا تستطيع اجابه عن مفردات أي مجموعة غير متقنة.
وبهذا يمكن استخدام هاتيتن المجموعين من الطلاب في اجراء التحليل المفردات ولكن يجب تحديد المحك الذي يتم على اساسه اختيار المجموعتين وتوجد طريقتان لاجراء ذلك.
(1) طرق تعتمد على القياس قبل وبعد التعليم:
تعتمد هذه الطرق في تحليل المفردات على اختبار مجموعة واحدة من الطلاب مرتين احدهما قبل التعليم والاخرى بعد التعليم.
ويمكن الاختبار الطلاب بنفس مفردات الاختبار في المرتين او اختبارهم في المرة الثانية بمجوعة موازية او مكافئه من ال مفردات وتعتبر هذه الطريقة جزءاً منكاملاً من برانامج التعليم القائم على التمكن والاتقان التي نادي بها بلوك Block وكارول Carroll وبلوم Bloom ويمكن استخدام هذه الطرق في التعرف على مقدار التحسن في اداء كل طالب وكذلك التحسن في اداء المجموعة ككل. ولكن يعاب على طرق القياس القبلي البعدي صعوبة تطبيق الاختبار البعدي لانه يتطلب الانتظار حتى ينتهي الطلاب من الوحدة الدراسية المطلوبة. ويمكن التغلب على هذه المشكلة عن طريق بناء صورتين متكافئتين للاختبار اذا امكن او اطالة الفترة الزمنية التي تفصل بين مرتين التطبيق.
(2) طرق تعتمد على قياس اداء مجموعتين من الطلاب:
وتعتمد هذه الطرق في تحليل المفردات على اختبار مجموعتين من الطلاب في نفس الوقت احدهما لم تتلق التعليم والاخرى تلقت التعليم.
ومن مميزات الطرق التي تعتمد قياس مجموعتين من الطلاب انه يمكن استخدامها في تحليل مفردات الاختبار في وقت واحد. ولكن يعاب على هذه الطرق صعوبة تعريف المحك المناسب الذي يتم في ضوئه اختيار كل من المجموعتين وكذلك مشكلة التاكد من تكافؤ هاتين المجموعتين.
مصادر المحك
من اين ياتي المحك الذي يرجع اليه الاختبار.
حتى يكون لدينا تمرير سليم لاعتبار الاختبار ما الاختبار مرجعاً الى المحك فاننا لابد ان نتبع الخطوات التالية في بنائه وترجبعه.
1- يعد تخطيط محتوى (Content outline) بذكر فيه المهارات والمعرفة التي يعتبر الاختبار محاولة قياسها.
2- يميز الاداءات أي المراحل القابلة للقياس التي سوف يكون المفحوص قادراً عليها مع التسليم بان هذا المفحوص قد اكتسب كفاءة في المهارات والمعرفة المقاسة الاختبار.
3- يميز المجال او النظافة الذي يحدده كل مرمى ويكتب العناصر او البنود في الاختبار وفق التفاصيل المعينة في ذلك المجال او النطاق، ثم يختار عشوائياً عنصرين لكل مرمى ليبنى منها الاختبار.
4- يتاكد من صحة حقيقة ان المهارات والمعرفة المقاسة بالاختبار هي في الواقع لازمة للمرامى الادائية او المرامى السلوكيه المميزه المطلوبة في الخطوة الثانية. وقد يكون هذا هو اكثر جوانب هذه العلمية تغيراً ذلك لان عملية اثبات صدق الاختبار بحكم الشخصي الذاتي.
5- يقرر او يحدد درجة قطع (او درجة قاطعة) او درجة محك تعير عن الاداء على الاختبار الذي يجب ان يحصل عليه المختبر ليظهر انه قد احرز كفاءه المهارات والمعرفة ليكون قادراً على اداء الوان سلوكية محكيه.
ملامح الاختبارات مرجعية المحك
1- انها مؤسسة على عدد من المرامي الادائية او السلوكية والتي تعتبر هذه الاختبار ات محاولة لقيلسها.
2- انها مصممة بحبث لها درجة عالية من الملائمة انها قائمة على مرام ومحتواها يرتبط بمرامها.
3- انها تمثل عينات من السلوك او الاداء الواقعي الحقيقي.
4- انه الاداء عليها يمكن ان يغير في ضوء درجات قاطعة محددة سلفاً.
انشاوها واستعمالاتها
الترجيح الى المحك اكثر مناسبة في تطبيقية في مجال اختبار المهاره واشد صعوبة في تطبيق لقياس السلوك المعقد مثل التفكير وحل المشكلة كما يذهب اليه إبيل (Ebel). حيث استخدام الترجيح الى المحك استخداماً اوسع في قياس التحصيل المدرسي سواء بالنسبة الى الاختبارات التي ينشها المدرس، او الاختبارات المنشورة.
ويستخدم الترجيح الى المحك عن طريقين:
1- وضع، واختبار، مجموعة من المرامي تمثل النواتج المرغوب فيها للتدريس.
2- تصميم عناصر او بنود او اختبارها بحيث تقيس كل مرمى قياساً دقيقاً أي يكون هذه العناصر او البنود ممثلة لنطاق المرمى.
3- الاتحديد المسبق لمستويات اداء مقبوله.
4- اعطاء الاختبار لمجموعة من التلاميذ وتقويم ادائهم في ضوء عدد من المرامي التي يستطيعون اداء ما تتطلبه من اداء بنجاح.
مشكلات المحك
ان طريقة حساب معامل الصدق عن طريق المحات تشير بعض المشكلات في مجال الصدق، لاعلاقة بالاختيار نفسه وانما بالمحك، لان اسلوب استخدام المححكات يفنترض صدقه وان هذا الافتراض يتطلب التاكد منه. وهناك ايضاً مشكله مستوى الارتباط بين الاختيار والمحك المقبول، ويشير مدى تاثير الارتباطين الاختيار والمحك بثبات كل منهما هذه المشكلات يحتم ضرورة تصحيح الارتباط بين الاختيار والمحك.
تحيزات المحك
ان التاكد من صدق المحك عن طريق محك اخر امر غير معقول لانه يقود الى سلسلة من المحكات لكل محك، ولذا فان الصدق المنطقي يمكن ان يؤدي دوره في ذلك وعلى الرغم من ذلك الا اننا نجد بعض التحيزات التي تؤثر في صلاحية المحك وتختلف هذه التحيزات من حيث طبيعتها وفي كيفية تداخلها في المحك وتاثيرها على معامل الصدق وتباين انواع التحيز في درجة تاثيرها حيث توثر بعض عوامل التحيز في معاملات الصدق بينما يكون تاثيرها ضيئلاً على ثبات المحك دون الصدق وعموماً يمكن تصنف عوامل التحيز الى:
(1) عيوب المحك والتي تنتج عن استعادة عناصر من المحك تؤدي الى عدم تكامله كان كونه يرتبط بالاختبار.
(2) فساد المحك ويحدث نتيجة اضافة عناصر داخلية للمحك مثل التقديرات المعلمين او الرؤساء لاداء تلاميذهم او مرؤسيهم وتسرب درجات الاختيار للمحكمين.
(3) تحيز وحدات القياس المحكمة الذي يحدث نتيجة عدم تساوي وحدات القياس في المحك سواء كان ذلك نتيجة لاستخدام محك مركب من عدد من المحكات الفرعية ام استخدام عناصر مختلفة في تمثيلها للسمة التي يقيسها الاختيار.
(4) تشويه المحك ويحدث عند استخدام اوزان غير مناسبة كمكونات للمحك مما يترتب اختلال في دلالة الدرجة الكلية للمحك مقارنة بدرجة الاختيار.
تقدير ثبات الاختيارات محكية المرجع
تعتمد طرق تقدير ثبات الاختيارات جماعية المرجع على مفهوم معامل الارتباط بين متغيرين، لذلك نجد قيمة التكافؤ او قيم معامل الاستقرار او قيم معامل الاستقرار والتكافؤ تزداد تباين درجات الاختيار ويمكن ايضاً استخدام هذه الطرق في تقدير ثبات الاختيارات محكية المرجع اذا كان هناك قدراً معقولاً من التباين في الدرجات اما اذا كان توزيع درجات هذه الاختبارات متجانساً، كما هو الحال في معظم الاحيان، وبخاصة اذا كان البرنامج التعليمي الذي يقاس اثره على تحصيل الطلاب فعالاً فانه يمكننا في هذه الحاله تقدير ثبات الاختبار باستخدام احد المقاييس اللامعلمية مثل معامل فاي (f).