نظرية الاختبار الكلاسيكية

نظرية الاختبار الكلاسيكية / علم النفس التجريبي

الاختبار هو أداة علمية إلى الحد الذي يقيس فيه ما ينوي ، أي أنه صالح ، ويقيس جيدًا ، أي أنه دقيق أو موثوق به. إذا وجدنا أداة لا يمكننا الوثوق بها في التدابير التي يقدمونها ، لأنها تختلف من وقت لآخر عندما نقيس نفس الشيء ، فسنقول أنه غير موثوق. أداة لقياس بشكل صحيح شيء ما ، يجب أن يكون دقيقًا ، لأنه بخلاف ذلك ، قم بقياس ما تقيسه ، وقياسه بشكل خاطئ. لذلك ، الدقة هي شرط ضروري ولكنه غير كافٍ. بالإضافة إلى ذلك ، يجب أن يكون صحيحًا ، أي أن ما يقيسه بدقة سيكون ما هو المقصود قياسه ، ولا شيء آخر.

قد تكون مهتمًا أيضًا: نظرية استجابة العنصر - التطبيقات والاختبار

الموثوقية:

الموثوقية المطلقة والنسبية: يمكننا معالجة مشكلة موثوقية الاختبار بطريقتين مختلفتين ، رغم أنهما يتزامنان في الخلفية.

الموثوقية مثل عدم دقة قياساتها: عندما يستجيب الشخص لاختبار ما ، يحصل على درجة تجريبية ، تتأثر بالخطأ. إذا لم يكن هناك خطأ ، فإن الموضوع سوف يحصل على نقاطه الحقيقية. الاختبار غير دقيق لأن النتيجة التجريبية لا تتطابق مع النتيجة الحقيقية الحقيقية. هذا الاختلاف بين كلا الدرجات هو خطأ أخذ العينات ، خطأ القياس. ال خطأ نموذجي للقياس سوف يكون الانحراف المعياري لأخطاء القياس. ال خطأ نموذجي للقياس يشير إلى الدقة المطلقة للاختبار ، لأنه يسمح بتقدير الفرق بين القياس الذي تم الحصول عليه والقياس الذي سيتم الحصول عليه في حالة عدم وجود خطأ.

الموثوقية مثل ثبات القياسات: سيكون الاختبار أكثر موثوقية وأكثر ثباتًا أو ثباتًا في النتائج التي يوفرها عند تكرارها. كلما كانت النتائج أكثر ثباتًا في مناسبتين ، زادت العلاقة بينهما. هذا الارتباط يسمى معامل الموثوقية. هذا يعبّر عننا ، وليس عن مقدار الخطأ ، ولكن عن تماسك الاختبار مع نفسه وثبات المعلومات التي يقدمها. ال معامل الموثوقية يعبر عن الموثوقية النسبية للاختبار.

معامل الموثوقية ومؤشر الموثوقية: - معامل الموثوقية الاختبار هو ارتباط الاختبار مع نفسه ، تم الحصول عليه على سبيل المثال ، في شكلين متوازيين: rxx. - مؤشر الدقة هو العلاقة بين الدرجات التجريبية للاختبار ودرجاته الحقيقية: rxv سيكون مؤشر الدقة دائمًا أكبر من معامل الموثوقية ، لمعرفة معامل الموثوقية ، تستحق هذه الطرق الكلاسيكية الثلاثة إبرازها:

  • أوجد العلاقة بين الاختبار وتكراره: طريقة التكرار أو طريقة إعادة الاختبار: تتكون من تطبيق نفس الاختبار على نفس المجموعة في مناسبتين ويتم حساب الارتباط بين سلسلتي الدرجات. هذا الارتباط هو معامل الموثوقية. هذه الطريقة عادة ما تعطي معامل موثوقية أعلى من تلك التي حصلت عليها الإجراءات الأخرى ، وقد تكون ملوثة بعوامل مقلقة.
  • أوجد العلاقة بين شكلين متوازيين من الاختبار: طريقة النماذج الموازية: قم بإعداد شكلين متوازيين من نفس الاختبار ، أي نموذجين مكافئين يعطيان نفس المعلومات ، وينطبقان على نفس المجموعة من الموضوعات. العلاقة بين الشكلين هي معامل الموثوقية. باستخدام هذه الطريقة ، من خلال عدم تكرار نفس الاختبار ، يتم تجنب المصادر المزعجة لموثوقية إعادة الاختبار.
  • أوجد العلاقة بين نصفي الاختبار المتوازيين: طريقة نصفي الاختبار: ينقسم الاختبار إلى نصفين معادلين ويوجد الارتباط بينهما. هذه هي الطريقة المفضلة ، لأنها بسيطة وتتجاهل قيود الإجراءات السابقة. يمكنك اختيار العناصر الفردية للاختبار ، لتشكيل النصف ، والعناصر الزوجية لتشكيل الآخر.

معامل الموثوقية والعلاقة بين الاختبارات المتوازية

ال معامل الموثوقية يشير الاختبار إلى نسبة التباين الحقيقي للتباين التجريبي: gráfico33 يتراوح معامل الموثوقية للاختبار بين 0 و 1. على سبيل المثال: إذا كانت العلاقة بين اختبارين متوازيين هي rxx´ = 0.80 ، يعني أن 80٪ من تباين الاختبار يرجع إلى المقياس الحقيقي ، والباقي ، أي 20٪ من تباين الاختبار يرجع إلى الخطأ. ال مؤشر الموثوقية الاختبار هو العلاقة بين الدرجات التجريبية ومؤشر الموثوقية للدرجات الحقيقية = مؤشر الموثوقية يساوي الجذر التربيعي لمعامل الموثوقية

بمجرد تطوير شكلين متوازيين من الاختبار ، يتم تطبيق إجراء تحليل التباين للتحقق من تجانس الفروق والفرق بين التدابير. إذا كانت الفروق متجانسة ، فإن الفرق بين الوسيلة ليس كبيرًا ويتم إنشاء النموذجين بنفس عدد العناصر من نفس النوع والمحتوى النفسي ، يمكن القول إنها متوازية. إذا لم يكن كذلك ، عليك إصلاحها حتى تكون كذلك. يتم تحديد نقص الموثوقية مع قيمة rxx´= 0 4.- الخطأ النموذجي للقياس: الفرق بين الدرجات التجريبية والنتيجة الحقيقية هو الخطأ العشوائي ، ويسمى خطأ القياس. يسمى الانحراف المعياري لأخطاء القياس خطأ القياس النموذجي. ال خطأ نموذجي للقياس يسمح بإجراء تقديرات حول الموثوقية المطلقة للاختبار ، أي تقدير مقدار خطأ القياس الذي يؤثر على النتيجة.

الموثوقية والطول: يشير طول الاختبار إلى عدد عناصره. الموثوقية تعتمد على هذا الطول. إذا كان الاختبار يتكون من ثلاثة عناصر ، فيمكن أن يحصل الشخص مرة واحدة على درجة واحدة وبطريقة أخرى ، أو بطريقة موازية ،

من مناسبة إلى أخرى ، تباينت النتيجة بنقطة واحدة ؛ نقطة فوق ثلاثة هو اختلاف 33 ٪ ، وهو اختلاف كبير. في حالة حصول الأشخاص على أشكال عشوائية من هذا النوع ، سيتم تقليل ارتباط الاختبار مع نفسه أو بالشكلين المتوازيين للاختبار إلى حد كبير ولا يمكن أن يكون مرتفعًا. إذا كان الاختبار أطول بكثير ، إذا كان لديك ، على سبيل المثال ، 100 عنصر ، فيمكن أن يحصل الشخص على 70 نقطة في مناسبة واحدة و 67 على أساس متوازٍ. من واحدة إلى أخرى قد تغيرت 3 نقاط. إنه تباين صغير نسبياً بالنسبة للاختبار الكلي ، وتحديداً 3٪. هذه التغييرات الطفيفة البسيطة من هذا الحجم ، والتي تحدث في درجات الموضوعات ، عندما تنتقل من شكل إلى آخر ، غير مهمة نسبيًا ولن تتضاءل كما كانت قبل العلاقة المتبادلة بين الاثنين.

سيكون معامل الموثوقية أعلى بكثير مما كان عليه الحال في الحالة السابقة. معادلة سبيرمان براون تعبر عن العلاقة بين الموثوقية والطول. دقة الاختبار هي صفر عندما يكون الطول 0 ، ويزيد كلما زاد الطول. على الرغم من أن الزيادة أصغر نسبيا حيث أن طول الجزء أكبر. هذا يعني أن الدقة تنمو كثيرًا في البداية وأقل نسبيًا في وقت لاحق. عندما يميل الطول إلى ما لا نهاية ، فإن معامل الموثوقية يميل إلى

بزيادة طول الاختبار ، تزداد دقته لأنه يزيد التباين الحقيقي بمعدل أعلى من تباين الخطأ. هذا يعني أن دقة الاختبار تزداد بسبب انخفاض نسبة التباين بسبب الخطأ. صيغة Rulon ، وكذلك صيغة Flanagan و Guttman ، تنطبق بشكل خاص عند حساب معامل الموثوقية بطريقة النصفين. هذه هي الصيغ التي يتم استخدامها لحساب معامل الموثوقية.

الموثوقية والاتساق: يمكن العثور على معامل الموثوقية أيضًا بطريقة أخرى ، وهو ما يطلق عليه معامل ألفا أو معامل التعميم أو التمثيل (كرونباخ). يشير معامل ألفا هذا إلى الدقة التي تقيس بها بعض العناصر جانبًا من سمات الشخصية أو السلوك. يمكن تفسيره على النحو التالي: تقدير لمتوسط ​​الارتباط لجميع العناصر المحتملة في جانب معين. مقياس دقة الاختبار وفقًا لاتساقه أو اتساقه الداخلي (العلاقة بين عناصره ، إلى أي مدى تقيس عناصر الاختبار نفس الشيء) وطولها. مع الإشارة إلى الطابع التمثيلي للاختبار ، أي المقدار الذي تمثله عينة العناصر المكونة لها في مجموعة العناصر المحتملة من نفس النوع والمحتوى النفسي. ال معامل ألفا يعكس بشكل أساسي مفهومين أساسيين في دقة الاختبار: 1. العلاقة المتبادلة بين عناصره: إلى أي مدى يقيسون جميعًا الشيء نفسه.

طول الاختبار: عند زيادة عدد حالات العينة ، وإذا تم القضاء على الأخطاء المنهجية ، فإن العينة تمثل السكان أفضل مما يتم استخراجه ومن غير المرجح أن يكون الخطأ العرضي متورطًا. إذا كانت عناصر الاختبار ثنائية التفرع ، (نعم أو لا ، 1 أو 0 ، اتفاق أو خلاف ، إلخ) ، يتم تبسيط معادلة معامل ألفا ، مما يؤدي إلى معادلات Kuder-Richardson (KR20 و KR21). بالنظر إلى عدد معين من العناصر ، سيكون الاختبار أكثر موثوقية ، عندما يكون أكثر تجانسًا. يخبرنا معامل ألفا بالموثوقية لأنه يمثل التجانس والاتساق أو الاتساق الداخلي لعناصر الاختبار.

المعايير ومعايير الموثوقية

وفقًا لنموذج مساحة عينة العناصر ، فإن الهدف من الاختبار هو تقدير المقياس الذي سيتم الحصول عليه إذا تم استخدام جميع العناصر الموجودة في مساحة العينة. سيكون هذا التدبير هو النتيجة الحقيقية ، حيث تقارب القياسات الحقيقية أكثر أو أقل. اعتمادًا على الدرجة التي ترتبط بها عينة من العناصر مع الدرجات الحقيقية ، يكون الاختبار أكثر أو أقل موثوقية. في هذا النموذج ، تكون مصفوفة الارتباطات بين جميع العناصر الموجودة في مساحة العينة مركزية ، ويصر نموذج العينة هذا بشكل مباشر على الاتساق الداخلي ، وبقدر ما يحقق ذلك ، يضمن الاستقرار بشكل غير مباشر..

يصر النموذج الخطي للاختبارات المتوازية بشكل أكبر على ثبات الدرجات ، وبقدر ما يحقق الثبات ، فإنه يفضل الاتساق الداخلي بشكل غير مباشر. إذا طبقنا اختبارًا لتحديد التشخيصات والتوقعات الفردية ، يجب أن يكون معامل الموثوقية 0.90 للأعلى. في التوقعات والتصنيفات الجماعية ، ليس هذا هو المطلب ، على الرغم من أنه ليس من المناسب الابتعاد كثيرًا من 0 إلى 90 إلى 0'80.

في بعض الأحيان ، في أنواع معينة من الاختبارات ، مثل اختبارات الشخصية ، يكون من الصعب تحقيق معاملات تزيد عن 0.70. إذا تم تطبيق أشكال متوازية ، أو نصفين متوازيين ، بعد فاصل زمني كبير أو أقل ، فقد تكون الأخطاء العرضية أكثر من تلك التي تؤثر على معامل ألفا. هذا هو السبب في أن ما يقلل من العلاقة ليس فقط الأخطاء العشوائية الجوهرية للاختبار وفي مناسبة واحدة ، والتي هي تلك التي تأخذ في الاعتبار معامل ألفا ، ولكنها تؤثر أيضًا على جميع الأخطاء التي قد تنجم عن الحالتين المختلفتين ، والتي قد تختلف في العديد من التفاصيل. لذلك ، يكون معامل ألفا عادة أكبر من المعاملات الأخرى.

باستثناء المعامل الموجود بواسطة تكرار نفس الاختبار ، حيث يوجد احتمال أكبر لتكرار الأخطاء العشوائية للتطبيق الأول في الثاني ، وبدلاً من تقليل الارتباط بين الاثنين ، قم بزيادةه. يجب التأكد من أن التطبيق الثاني مستقل تمامًا عن الأول. إذا حققنا ذلك ، فستكون هذه هي الطريقة الأسهل والأرخص والأفضل عند محاولة تقدير ثبات الدرجات ، خاصة خلال الفترات الطويلة من الزمن ومع الاختبارات المعقدة. > التالي: صلاحية الاختبارات

هذه المقالة غنية بالمعلومات ، في علم النفس على الإنترنت ، ليس لدينا أعضاء هيئة التدريس لإجراء تشخيص أو التوصية بالعلاج. نحن ندعوك للذهاب إلى طبيب نفساني لعلاج قضيتك على وجه الخصوص.

إذا كنت ترغب في قراءة المزيد من المقالات المشابهة نظرية الاختبار الكلاسيكية, نوصيك بالدخول إلى فئة علم النفس التجريبي.