نظريات اختبارات TCT و TRI

نظريات اختبارات TCT و TRI / علوم الأعصاب

تستخدم الاختبارات في علم النفس كأدوات قياس. لتقريب بعض الشيء للمفهوم وبدون أن يكون دقيقًا تمامًا ، تمامًا كما نستخدم العداد لقياس الطول ، يمكننا استخدام اختبار لقياس الذكاء والذاكرة والانتباه ... أحد الاختلافات بين الإجراء والآخر هو أن الاختبارات ليست سهلة البناء ، بالإضافة إلى قلة تطبيقها.

بالإضافة إلى ذلك ، مثلما لا يسمح لنا قياس واحد بالتحدث عن حجم كائن ما ، فإن إدارة اختبار واحد لا تسمح لنا أيضًا بتشخيص أو اقتراح تدخل. هكذا, الاختبارات مهمة للتقييم ، لكنها ليست من العوامل المحددة لذلك.

هذا هو المكان الذي يلعب فيه عالم النفس الدور الأكثر أهمية: بطريقة ما يجب عليه استخدام المعلومات التي حصل عليها من الاختبار ، ومن مصادر أخرى ، إعطاء شكل لتقييم متماسك يفسح المجال للتخطيط للتدخل. بمعنى آخر ، إنه في وقت تكامل نتائج المصادر المختلفة حيث تكون جودة المحترفين ملحوظة للغاية. نتحدث عن الخبرة التي يتم تحقيقها مع المعرفة ، ولكن أيضًا مع سنوات الخبرة.

تاريخ موجز لنظريات الاختبارات

يتم ذكر أصل الاختبارات عادة في الاختبارات التي أجراها الأباطرة الصينيون في السنوات 3000 قبل المسيح. وبالتالي ، كان الهدف من هؤلاء هو تقييم الكفاءة المهنية للضباط الذين كانوا سيذهبون إلى الخدمة. (1)

الاختبارات الحالية لها أصولها الأقرب في الاختبارات التي أجراها جالتون (1822-1911) في مختبره. ومع ذلك ، فإن جيمس كاتيل هو أول من استخدم المصطلح اختبار عقلي, في عام 1890. نظرًا لأن هذه الاختبارات الأولى لم تتنبأ بالقدرة المعرفية للإنسان ، أدخل باحثون مثل Binet و Simon (1905) في مهامهم المعرفية الجديدة على نطاق واسع لتقييم جوانب مثل الحكم والفهم والتفكير المنطقي.

مقياس Binet يفتح تقليد المقاييس الفردية. بالإضافة إلى الاختبارات المعرفية ، يتم إحراز تقدم كبير في اختبارات الشخصية.

لماذا تعتبر نظريات الاختبارات ضرورية؟?

قبل كل التقدم المحرز ، فإنها تبدأ في تطوير نظريات القياس (نظريات الاختبارات) التي تؤثر بشكل مباشر على الاختبارات كأدوات. مع الاهتمام بتوليد أدوات تقيس ما نريد قياسه ونفعله بأقل خطأ ممكن ، تظهر القياس النفسي. القياس النفسي الذي سيتطلب كل اختبار أو أداة قياس ، والتي تدعي أنها صحيحة وموثوقة,

أذكر أن دقة من المفهوم استقرار القياسات أو اتساقها عند تكرار عملية القياس. بمعنى آخر ، سيكون الاختبار أكثر موثوقية كلما كان ذلك أفضل في تكرار النتائج عند قياس موضوعين - أو نفس الموضوع في فرص مختلفة - لها نفس المستوى في القياس. من جانبها, تشير الصلاحية إلى الدرجة التي تدعم بها الأدلة النظرية والتجريبية تفسير الدرجات من الاختبارات. (2)

وبالتالي ، هناك نظريتان كبيرتان للاختبارات أو الأساليب عندما نتحدث عن تحليل وبناء هذا النوع من الأدوات: النظرية الكلاسيكية للاختبارات (TCT) ونظرية الاستجابة للعناصر (TRI).

النظرية الكلاسيكية للاختبارات (TCT)

إنها النظرية السائدة في بناء وتحليل الاختبارات. الوعاء: من السهل نسبيًا بناء اختبارات تفي بالمتطلبات الدنيا لهذا النموذج. تقييم الاختبار نفسه من حيث المعلمات المذكورة هو أيضا بسيط نسبيا: الموثوقية وصلاحية.

له أصله في أعمال سبيرمان في بداية القرن العشرين. بعد ذلك ، في عام 1968 ، قام باحثو اللورد ونوفيك بإعادة صياغة هذه النظرية وفتحوا الطريق أمام المقاربة الجديدة للـ TRI.

تستند هذه النظرية إلى النموذج الخطي الكلاسيكي. تم اقتراح هذا النموذج من قبل سبيرمان ، ويتألف من افتراض ذلك تتكون النتيجة التي يحصل عليها الشخص في الاختبار ، والتي نسميها درجاته التجريبية ، والتي يتم تحديدها عادة بالحرف X ، من مكونين. (2)

من ناحية ، نجد النتيجة الحقيقية للموضوع في الاختبار (V) ، ومن ناحية أخرى ، الخطأ (e). يتم التعبير عنها على النحو التالي: س = الخامس + ه.

يضيف سبيرمان ثلاثة افتراضات لهذه النظرية:

  • أولا ، تحديد النتيجة الحقيقية (الخامس) كما الأمل الرياضي لل النتيجة التجريبية: إنها النتيجة التي سيحصل عليها الشخص في الاختبار إذا قام بذلك بعدد غير محدود من المرات.
  • ليس هناك علاقة بين كمية من عشرات الحقيقية و حجم الأخطاء التي تؤثر على تلك الدرجات.
  • وأخيرا ، فإن أخطاء القياس في الاختبار هم متعلق مع أخطاء القياس في اختبار آخر مختلف.

لإكمال هذه النظرية ، يعرف سبيرمان اختبارات موازية مثل تلك الاختبارات التي تقيس الشيء نفسه ولكن مع عناصر مختلفة.

حدود النهج الكلاسيكي

القيد الأول هو أن القياسات ليست ضمن هذه النظرية ثابتة فيما يتعلق بالأداة المستخدمة. هذا يعني أنه إذا قام أخصائي نفسي بتقييم ذكاء ثلاثة أشخاص مع اختبار مختلف لكل واحد ، فإن النتائج غير قابلة للمقارنة. ولكن ، لماذا يحدث هذا؟?

حسنًا ، نتائج أدوات القياس الثلاثة ليست بنفس المقياس: كل اختبار له نطاقه الخاص. لتكون قادرًا على المقارنة ، على سبيل المثال ، ذكاء X الأشخاص الذين تم تقييمهم باختبارات ذكاء مختلفة ، من الضروري تحويل النتائج التي تم الحصول عليها مباشرة من الاختبار في جداول أخرى.

المشكلة في هذا هي أنه من خلال تحويل الدرجات إلى baremadas نفترض أن المجموعات المعيارية التي وضعت فيها جداول الاختبارات المختلفة هي قابلة للمقارنة - نفس المتوسط ​​، نفس الانحراف المعياري-, ما هو الصعب ضمان في الممارسة العملية. (1) وهكذا ، يفترض النهج الجديد لل TRI تقدم كبير فيما يتعلق بهذه الحقيقة. وبذلك ستحقق الهيئة أن النتائج التي تم الحصول عليها باستخدام أدوات مختلفة هي بنفس المقياس.

القيد الثاني لهذا النهج هو عدم ثبات خصائص الاختبار بخصوص الأشخاص الذين اعتادوا تقديرها. وهكذا ، في إطار TCT ، تعتمد الخصائص السيكومترية المهمة للاختبارات على نوع العينة المستخدمة لحسابها. هذه حقيقة تجد حلًا أيضًا ، جزئيًا على الأقل ، في نهج TRI.

نظرية استجابة المادة (TRI)

ولدت نظرية الاستجابة للعناصر (TRI) كمكمل لنظرية الاختبارات الكلاسيكية. وبعبارة أخرى ، يمكن لـ TCT و TRI تقييم الاختبار نفسه ، وكذلك تحديد درجة أو مدى ملاءمة كل عنصر من العناصر ، وهذا بدوره قد يعطينا نتيجة مختلفة لكل شخص. من ناحية أخرى ، للإشارة إلى أن TRI ستمنحنا أداة معايرة أفضل بكثير ، فإن المشكلة تكمن في أن هذا النموذج له تكلفة أعلى بكثير ومشاركة محترفين متخصصين..

لدى TRI العديد من الافتراضات ، ولكن ربما يخبرنا الأكثر أهمية أن أي أداة قياس يجب أن تكون متوافقة مع فكرة: علاقة وظيفية بين قيم المتغير التي تقيس العناصر واحتمال ضربها. هذه الوظيفة تسمى منحنى مميز لهذا البند (CCI). ماذا نفترض بعد ذلك؟?

حسنًا ، قد يبدو شيء من الخارج منطقيًا جدًا ولا تقيِّم TCT. على سبيل المثال ، ستكون أصعب العناصر هي تلك التي يجيب عليها أذكى الأشخاص فقط. من ناحية أخرى ، لا يستحق العنصر الذي يجيب عليه جميع الأشخاص جيدًا لأنه لن يكون لديه أي سلطة للتمييز. بمعنى آخر ، لن يعطي أي نوع من المعلومات. هذا مجرد رسم صغير للثورة التي اقترحتها TRI.

لرؤية الفروق بين نموذج القياس ونموذج آخر بشكل أفضل ، يمكننا أن نأخذ كمرجع للجدول بواسطة José Muñiz (2010):

الجدول 1. الاختلافات بين TCT و TRI (Muñiz ، 2010)

الجوانب TCT TRI
نموذج خطي غير الخطية
الافتراضات ضعيف (يسهل مقابلة البيانات) قوي (يصعب مقابلة البيانات)
قياس الثبات ليس نعم
ثبات خصائص الاختبار ليس نعم
مقياس الدرجات بين 0 والحد الأقصى في الاختبار لانهاية
تشديد اختبار بند
علاقة اختبار البند غير محدد منحنى مميز لهذا البند
وصف العناصر فهارس الصعوبة والتمييز المعلمات أ ، ب ، ج
أخطاء القياس خطأ القياس النموذجي المشترك للعينة بأكملها وظائف المعلومات (تختلف باختلاف مستوى الاستعداد)
حجم العينة يمكن أن تعمل بشكل جيد مع عينات ما بين 200 و 500 المواضيع تقريبا يوصى بأكثر من 500 موضوع

هذه هي الطريقة التي ترتبط كل من نظريات الاختبارات. على الرغم من كونه coeval تقريبا ، يبدو واضحا ذلك تم إنشاء TRI استجابةً للقيود أو المشكلات التي يمكن أن تحدثها TCT. ومع ذلك ، يبدو من الواضح أن البحث ما زال أمامه طريق طويل في مجال القياس النفسي..

الاختبارات النفسية: الخصائص والأداء الاختبارات النفسية هي الأدوات المستخدمة في علم النفس لقياس المتغيرات التي تهتم بالمعرفة. اقرأ المزيد "