نظرية الاستجابة لهذا البند - التطبيقات والاختبار

نظرية الاستجابة لهذا البند - التطبيقات والاختبار / علم النفس التجريبي

داخل مجال نظرية الاختبارات السيكومترية ظهرت طوائف مختلفة تأخذ حاليًا اسم "نظرية الرد على العناصر" (إف إم لورد ، 1980). تقدم هذه الفئة بعض الاختلافات فيما يتعلق بالنموذج الكلاسيكي: 1.- العلاقة بين القيمة المتوقعة لعشرات الموضوع والسمات (السمة المسؤولة عن القيم) ، ليست عادةً خطية. 2.- يهدف إلى وضع تنبؤات فردية دون الحاجة إلى الرجوع إلى خصائص المجموعة المعيارية.

قد تكون مهتمًا أيضًا بـ: مؤشر نظرية الاختبار الكلاسيكي
  1. نظرية الاستجابة للعنصر أو نماذج السمة الكامنة في نظرية الاختبارات
  2. نماذج لنظرية استجابة المادة (ثلاثي)
  3. تقدير المعلمة
  4. اختبار البناء
  5. تطبيقات نظرية استجابة البند
  6. تفسير الدرجات

نظرية الاستجابة للعنصر أو نماذج السمة الكامنة في نظرية الاختبارات

نرى ، إذن ، أن نظرية الاستجابة لهذا البند توفر إمكانية وصف العناصر بشكل منفصل وكذلك الأفراد ؛ كما تعتبر أن الاستجابة التي يقدمها هذا الموضوع تعتمد على مستوى المهارة التي تراوحت في النطاق. يرجع أصل هذه النماذج إلى Lazarsfeld ، 1950 ، الذي قدم مصطلح "سمة كامنة" .

من هنا يعتبر أن لكل فرد معلمة فردية مسؤولة عن خصائص الموضوع ، وتسمى أيضًا "سمة". هذه الميزة غير قابلة للقياس مباشرة ، ومن ثم تسمى المعلمة الفردية المتغير الكامن. عند تطبيق الاختبارات ، يمكنك الحصول على شيئين مختلفين ، النتيجة الحقيقية ومقياس اللياقة البدنية ؛ يتم تحقيق ذلك إذا نجحنا في إجراء اختبارين على نفس اللياقة لنفس المجموعة.

في نظرية السمات الكامنة أو نظرية الاستجابة لهذا البند النتيجة الحقيقية هي تلك القيمة المتوقعة من النتيجة المرصودة. وفقًا للورد ، فإن النتيجة الحقيقية واللياقة البدنية هما نفس الشيء ولكن يتم التعبير عنها بمقاييس مختلفة للقياس.

نماذج لنظرية استجابة المادة (ثلاثي)

نماذج الأخطاء ذات الحدين: تم تقديمها بواسطة Lord (1965) ، والتي تفترض أن النتيجة المرصودة تتوافق مع عدد الإجابات الصحيحة التي تم الحصول عليها في الاختبار (الذين تواجه عناصرهم نفس الصعوبة ولديهم استقلال محلي ، أي أن الاحتمال للرد بشكل صحيح على عنصر ما لا يتأثر بالإجابات المقدمة للعناصر الأخرى).

نماذج بواسون: هذه النماذج مناسبة لتلك الاختبارات التي تحتوي على عدد كبير من العناصر والتي يكون فيها احتمال الإجابة الصحيحة أو غير الصحيحة ضئيلًا. ضمن هذه المجموعة ، بدوره ، لدينا نماذج مختلفة:

  1. نموذج Poissonian من راش, فرضياته هي: يحتوي كل اختبار على عدد كبير من العناصر الثنائية المستقلة محليًا. احتمال الخطأ في كل بند صغير. تعتمد احتمالية حدوث خطأ ما على شيئين: صعوبة الاختبار وقدرة الموضوع. الإضافة للصعوبات ، التي يتم فهمها كنتيجة لخلط اختبارين معادلين في اختبار واحد تكون صعوبتهما هي مجموع صعوبات الاختبارين الأولي.
  2. نموذج بواسون لتقييم السرعة: تم اقتراح هذا النموذج أيضًا من قِبل Rasch وهو يتميز لأنه يتم مراعاة السرعة في تنفيذ الاختبار. يمكن اقتراح النموذج بطريقتين: حساب عدد الأخطاء المرتكبة وعدد الكلمات المقروءة في وحدة زمنية. حساب عدد الأخطاء التي ارتكبت والوقت الذي يقضيه في استكمال قراءة النص. احتمال تحقيق عدد معين من الكلمات في اختبار (1) حسب موضوع (ي) ، لفترة (t)
  3. أوجيفا عادي نماذج: هو نموذج اقترحه Lord (1968) ، ويستخدم في الاختبارات مع العناصر ثنائية التفرع ومع متغير واحد مشترك ، وسيكون الرسم البياني الخاص به كما يلي: الافتراضات الأساسية التي تميز هذا النموذج هي:
  • مساحة المتغير الكامن أحادي الأبعاد (ك = 1).
  • الاستقلال المحلي بين الأطراف.
  • يمكن اختيار مقياس المتغير الكامن بحيث يكون منحنى كل عنصر هو الرأس الحربي العادي.

النماذج اللوجستية. إنه نموذج مشابه جدًا للنموذج السابق ، لكنه يتميز أيضًا بمزايا أكثر مقارنة بمعالجته الرياضية. تأخذ الوظيفة اللوجستية الشكل التالي: هناك نماذج لوجستية مختلفة بناءً على عدد المعلمات التي تحتوي على:

  • 2 معلمات نموذج لوجستي, Birnbaum 1968 ، من بين خصائصه نذكر أنها ذات بعد واحد ، هناك استقلال محلي ، والعناصر ثنائية التفرع ، إلخ.
  • 3 معلمات نموذج لوجستي, اللورد ، يتميز لأن احتمال الضرب بالعرافة هو العامل الذي سيؤثر على أداء الاختبار. 4.3. نموذج لوجستي رباعي المعلمات: نموذج مقترح من قبل McDonald 1967 و Barton-Lord في عام 1981 ، والغرض منه هو توضيح الحالات التي لا يستجيب فيها الأشخاص الذين لديهم مستوى لياقة مرتفع بشكل صحيح للعنصر.
  • النموذج اللوجستي لراش: هذا النموذج هو الذي أوجد أكبر عدد من الوظائف على الرغم من وجود عيب ، وهذا هو أن تعديله على البيانات الحقيقية أكثر صعوبة ، ولكن على النقيض من هذا فإن الميزة التي تجعله يستخدم هو أنه لا يتطلب كبيرة أحجام عينة للتكيف الخاص بك.

تقدير المعلمة

الطريقة الأكثر استخدامًا هي "الاحتمالية القصوى" ، بجانب هذه الطريقة يتم استخدام إجراءات التقريب العددي مثل نيوتن-رافسون وسكورينج (راو). تعتمد طريقة الاحتمالية القصوى على مبدأ الحصول على مقدرات المعلمات المجهولة التي تزيد من احتمال الحصول على العينات المذكورة. بالإضافة إلى "احتمال أقصى" ، يتم استخدام "تقدير بايزي" أيضًا ، استنادًا إلى "نظرية بايز" ، والتي تتكون في دمج جميع المعلومات المعروفة ، مسبقًا ، ذات الصلة بعملية صنع الاستدلالات. هناك دراسة أكثر تعمقًا عن الطريقة البايزية لتقدير معايير اللياقة البدنية ، وهي دراسة بيرنبوم (1996) وأوين (1975). .

وظائف المعلومات

أفضل اختبار يمكن بناؤه هو الاختبار الذي يوفر معظم المعلومات حول السمات الكامنة. يتم القياس الكمي لهذه المعلومات من خلال "وظائف المعلومات". صيغة دالة المعلومات ، Birnbaum 1968 ، هي كما يلي: يجب أن تؤخذ في الاعتبار أن المعلومات التي تم الحصول عليها في الاختبار هي مجموع معلومات كل عنصر ، إلى جانب مساهمة كل عنصر لا يعتمد على بقية العناصر التي تشكل الاختبار. بعبارات عامة يمكننا أن نقول أن المعلومات ، في جميع النماذج:

  • يختلف مع مستويات اللياقة البدنية.
  • كلما زاد ميل المنحنى ، زادت المعلومات.
  • يعتمد على تباين النتائج ، وكلما زاد هذا ، قلت المعلومات.

اختبار البناء

المهمة الأولى وأهم ما في وقت بناء الاختبار هو اختيار العناصر ، وهو الوتر السابق للافتراضات النظرية التي يجب أن تحدد الميزة التي ينوي الاختبار اختبارها. يشير مفهوم "تحليل العناصر" إلى مجموعة الإجراءات الرسمية التي يتم تنفيذها لتحديد العناصر التي ستشكل الاختبار في النهاية. المعلومات الأكثر أهمية فيما يتعلق بالعناصر هي:

  1. صعوبة البند ، النسبة المئوية للأفراد الذين يجيبون عليه.
  2. التمييز ، ارتباط كل عنصر بالنتيجة الكلية في الاختبار.
  3. يصرف الانتباه أو تحليل الأخطاء ، تأثيره وثيق الصلة ، ويؤثر على صعوبة العنصر ويسبب التقليل من قيم التمييز.

عادة ما يتم استخدام إحصائيات أو مؤشرات مختلفة في وقت وضع مؤشرات لمختلف المؤشرات ، فيما يلي أكثرها استخدامًا:

مؤشر الصعوبة تمييز فهرس الموثوقية فهرس الصلاحية فهرس الفهارس المعروفة التي يجب أخذها في الاعتبار عند اختيار العناصر التي ستشكل الاختبار ، سنرى الخطوات اللازمة لإنشاء اختبار:

  1. مواصفات المشكلة.
  2. يفصح عن مجموعة واسعة من العناصر وتصحيحها.
  3. اختيار النموذج.
  4. اختبار العناصر المحددة مسبقا.
  5. حدد أفضل العناصر.
  6. دراسة صفات الاختبار
  7. تحديد قواعد تفسير الاختبار النهائي التي تم الحصول عليها.

من بين النقاط السابقة ، تجدر الإشارة إلى أن اختيار النموذج ، النقطة 3 ، يعتمد على الأهداف التي يسعى إليها الاختبار ، وخصائص البيانات وجودتها ، وتلك الموارد المتاحة. عندما يتم اختيار نموذج ، بالنظر إلى الظروف النظرية التي يمكن تطبيقها ، لا على الرغم من فضائلها يجب تحليلها في كل حالة وفي ظروف محددة. الخصائص التي تعزى إلى تلك النماذج التي تشكل نظرية الرد على البند (TRI), يمكن أن تتأثر بما يلي:

  • البعدية للاختبار التوافر النادر لعينة نقص موارد الكمبيوتر هناك عدد من التفضيلات عند استخدام أحد النماذج أو النماذج الأخرى ، دعنا نراها: نماذج الرؤوس الحربية العادية لا تستخدم عادةً في التطبيقات ، وقيمتها نظرية.
  • راش: مناسبة للمقارنة الأفقية (اختبارات قابلة للمقارنة على مستويات الصعوبة مع توزيعات اللياقة البدنية المماثلة). أن يكون لديك أشكال مختلفة من نفس الاختبار. * 2 و 3 المعلمات: هي تلك التي تناسب مجموعة متنوعة من المشاكل.
  • للكشف عن أنماط الاستجابة الخاطئة. من أجل المعادلة الرأسية للاختبارات (مقارنة الاختبارات بمستويات مختلفة من الصعوبة وتوزيعات مختلفة من أجل اللياقة).

المعلمات 1 و 2:

  • مناسبة لبناء مقياس واحد ، بحيث يمكنك مقارنة المهارات على مستويات مختلفة.

يمكن أن يتأثر اختيار النموذج ، بالإضافة إلى الغرض المنشود ، بحجم العينة ؛ في حالة كون العينة كبيرة وممثلة ، لن تكون هناك مشكلة سواء في النموذج الكلاسيكي أو في الخاصية الكامنة. لكن في TRI ( نظرية استجابة البند ) نموذج صغير يفرض اختيار النماذج التي تحتوي على عدد صغير من المعلمات ، حتى نموذج uniparameter.

تطبيقات نظرية استجابة البند

دعونا نرى ما هي التطبيقات الأكثر شيوعا: أ) معادلة الاختبارات ، في بعض الأحيان يكون من الضروري ربط الدرجات التي تم الحصول عليها في اختبارات مختلفة ، مع غرضين محتملين:

  • معادلة أفقية: سعى للحصول على أشكال مختلفة من نفس الاختبار.
  • معادلة رأسية: الهدف هو بناء مقياس واحد من الكفاءة بمستويات مختلفة من الصعوبة. فيما يتعلق بمعادلة الاختبارات ، يقدم Lord (1980) مفهوم "الإنصاف" ، مما يعني أن اختبارين لكل موضوع يمكن أن يكونا قابلين للتبادل حيث يتم تطبيق أن أحدهما أو آخر لن يغير مستوى الاستعداد الذي تم تقديره. لهذا الموضوع.

دراسة تحيز العنصر ، يكون العنصر منحرفًا عندما يعطي ، في المتوسط ​​، درجات مختلفة اختلافًا كبيرًا في مجموعات محددة يفترض أنها جزء من نفس السكان.

اختبارات تكييفها أو متوسط , من خلال TRI ، يمكن إنشاء اختبارات فردية تسمح باستنتاج القيمة الحقيقية للسمة المعنية بطريقة أكثر دقة. سيتم إدارة العناصر بالتتابع ، ويعتمد إعداد مسبق لأحد العناصر أو آخر على الإجابات الواردة أعلاه. هناك أنواع مختلفة من الاختبارات المعدلة ، نوضح ما يلي:

  • إجراء على مرحلتين ، اللورد 1971 ؛ Bertz and Weiss 1973 - 1974. تم اجتياز اختبار واحد أولاً واعتمادًا على النتائج ، يتم إجراء اختبار ثانٍ.
  • الإجراء في عدة مراحل ، هو نفس المرحلة السابقة ، فقط العملية تتضمن المزيد من المراحل.
  • نموذج المتفرعة الثابتة ، اللورد 1970 ، 1971 ، 1974 ؛ Mussio 1973. جميع المواد تحل نفس المادة ، اعتمادًا على الاستجابة ، يتم حل مجموعة من العناصر.
  • يعتمد النموذج المتفرع المتفرع على الاستقلالية بين العناصر وخصائص مقدرات الاحتمالية القصوى.

بنك البنود, إن وجود مجموعة كبيرة من العناصر يعد أمرًا سيؤدي إلى تحسين جودة الاختبار ، ولكن يجب أن تمر العناصر من خلال عملية تصحيح الأخطاء أولاً. من أجل تصنيف العناصر ، من الضروري مراعاة الميزة التي تهدف إلى قياس اختبار أن هذا العنصر سيكون جزءًا من.

تفسير الدرجات

موازين: الغرض منه هو تقديم سلسلة متصلة لطلب أو تصنيف أو معرفة ما هو الحجم النسبي للميزة التي تم تقييمها ؛ سيسمح لنا هذا بإنشاء اختلافات وأوجه تشابه في الأشخاص فيما يتعلق بتلك الصفة. المقاييس المستخدمة في علم النفس هي: الاسمي ، الترتيبي ، الفاصل والعقل. يتم إنشاء هذه المقاييس من نتائج الاختبارات ، والنتائج تسمى "النتائج المباشرة" .

جسد الخصائص : لتصنيف الاختبار ، يتم تحويل الدرجات المباشرة إلى درجات أخرى يمكن تفسيرها بسهولة لأن النتيجة المحددة ستكشف عن موضع الموضوع فيما يتعلق بالمجموعة ، وستسمح لنا بإجراء مقارنات بين الأصناف الداخلية. هناك نوعان من الكتابة:

  1. خطي ، حافظ على شكل التوزيع ولا تقم بتعديل حجم الارتباطات.
  2. غير خطية ، فهي لا تحافظ على توزيع أو حجم الارتباطات .

مقياس APTITUDE في TRI ، المقياس المُصمم هو المقياس الذي يتوافق مع مستويات اللياقة ؛ يتميز هذا المقياس لأن التقديرات والمراجع يتم إجراؤها مباشرةً فيما يتعلق بالاستعداد وحجمه. بالإضافة إلى ذلك ، تعتمد هذه الكفاءة المقدرة فقط على شكل المنحنى المميز للعناصر. ضمن المقاييس الممكنة ، نشير إلى اثنين:

  1. Scale ، مقترح من Woodcock (1978) ويتم تعريفه بالصيغة التالية:
  2. مقياس WITS ، الذي اقترحه رايت (1977) ، هذا المقياس عبارة عن تعديل للجدول السابق ويتم تقديمه بواسطة العلاقة التالية:

هذه المقالة غنية بالمعلومات ، في علم النفس على الإنترنت ، ليس لدينا أعضاء هيئة التدريس لإجراء تشخيص أو التوصية بالعلاج. نحن ندعوك للذهاب إلى طبيب نفساني لعلاج قضيتك على وجه الخصوص.

إذا كنت ترغب في قراءة المزيد من المقالات المشابهة نظرية الاستجابة لهذا البند - التطبيقات والاختبار, نوصيك بالدخول إلى فئة علم النفس التجريبي.