Статистичні основи шкалювання в тестології

Створення працюють, ефективних тестів - це складна і тривала робота, що вимагає як тонкого розуміння власне психологічних проблем діагностики, так і знання основ математичної статистики.

Мабуть найпростішим, але одним з ключових елементів математичної статистики в тестології є пошук середнього арифметичного (математичного очікування) з питань і шкалами тесту, а також похідних математичних величин від математичного очікування (стандартне відхилення, дисперсія та ін.).

Математичне сподівання є не що інше як середнє арифметичне. Знання математичного очікування важливо для оцінки результатів тестування, але часом ця величина недостатньо інформативна для оцінки результатів тестування в цілому.

Наведемо приклад. У двох групах (для прикладу нехай вони будуть складатися з 10 осіб) проведено тестування. Використаний тест "Логічні закономірності". Отримані наступні результати:

-

Середнє арифметичне (математичне очікування - Х) дорівнює 6

Дані по другій групі:

Середнє арифметичне (математичне очікування - Х) дорівнює 6,4

Як бачимо, в першій групі все обстежувані розділилися на дві підгрупи (блискуче вирішили завдання і вирішили їх погано).

У другій групі, навпаки, велика частина обстежуваних показала середні результати. При цьому середнє арифметичне в першій і другій групах приблизно однаково. Але в першій групі середніх результатів немає взагалі, у другій же - ні низьких результатів.

Тобто в цих групах різна ступінь "розкиданості" результатів тестування. Цей ступінь в математиці виражається дисперсією, стандартним відхиленням.

Дисперсія (від лат. Dispersio - розсіювання) - найбільш вживана міра розсіювання, тобто відхилення від середнього.

Де: Х - середнє арифметичне даної вибірки

Хi - значення даного елемента вибірки

N - кількість елементів вибірки

Стандартне відхилення - не що інше як корінь квадратний з дисперсії. Зустрічається два позначення стандартного відхилення (і дисперсії): G (G x G) і S (S x S).

Де: G - генеральне стандартне відхилення

S - вибіркове стандартне відхилення

Знайдемо дані величини для наведених прикладів.

2

S = 12,666 S = 3,559

1 2

2

S = 4,268 S = 2,066

2 + 2

Стандартне відхилення відіграє виняткову роль в

тестології. Всі розробляються в психології тестові шкали

пов`язані зі значеннями стандартного відхилення сирих показників за даною шкалою. Однак перш ніж перейти до цієї проблеми зупинимося на аналізі понять "крива розподілу",

"Нормальний закон розподілу", так часто зустрічаються в тестології.

Побудуємо для прикладу гістограми розподілу кількості правильно вирішених завдань по тесту "Логічні закономірності" для 1 і 2 груп обстежуваних.

Гістограма правильно вирішених завдань для 1 групи обстежуваних

Гістограма правильно вирішених завдань для 1 групи обстежуваних

Гістограма правильно вирішених завдань для 2 групи обстежуваних

Відео: Аудіокнига. Курси "Лекції по соціології"

Гістограма правильно вирішених завдань для 2 групи обстежуваних

І в першому і в другому випадках ми бачимо нерівномірний розподіл результатів тестування. Однак робити висновок про низьку якість тесту з цими результатами передчасно: занадто мало кількість обстежених (ще не вступив в силу закон великих чисел, який починає проявлятися десь з 30-60 випробувань).

Тому об`єднаємо результати тестових випробувань в 1 і 2 групах.

Гістограма правильно вирішених завдань для двох груп обстежуваних

Гістограма правильно вирішених завдань для двох груп обстежуваних

Відео: 2000234 07 Аудіокнига "Лекції по соціології" Статистика - інструмент соціології

Ця гістограма побудована за двома параметрами - кількість правильно вирішених завдань і кількість осіб. Однак якщо ми побудуємо такі гістограми для груп з нерівним числом членів, то зіставити отримані результати буде складно. Це значно легше робити, якщо будуть побудовані процентні (ймовірні) гістограми. У нашому прикладі кожен обстежуваний "важить" 5% (1 з 20). Тому імовірнісна гістограма буде мати наступний вигляд:

Гістограма правильно вирішених завдань для двох груп обстежуваних

Гістограма правильно вирішених завдань для двох груп обстежуваних

Відео: Математика і математичні методи в соціології

Де Р - ймовірність успішного вирішення тієї чи іншої кількості пунктів тесту.

N - кількість правильно вирішених пунктів тесту

Спираючись на ці дані, можна перейти на мову теорії ймовірностей, використовуючи при створенні, відпрацювання тестів найсучасніші досягнення в цій галузі.

Однак ймовірні залежності стійкі при досить великій кількості випробувань - від 100 і вище, мінімально 30-40. Тому для отримання достатньо надійних, репрезентативних результатів слід обстежити до 100-1000 випробовуваних.

Наведемо реальні результати, отримані по даному тесту.

Гістограма правильно вирішених завдань для 100 обстежуваних, учнів випускних класів фізико-математичної школи за 10 хвилин

Однак це особи з цілеспрямованої математичної підготовкою. А ось результати обстеження 1000 випускників середніх шкіл даними тестом.

Гістограма правильно вирішених завдань на 1000 обстежуваних, випускників середніх шкіл

Гістограма правильно вирішених завдань на 1000 обстежуваних, випускників середніх шкіл

В даному розподілі результати як би симетрично розподілені навколо середнього значення (математичного очікування). Це ознака наближення даного розподілу до так званого нормального закону розподілу. Нормальний розподіл - одне з найважливіших розподілів в теорії ймовірностей, для якого характерна симетрична крива розподілу. Ступінь пологами цієї кривої залежить від співвідношення

середнього арифметичного і стандартного відхилення.

При відпрацюванні шкал тесту принципово важливо сирі показники (правильно вирішені завдання, бали) наблизити до нормального закону розподілу. Після досягнення нормального розподілу результатів тестування можна переходити до формування тієї чи іншої шкали.

Зокрема в тесті Кеттелла для досягнення нормального розподілу треба було підбирати питання так, щоб тестовані - дорослі люди (чоловіки і жінки) за шкалою А (товариськість) набирали від 0 до 20 балів, але в середньому десь близько

10. Саме так і відпрацьовувався тест - виснажливим підбором питань, які б дійсно ділили людей за характером відповідей на них, і щоб вийшло в кінці кінців нормальний розподіл відповідей. При цьому для подальшого шкалювання важливо знати середнє арифметичне (математичне очікування) і величину стандартного відхилення. Зв`язок між величиною стандартного відхилення і значенням основних шкал, застосовуваних у психології, акмеології, представлена в наступній таблиці.

(Див .: Гласс Д., Стенлі Д. Статистичні методи в педагогіці і психології. - М .: Прогрес, 1976, с.97- Анастази А. Психологічне тестування. - М., Педагогіка, 1982, кн.1, с. 83- Бурлачук Л.Ф., Морозов С.М. Словник-довідник по психологічній діагностиці. - Київ, 1989, с.101.)

СПІВВІДНОШЕННЯ

значень різних тестових шкал

СПІВВІДНОШЕННЯ значень різних тестових шкал

Відсоток випадків під кожним стандартним відхиленням описується кривої відповідно до нормального закону розподілу:

Відео: багатовимірне шкалювання

Дані шкали найбільш поширені в психологічних дослідженнях. І майже всі відпрацьовані тести побудовані на застосуванні стандартних шкал. Однак в різних тестах застосовуються дещо різні шкали. Це пояснюється різними причинами. Так, безглуздо застосовувати шкалу Т-балів там, де вона

включає невелику кількість сирих балів. Семантично некоректно IQ-шкалу застосовувати при діагностиці особистісних якостей, хоча порівняти як відхиляються від середнього рівня інтелектуальні і особистісні якості різних умовних груп

обстежуваних плідно з наукової точки зору. Тому подібна "зв`язок" шкал між собою (через величину стандартного відхилення) дозволяє порівнянно переходити від однієї шкали до

інший, обгрунтовано зіставляти результати тестування різними тестами. Існують спеціальні таблиці переходу, припустимо, від шкали процентилей до Z-оцінками, Т-балам (див .: Кулагін Б.В. Основи професійної псіходіагностікі.- Л., Медицина, 1984, с.189-195) і ін. Проте для практичних цілей

досить точності, яку можна досягти графічно за допомогою наведених залежностей.

Коли відбувається переклад однієї шкали в іншу, важливо щоб результати тестування були порівнянними за своєю статистичної структурі, тобто щоб мали нормальний закон розподілу, приблизно однакові стандартні відхилення і т.д.

Інакше можна "втратити", не помітити, "згладити" результати тестування до неприйнятного рівня. Це принципово важливо, коли мова йде про створення експертних систем в психології (не плутати з експертною оцінкою, методом дельфийских Аракуль: в даному випадку під експертними системами розуміється прообраз штучного інтелекту в психології). Ці психодиагностические системи побудовані на основі великої кількості статистичного, логічного матеріалу. Тут повинні бути порівнянні результати тестування різними тестами до найтонших

залежностей, інакше підсумковий прогноз, діагноз буде неточний.

Прикладом такої гібридної експертної системи служить система PSY.lt; lt; ПопереднєНаступна gt; gt;

Поділитися в соц мережах:

Увага, тільки СЬОГОДНІ!

Схожі