Валідність тесту

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

МІНІСТЕРСТВО АГЕНСТВО ДО ОСВІТИ
Владивостоцького державного університету
ЕКОНОМІКИ ТА СЕРВІСУ
Інститут журналістики І ДИСТАНЦІЙНОГО НАВЧАННЯ
КАФЕДРА ПСИХОЛОГІЇ
Контрольна робота
з дисципліни Психодіагностика
Валідність тесту
Студент
Т.А. Карпова
Владивосток 2007

Зміст
Введення
1. Поняття тесту
2. Показники якості тестів (методик)
3. Види валідності та її знаходження
4. Проблеми валідності
Висновок
Список використаних джерел

Введення
Термін «тест», що отримав надзвичайно широке поширення в різних галузях знання в сенсі випробування, перевірки, має давню історію. За Р. Пенто і М. Гравітц (1972), слово «тест» походить з старофранцузької мови і є синонімом слова «чашка» (лат. testa - ваза з глини). Цим словом позначали невеликі судини з обпаленої глини, що використали алхіміками для проведення дослідів. У російській мові слово «тест» довгий час мало два значення:
1) випробувальна присяга, релігійна англійська клятва, яку кожен вступник громадську посаду повинен давати, щоб довести, що він не таємний католик;
2) плаский плавильний посудину або посудина з вилуженої золи для виділення олова із золота або срібла (Російський енциклопедичний словник. 1877).
Близьке сучасному зміст термін «тест» як термін психологічний отримує в кінці XIX ст.
Тестами в психології називають стандартизовані методики психодіагностики, що дозволяють отримувати порівняльні кількісні та якісні показники ступеня розвиненості досліджуваних властивостей.
Під стандартизованість таких методик є зважаючи на те, що вони завжди і скрізь повинні застосовуватися однаковим чином, починаючи від ситуації та інструкції, одержуваної випробуваним, закінчуючи способами обчислення і інтерпретації одержаних показників. Порівнянність означає, що оцінки, отримані за допомогою тесту, можна порівнювати один з одним незалежно від того, де, коли і ким вони були отримані, якщо, зрозуміло, тест застосовувався правильно. З усіх можливих психодіагностичних методик до тестів пред'являються строгі вимоги, що стосуються валідності, надійності, точності і однозначності.
Існує багато різновидів тестів, які поділяються на групи по декількох підставах: з предмета тестування (тому якості, яке оцінюється за допомогою даного тесту); за особливостями які у тесті завдань; за матеріалом, висунутій досліджуваним; по об'єкту оцінювання.

1. Поняття тесту
У психодіагностику відомі різноманітні класифікації тестів. Вони можуть підрозділятися за особливостями використовуваних тестових завдань на тести вербальні і тести практичні, за формою процедури обстеження - на тести групові та індивідуальні, за спрямованістю - на тести здібностей, тести особистості і тести окремих психічних функцій, а в залежності від наявності або відсутності тимчасових обмежень - на тести швидкості та тести результативності. Також тести можуть відрізнятися за принципами їх конструювання. За останні десятиліття багато відомих тести були пристосовані до середовища комп'ютера (пред'явлення, обробка даних тощо), їх можна позначити як комп'ютеризовані тести. Активно розробляються тести комп'ютерні, спочатку конструюються з урахуванням можливостей сучасної обчислювальної техніки. Тесту, як і будь-якому іншому інструменту пізнання, притаманні особливості, які в конкретних обставинах дослідження можуть розглядатися як його достоїнств і недоліків. Ефективне використання тестів залежить від врахування багатьох факторів, з яких до найважливіших відносяться: теоретична концепція, на якій базується той чи інший тест; область застосування; весь комплекс віданні, обумовлених стандартними вимогами до психологічних тестів, їх психометрическим характеристикам. Поширені уявлення про «простоту» і доступності тестів не відповідають дійсності. Будучи засобом дослідження складних психічних явищ, тест не може тлумачитися спрощено як пропозиція завдання та реєстрація його рішення. Наукове використання тестів можливе лише за умови опори на общепсихологические знання, компетентність у галузі теорії та практики відповідних психодіагностичних досліджень. Не менш істотно дотримання етичних норм психодіагностики.
2. Показники якості тестів (методик)
Особливе значення має вибір критерію оцінки одержуваних результатів. Самі по собі, без зіставлення з точкою відліку, результати психологічних випробувань нічого не означають. Найчастіше вони зіставляються з нормами виконання у вибірці стандартизації (репрезентативна вибірка того типу, для якого дана методика призначена, наприклад, діти певного віку, студенти вищих навчальних закладів подібного профілю, представники тієї чи іншої професії та ін.) Ці норми, таким чином, встановлюються дослідним шляхом. Потім результати кожного випробуваного зіставляються з нормою і кваліфікуються як середні, високі і низькі. Це дозволяє визначити положення конкретного випробуваного щодо нормативної вибірки або вибірки стандартизації. Для цього «сирі» бали (тобто кількість правильних відповідей) за допомогою спеціальних таблиць переводяться в стандартні показники, порівнянні один з одним і з нормою. У даному випадку використовується статистична норма - середній діапазон значень на шкалі вимірюваного властивості - це той рівень, який характеризує статистично середньої людини. Однак в останні роки такий спосіб оцінки результатів тестування піддається критиці.
Корисніше орієнтуватися на систему вимог, яку суспільство на певному етапі свого розвитку пред'являє кожному з його членів. Це можуть бути вимоги до розумової, естетичному, моральному розвитку людини. Щоб жити в суспільстві, людина повинна відповідати даним вимогам. Зміст таких соціально-критеріальних норм (соціально-культурних нормативів) цілком реально, воно присутнє в освітніх програмах, у кваліфікованих професійних характеристиках, суспільному думці, думці педагогів, вихователів. Як точок відліку можуть бути використані й інші критерії, наприклад, вікові норми, критерії виконання діяльності та ін
Найважливішими показниками якості психодіагностичних методик є надійність і валідність. Наше завдання - розглянути, що ж таке валідність тесту.
3 Види валідності та її знаходження
За визначенням американського текстолог А. Анастазі, «валідність тесту - це поняття, яке вказує нам, що тест вимірює і наскільки добре він це робить». Валідність свідчить про те, чи придатна методика для вимірювання певних якостей, особливостей і наскільки ефективно вона це робить. Найбільш поширеним способом знаходження теоретичної валідності тесту (методики) є конвергентна валідність, тобто зіставлення даної методики з авторитетними спорідненими методиками і доказ значимих зв'язків з ними.
Зіставлення з методиками, що мають іншу теоретичну підставу, і Констанція відсутності значимих зв'язків з ними називається дискримінантної валідність. Інший вид валідності - прагматична валідність - перевірка методики з точки зору її практичної значимості, ефективності, корисності. Для проведення такої перевірки, як правило, використовуються так звані незалежні зовнішні критерії, тобто використовується незалежний від тесту, зовнішнє джерело інформації про виявлення в реальному житті і діяльності людей вимірюваного психічного властивості. Серед таких зовнішніх критеріїв можуть бути успішність, професійні досягнення, успіхи в різних видах діяльності, суб'єктивні оцінки (або самооцінки). Якщо наприклад, методика вимірює особливості розвитку професійно важливих якостей, то для критерію необхідно знайти таку діяльність або окремі операції, де саме ці якості реалізуються.
Для перевірки валідності тесу можна використовувати метод відомих груп, коли запрошуються люди, про яких відомо, до якої групи за критерієм вони відносяться (наприклад, група «високоуспешних, дисциплінованих студентів» - високий критерій і група «невстигаючих, недисциплінованих студентів» - низький критерій, а студенти із середніми значеннями не беруть участь у тестуванні), проводять тестування і знаходять кореляцію між результатами тесту і критерієм.
високий критерій
низький критерій
високий результат тесту
a
b
низький результат тесту
c
d
Тут a - число досліджуваних, що потрапили у високу групу по тесту і за критерієм, c - число досліджуваних, що потрапили у високу групу за критерієм і мають низькі результати тесту. При повній валідності тесту елементи b і c повинні бути рівні нулю. Міру збіги, кореляції між крайніми групами по тесту й критерієм оцінюють за допомогою фі-коефіцієнта Гілфорда. Існує досить багато різних способів докази валідності тесту. Тест називається валідним, якщо він вимірює те, для вимірювання чого призначений. Валідність зовнішня - стосовно психодіагностичних методик означає відповідність результатів психодіагностики, проведеної за допомогою даної методики, незалежним від методики зовнішніми ознаками, що відносяться до суб'єкта обстеження. Чи означає приблизно те ж саме, що валідність емпірична, з тією різницею, що тут мова йде про зв'язок між показниками методики та найбільш важливими, ключовими зовнішніми ознаками, що відносяться до поведінки досліджуваного. Психодіагностична методика вважається зовні валидной, якщо, наприклад, її допомогою оцінюються риси характеру індивіда і його зовні спостерігається поведінка узгоджується з результатами проведеного тестування.
Валідність внутрішня - стосовно психодіагностичних методик означає відповідність містять у ній завдань, субтестів; відповідність результатів психодіагностики, проведеної за допомогою даної методики, визначення оцінюваного психологічної властивості, використаному в самій методиці. Методика вважається внутрішньо не правильна або недостатньо правильна, коли всі або частину включених до неї питань, завдань і субтестів вимірюють не те, що потрібно даною методикою. Очевидна валідність - описує уявлення про тест, що склалися у випробуваного. Тест повинен сприйматися обстежуваним як серйозний інструмент пізнання його особистості. Очевидна валідність набуває особливого значення в сучасних умовах, коли уявлення про тестах у суспільній свідомості формується численними публікаціями в популярних газетах і журналах того, що можна назвати квазітестамі, за допомогою яких читачеві пропонується визначити все, що завгодно: від інтелекту до сумісності з майбутнім чоловіком.
Конкурентна валідність оцінюється по кореляції розробленого тесту з іншими, валідність яких відносно вимірюваного параметра встановлена. П. Клайн зазначає, що дані про конкурентну валідності корисні тоді, коли є незадовільно працюють тести для вимірювання деяких змінних, а нові створюються для того, щоб поліпшити якість вимірювання. Справді, якщо вже існує ефективний тест, то для чого потрібний такий же новий? Прогностична валідність встановлюється за допомогою кореляції між показниками тесту і деяким критерієм, що характеризує вимірюється властивість, але в більш пізній час. Наприклад, прогностична валідність якого-небудь тесту інтелекту може бути показана кореляцією його показників, отриманих у випробуваного у віці 10 років, з академічною успішністю в період закінчення середньої школи. Л. Кронбах вважає прогностичну валідність найбільш переконливим доказом того, що тест вимірює саме те, для чого він був призначений. Основна проблема, з якою стикається дослідник, який намагається встановити прогностичну валідність свого тіста, полягає у виборі зовнішнього критерію. У особливою мірою найчастіше це стосується вимірювання особистісних змінних, де підбір зовнішнього критерію - надзвичайно складне завдання, вирішення якої вимагає чималої винахідливості. Трохи простіше йде справа при визначенні зовнішнього критерію для когнітивних тестів, однак і в цьому випадку дослідникові доводиться «закривати очі» на багато проблем. Так, академічна успішність традиційно використовується в якості зовнішнього критерію при валідизації тестів інтелекту, але в той же час добре відомо, що успіхи в навчанні далеко не єдине свідчення високого інтелекту. Інкрементна валідність має обмежене значення і відноситься до випадку, коли один тест з батареї тестів може мати низьку кореляцію з критерієм, але не перекриватися іншими тестами з цієї батареї. У цьому випадку даний тест має інкрементний валідність. Це може бути корисно при проведенні профвідбору за допомогою психологічних тестів. Диференціальна валідність може бути проілюстрована на прикладі тестів інтересів. Тести інтересів зазвичай корелюють з академічною успішністю, але по-різному для різних дисциплін. Значення диференціальної валідності, так само як і інкрементний, обмежена.
Змістовна валідність визначається за допомогою підтвердження того, що завдання тесту відображають всі аспекти досліджуваної області поведінки. Зазвичай вона визначається у тестів досягнень (сенс вимірюваного параметра повністю зрозумілий), які як еже вказувалося, тестами, власне психологічними не є. На практиці для визначення змістовної валідності підбираються експерти, які вказують, яка область поведінки найбільш важлива, наприклад, для музичних здібностей, а потім, виходячи з цього, генеруються завдання тесту, які знову оцінюють експерти. Конструктная валідність тесту демонструється повним, наскільки це можливо, описом змінної, для вимірювання якої призначається тест. По суті справи, Конструктная валідність включає в себе всі підходи до визначення валідності, які були перераховані вище. Кронбах і Міл, які ввели в психодіагностику поняття конструктної валідності, намагалися вирішити проблему відбору критеріїв при валідизації тесту. Вони підкреслювали, що в багатьох випадках ні один окремо взятий критерій не може служити для валідизації окремого тесту. Можна вважати, що вирішення питання про конструктної валідності тесту являє собою пошук відповіді на два питання: 1) чи існує реально деяка властивість, 2) чи надійно вимірює даний тест індивідуальні відмінності по цій властивості. Цілком зрозуміло, що з конструктної валидностью пов'язана проблема об'єктивності в інтерпретації результатів з вивчення конструктної валідності, однак ця проблема общепсихологическая і виходить за рамки валідності.
4. Проблеми валідності
З вищесказаного випливає, що не існує будь-якого одиничного показника, за допомогою якого встановлюється валідність психологічного тесту. На відміну від показників надійності та діскрімінатівності, не можна здійснити точні статистичні розрахунки, що підтверджують валідність методики. Тим не менш, розробник повинен представити вагомі докази на користь валідності тесту, що вимагатиме від нього психологічних знань та інтуїції. Незважаючи на те, що проблемі валідності в класичній теорії тесту приділяється багато уваги, теоретично вона ніяк не вирішується. Пріоритет віддано надійності, що і виражено в правилі: валідність тесту не може бути більше його надійності. Валідність означає придатність тесту вимірювати те властивість, для вимірювання якого він призначений. Отже, чим більше на результат виконання тесту або окремого завдання впливає вимірюється властивість і чим менше - інші змінні (у тому числі зовнішні), тим тест валидной. Валідність - одна з найважливіших характеристик психодіагностичних методик та тестів, один з основних критеріїв їх якості. Це поняття близьке до поняття достовірності, але не цілком тотожний. Проблема валідності виникає в ході розробки та практичного застосування тесту або методики, коли потрібно встановити відповідність між ступенем вираженості цікавить властивості особистості і методом його вимірювання. Валідність вказує, що саме тест або методика вимірює і наскільки добре це робить; ніж вони правильна, тим краще відображається в них ту якість, заради виміру якого вони створювалися. Кількісно валідність може виражатися через кореляції результатів, отриманих за допомогою тесту або методики, за іншими показниками, - наприклад, з успішністю виконання відповідної діяльності. Валідність можна обгрунтувати різними шляхами, частіше за все - комплексно. Застосовуються також додаткові поняття валідності концептуальної, критеріальної, конструктивної, та інші види валідності - зі своїми способами встановлення їх рівня. Вимога валідності дуже важливо, і багато нарікання на адресу тестів чи інших психодіагностичних методик пов'язані з сумнівність їх валідності. Наприклад, валідність вимірювання інтелекту залежить:
1) від визначення поняття інтелекту, який є ту чи іншу концепцію цього феномену;
2) від складу тестових завдань, що розробляються згідно цієї концепції;
3) від емпіричних критеріїв.
Різні концепції вимагають різного складу завдань, тому важливим є питання валідності концептуальною. Чим більше завдання відповідають даній авторської концепції інтелекту, тим впевненіше можна говорити про концептуальної валідності тесту. Кореляція тесту в емперіческім критерієм вказує на його можливу валідність по відношенню до даного критерію. Визначення валідності тесту завжди вимагає постановки додаткових питань: валідність для чого? Для якої мети? За яким критерієм?

Висновок
Поняття валідності відображає прагматичну ідею обов'язкової практичної перевірки якості виміру психологічних властивостей людини. Якщо раніше поняття валідності частіше за інших асоціювалося з поняттям «якість тесту», то в останні роки все більше усвідомлюється роль інтерпретації тестових результатів. Таким чином, валідність - це перш за все, адекватність інтерпретації тестових результатів по відношенню до мети тестування, змісту основного поняття (змісту діагносціруемого психічного властивості) і застосування результатів тестування (у профвідбору та інших прикладних психологічних обседованіях). У контексті прикладної задачі валідність являє собою не стільки критерій якості тесту, скільки показник міри відповідності тесту мету тестування. Отже, поняття валідності відноситься не тільки до тексту, а й до критерію оцінки його якості. Чим вище коефіцієнт кореляції тесту з критерієм, тим вище валідність. Розвиток факторного аналізу дозволило створювати тести, валідні по відношенню до ідентифікується фактору. Тільки перевірені на валідність тести можна використовувати у професійній орієнтації, професійному відборі і в наукових дослідженнях.

Список використаних джерел
1. Анастазі А. Психологічне тестування. - СПб, 2001.
2. Бурлачук Л.Ф. Психодіагностика: Підручник для вузів .- СПб.: Питер, 2005.
3. Столяренко Л.Д. Основи психології. Практикум. - Ростов-на-Дону, 2005.
4.Общее психологія / За ред. А.В. Петровського. - Москва, 2005.
Додати в блог або на сайт

Цей текст може містити помилки.

Психологія | Контрольна робота
41.5кб. | скачати


Схожі роботи:
Валідність психологічного експерименту
Створення тесту в Flash
Аналіз акцентуації по тесту Леонгарда
Створення тесту на Visual Basic
Психометричний оцінка тесту середовищної аффіляціі
Сутність і роль тесту-опитувальника Стреляу
Тесту Келлі і ефективність психотерапії у хворих опійної наркоманією
Проблема психодіагностики особистості за допомогою тесту ЦТО Люшера
Використання тесту Векслера для визначення інтелектуальних якостей
© Усі права захищені
написати до нас