Історія розвитку системи тестування в Росії і за кордоном

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Історія розвитку системи тестування в Росії і за кордоном

План
1. Виникнення тестування.
2. Перші педагогічні тести.
3. Розвиток тестування в Росії.
4. Сучасна теорія тестів (IRT).

Виникнення тестування
Будь-яка спроба визначити точний час виникнення тестів нагадує прагнення географів знайти точне початок великої річки, яка витікає безліччю потічків з обширного болота. Приблизно так само йде справа і з тестами. Для вивчення історії тестів спочатку треба було вивчити передісторію - те саме болото, з якого і випливає їх справжня історія.
У Стародавньому Єгипті мистецтву жерців навчали тільки тих, хто витримував систему певних випробувань. Спочатку кандидат проходив процедуру, яку можна було б зараз назвати співбесідою. При цьому з'ясовували біографічні дані, рівень освіченості, оцінювали зовнішність, вміння вести бесіду. Потім перевіряли вміння - трудитися, слухати, мовчати. Проводили випробування вогнем, водою і загрозою смерті. Тим, хто не впевнений, що витримає всі тяготи тривалого освіти, пропонувалося подумати - з якого боку остаточно закрити за собою двері до храму - з внутрішньої чи зовнішньої?
Повідомляється (там же), що цю сувору систему випробувань і відбору успішно подолав в молоді роки Піфагор. Повернувшись після навчання до Греції, він заснував свою школу, допуск до якої відкривав тільки після серії різних випробувань, схожих на ті, які витримав він сам.
Піфагор підкреслював важливу роль інтелектуальних здібностей, стверджуючи, що "не з кожного дерева можна виточити Меркурія". І тому надавав значення діагностиці, в першу чергу, саме цих здібностей, що робилося з допомогою важких математичних завдань.
Як вважають, Піфагор звертав також увагу на ходу і на сміх молодих людей, стверджуючи, що манера сміятися служить самим хорошим показником характеру людини. Він уважно ставився до рекомендацій батьків і вчителів, ретельно вів спостереження за кожним новачком, особливо після того, як останнього запрошували вільно висловлюватися і, не соромлячись, сміливіше заперечувати думку співрозмовників (там же).
У III тисячолітті до н.е. в Китаї існувала посада урядового чиновника. Відповідно, з'явилися і перші елементи профвідбору на цю посаду. Відбору сприяла атмосфера урочистості й уваги до молодих людей, насмілилися тримати державні іспити на заняття з цієї посади. У китайському суспільстві ці іспити сприймалися майже як свято. Тему іспиту нерідко давав сам імператор, і він же проводив перевірку знань претендентів і на заключному етапі конкурсу.
Однією з найпоширеніших форм діагностики здібностей людини в ті часи була фізіогноміка - мистецтво розпізнавання характеру і здібностей людини за її зовнішнім виглядом. Гіппократ, вперше спожив це назва, вважав фізіогноміку наукою. Тоді ж з'явилися перші підручники і практичні посібники з физиогномике, а також і перші спеціалісти.
Є чимало свідчень застосування різних випробувань в Стародавньому Римі і Спарті. У Спарті була створена і успішно здійснювалася система виховання воїнів, в Римі - система навчання гладіаторів. "Люди-писав Платон, - народжуються не дуже схожими один на одного, їх природа різна, та й здатності до тієї чи іншої справи також ... Тому можна зробити все в більшій кількості, краще і легше, якщо виконувати одну яку-небудь роботу відповідно до своїх природних задатків ".
В Афінах обговорювалося питання про залежність могутності держави від здібностей осіб, їм керуючих. У роботі Платона "Держава" на питання про те, яких правителів потрібно вибирати, Сократ відповідає: "Треба віддавати перевагу найбільш надійним, мужнім, і по можливості, самим благообразним; крім того, треба відшукувати людей не тільки благородних і суворого вдачі, але й що володіють також властивостями, придатними для такого виховання. У них ... має бути гостра сприйнятливість до наук і швидка кмітливість. Треба шукати людину з хорошою пам'яттю, незламно твердого і у всіх відносинах працьовитого "(там же).
Нерідко результати випробування інтелектуальних здібностей ставали предметом гордості. Повідомляється, наприклад, що індійський цар Девсарам, бажаючи випробувати мудрість іранців, прислав їм шахи. Передбачалося, що іранці навряд чи зуміють розгадати суть цієї гри, і тому вони повинні були, за умовою, відіслати в Індію подати. Однак візир Важургміхр зрозумів правила гри і, у свою чергу, винайшов гру, яка називається зараз нарди. Цю гру він послав до Індії, і там з'ясувалося, що розгадати правила цієї гри індійці не змогли.
Різноманітні конкурси та іспити влаштовувалися і в середньовічному В'єтнамі. Всього за два роки, в період з 1370 по 1372 вдалося провести переатестацію всіх цивільних чиновників і військовослужбовців, що дозволило поліпшити роботу державного апарату. У результаті цього В'єтнам став сильним і життєздатним державою. Особливу увагу було приділено створенню боєздатного офіцерського корпусу. У ХV ст. іспити були там впорядковані. Вони проводилися за етапами і турам. Лауреати отримували подарунки від короля, їх імена вносилися в "золотий список", який експонувався у Східних воріт столиці, про їхні звитяги на конкурсі повідомлялося в рідну общину. Імена найбільш відзначилися учасників висікалися на спеціальних кам'яних стелах, встановлених у Храмі Літератури (там же).
Якщо використання письмових контрольних робіт та іспитів у країнах Сходу вже в ті роки вважалося цілком нормальним і природним справою, то цього не можна сказати про країни Заходу. Там виникали труднощі психологічного характеру, викликані спробами заміни звичних усних форм контролю письмовими. Наприклад, в Англії сто років пішло на злам консервативних традицій, які перешкоджали застосуванню письмових контрольних робіт у навчальному процесі, і ще сто років на те, щоб останні почали використовуватися на приймалень та випускних іспитах.
Втім, були винятки. У тій же Англії цінність письмових робіт швидше за інших оцінив Орден Єзуїтів, що побачив у них засіб підвищення мотивації навчальної роботи. Використовуючи свій вплив, Орден поширив практику застосування письмових робіт у багатьох інших країнах. Відповідна реакція на це в першу чергу проявилася в Америці. Повідомляється, що там, в 1762 р., відбулося відкрите виступ студентів Єльського університету проти використання письмової форми іспитів, через які їм доводиться багато зубрити.
У 1884г. в США вийшла перша книга з тестовими матеріалами, що містила завдання та відповіді до них з оцінкою за п'ятибальною шкалою. У цій книзі містилися завдання з математики, історії, граматики, навігації, давалися зразкові тексти творів разом з методом кількісної оцінки творів. Це був перший в історії випадок використання найпростіших статистичних розрахунків у педагогічній роботі.
Швидко поширюється в США, така форма контролю знань мала не тільки багато прихильників, а й противників. Повідомляється, наприклад, про шкільному інспектора з Чикаго, заборона в 1881р. проводити письмовий контроль і яка зобов'язана здійснювати переклад учнів в черговий клас не на основі перевірок, а спираючись виключно на думки вчителів і директорів шкіл. Поширилася думка, що ніхто краще вчителі не зможе оцінити здібності учня, і тому іспити і всякі інші форми контролю є знущанням над здоровим глуздом. Цим було покладено початок громадському руху проти будь-якого контролю в школі. Пік такого руху в США припав на кінець XIX століття (1880-ті роки), після чого знову почали з'являтися передумови для формування доброзичливого ставлення до контролю знань.
Потреба у створенні суспільно-державної системи контролю знань була усвідомлена в США в 1885 році. У Нью-Йорку почав діяти екзаменаційний рада - один з небагатьох рад, які змогли розробити методи об'єктивного контролю знань. Початок загальнодержавної системи оцінки знань поклало створення там в 1900 році комітету з перевірки знань абітурієнтів коледжів у США.
У Росії кінця XIX - початку XX століття питання розробки тестів та їх застосування не ставилося і не обговорювалося. "Перевірка знань, - писав один з авторів, - представляється мені з досвіду найнуднішим, непотрібним і навіть шкідливим заняттям. Вона терпима, як необхідне зло, тільки там, де від учителя вимагають щомісячних відміток як засоби контролю не тільки над учнями, а й над вчителем ". Однак з того часу в російській педагогіці стихійно сформувалися дві суперечливі тенденції: одна за контроль знань учнів, інша - проти.
Наведений тут короткий історичний екскурс дозволяє зробити висновок про необхідність розглядати випробування як важливу частину життя багатьох - якщо не всіх - народів світу, з часів найдавніших цивілізацій і до наших днів. Однак чи можна на підставі наведених даних говорити про ранній історичному періоді виникнення тестів? Якщо погодитися з найбільш поширеними зараз визначеннями тесту, що даються як переклад з англійського слова "test" (випробування, перевірка, проба), то на поставлене питання треба буде відповісти ствердно. А якщо не погодитися? Тоді треба допустити, що справжні тести з'явилися пізніше, в кінці XIX-початку XX століття.

Перші педагогічні тести

Родоначальником тестового руху можна назвати відомого англійського вченого Френсіса Гальтона. У 1884-85 роках він проводив серію випробувань для відвідувачів своїй лабораторії. Туди приходили діти і дорослі, вік випробовуваних варіював від 5 до 80 років. За невелику плату там визначалися швидкість реакції, вага, життєва ємність легень, сила кисті (стискання відомого кожному ручного динамометра; цей винахід Ф. Гальтона) сила удару кулаком, станова сила, зростання, гострота зору. Крім того, оцінювалися здібності запам'ятовувати літери і розрізняти кольори, ряд фізіологічних можливостей організму і деякі психічні властивості. За повною програмою було обстежено 9337 осіб.
Гальтон зазначав, що методично впорядковане тестування вимагає певних умов експерименту. Це був суттєвий відхід від тисячолітньої практики випробувань і перевірок, заснованих на інтуїції. Стосовно до тестів значення діяльності Гальтона можна порівняти з тим, що зробив для фізичної науки своїми дотепними експериментами Галілей. Набирав силу радикальний емпіризм розглядалося рядом вчених кінця XIX століття як прийнятна альтернатива ідеалізму, а експеримент - як справжній фундамент науки. Хоча не всі апаратурні випробування Гальтона можна назвати тестами з позиції сьогоднішнього дня, він зробив перший крок на шляху створення об'єктивних методів оцінки здібностей і властивостей особистості.
Іншим внеском Гальтона є висунення ідеї статистичної обробки результатів експерименту. Зіставляючи по осях абсцис і ординат середній зріст батьків із зростанням їх дорослих дітей, тобто, відкладаючи точки на площині, він знайшов такий, здавалося б, природний факт - чим вище був зріст батьків, тим вище, в середньому опинявся і зростання дітей. Але потім його наглядову розум зауважив, що в дуже високих батьків діти були, як правило, трохи нижче, в той час як у батьків, зростання яких був нижче середнього, діти виявлялися трохи вище зростом. Оскільки в цьому прозирало явне прагнення потомства до середнього зросту, виявлена ​​таким чином закономірна тенденція була витлумачена їм як загального закону природи, закону збереження виду, і названа "регресією до середнього.
Дж. Кеттелл першим, ймовірно, побачив у тестах засіб вимірювання, здавалося б, не вимірюваних властивостей особистості. У роботі, опублікованій в 1890 р., він дав список 50 лабораторних тестів, до яких була стандартна інструкція. У тій же роботі підкреслювався науково-лабораторний характер випробувань. Зокрема, вказувалося, що лабораторію слід добре обладнати, під час тестування в неї не допускаються глядачі; всі випробувані однаково інструктуються, вони повинні добре засвоїти, що і як потрібно їм робити. Крім того, робилися рекомендації за підрахунком балів.
Більшість завдань Кеттелла і Гальтона можна зараз назвати психомоторними завданнями, тому що їх тестам явно не діставало стандартизації процедури тестування та правил інтерпретації результатів. Чи треба говорити, як незвичній виявилася ідея вимірювання для педагогіки і психології кінця XIX століття. Практичні потреби вивчення здібностей були сформульовані тоді у вигляді важливою для педагогіки і психології проблеми дослідження індивідуальних відмінностей. Дослідження цієї проблеми і дало імпульс до появи перших тестів
Вимірювання за допомогою тестів здавалося тоді (а багатьом педагогам з гуманітарних дисциплін здається і донині) справою якщо не дивним, то претензійним. Буденна свідомість виходить при цьому з аналогії з фізичними вимірами і розглядає подібні спроби як математизацію, чужу для гуманітарних наук.
До кінця ХIХ століття в Європі склалися дві традиції в контролі знань. В одній (її можна назвати умовно назвати німецькою) упор робився на усні форми іспиту, в присутності комісії, що складалася щонайменше, з двох чоловік. На іспиті давалися один (рідко два) порівняно об'ємних питання, відповідь на які повинен був свідчити про рівень знань всього курсу. Інша традиція, яку можна назвати англійської, - це письмова форма контролю, під час якого піддослідним давалося десять-дванадцять коротких завдань з різних тем.
Починаючи з першого десятиліття XX століття повсякденне уявлення про тест і його наукове визначення стали помітно відрізнятися один від одного. Хоча будь-тест включає в себе завдання як елементи випробувань, він не зводиться лише до цього, бо зараз це і метод наукового дослідження, що включає в себе ряд вимог вимірювання. На кожному етапі розвитку науки змінювалися вимоги до тестів і самі тести. Ігнорування цього діалектичного моменту нерідко призводило до спрощенство в оцінках тестів. Спрощенство виявлялося, головним чином, у поглядах на тест як на засіб, що збігається з іншими поширеними формами оцінки знань - такими, як, наприклад, залік, іспит. Але це невірно. Тест є засобом педагогічного вимірювання, що вигідно відрізняє його від всіх інших форм педагогічного контролю.
Перша спроба наукового вимірювання інтелектуальних здібностей дітей була зроблена на початку XX століття. Це сталося у Франції. Автори створеного для цієї мети тесту А. Біне і Т. Симон провели емпіричну перевірку завдань, які претендують на включення в тест. Для оцінки працездатності завдань тесту автори використовували два основні критерії: 1) емпіричну ступінь складності кожного завдання, визначається на групах дітей різного віку і 2) інформацію про ступінь збігу результатів тесту з думкою викладачів. Для досягнення порівнянності даних, отриманих ними з даними інших дослідників та мінімізації помилок вимірювання, А. Біне і Т. Симон доклали до тесту стандартну інструкцію з проведення тестування.
Перша світова війна активізувала розробку тестів для визначення професійної придатності і для прискореної підготовки осіб, що володіють потрібними для військової справи знаннями і навичками, інтелектуальними та фізичними якостями. Інтенсивне технічне переозброєння промисловості провідних капіталістичних держав на початку XX століття актуалізувало проблему "людина - техніка". Все гостріше стала усвідомлюватися думка про те, що не кожен охочий зможе управляти складними технічними пристроями: для цього необхідні знання, здібності і відповідні навички, а значить, потрібні тести, професійний відбір та професійна підготовка. За даними англійської статистики, в першу світову війну тільки 2% втрат авіації були пов'язані безпосередньо з бойовими операціями; 8% було втрачено через дефекти матеріальної частини, а більше всього - 90% втрат було викликано професійною непридатністю тих, хто пілотував літаки.
Війна суттєво загострила інтерес до питань співвіднесення здібностей людини з вимогами професій. "Всім стало ясно, - писав у ті роки Г. Мюнстерберг, - що ніяка марнотратність цінних благ не має настільки згубного характеру, як марнотратство ... живих сил народу, що розподіляються в повній залежності від випадку. ... Зовсім не звертається увага на відповідність між працею і працівником ". Тим самим було підготовлено грунт для розгортання науково-дослідних робіт за тестовими методам оцінки особистості. У США був створений перший варіант так званого групового тесту, який дозволяв швидко оцінити придатність призовників до військової служби в різних родах військ. Створений тест розглядався як таємна зброя, тому всі випробування, масштаб досліджень і результати не розголошувалися. На підставі цих досліджень проводилося відрахування "негідних осіб", призначення на "чорні роботи" нездатних до строю, комплектування унтер-офіцерських і офіцерських шкіл, вирівнювання частин за рівнем інтелектуальності, набір у спеціальні частини і т.п.
Перші тести для об'єктивного контролю знань, умінь і навичок з'явилися на початку XX століття. Вони швидко завоювали популярність серед викладачів вузів і шкіл в Англії і США, а пізніше в Росії і СРСР. Приблизно з цього часу їх почали в США називати педагогічними. Саме ці тести викликали насторожене ставлення до себе у прихильників традиційної, "чистої", без тестів, педагогічної науки і практики. Така ж настороженість виявлялася і по відношенню до педології, широко спиралася на тести. Поява в цей час нового прикладного напрямку, педології, не було історичною випадковістю. Це було неминуче, як поява інших прикладних наук. Хоча педологія претендувала на статус фундаментальної науки про комплексний розвиток дитини вона, якщо судити з її методи і результати, була все-таки прикладної педагогікою, необхідно доповнювати тодішню вітчизняну педагогіку в її самому слабкому місці - у зв'язку науки з практикою освіти і навчання. Однак замість співпраці педагогіки та педології почалося політичне побиття останньої, що закінчилося не наукової, а політичною ж "перемогою" прихильників "чистої" педагогіки. На хвилі революційних перетворень "перемогли" прихильники вигнання зі школи тестів, будь-якого контролю знань і, разом з цим, педології. Педологія стала першою в списку наук, які пізніше назвуть репресованими.
У ті роки були, однак, і інші виступи - на користь тестів. Так, відомий психолог М.Я. Басов говорив: "Я думаю все ж, що ця довга, часом гостра критика тестової методики ... зрештою, призведе не до повалення, не до скасування цієї методики, а, навпаки, до її зміцнення і до її утвердженню в певних межах , в яких вона, очевидно, має повне право на застосування і існування ". Оскільки на той час тести отримали визнання та розвиток тільки в межах прикладних напрямків - педології та психотехніки, розмежування цих напрямів з педагогікою і психологією проходило, в першу чергу, по відношенню до тестів. Крім цього, обидві сторони вели затяжні дискусії з взаємними звинуваченнями. Педагогіка і психологія звинувачувалися в схоластиці, вузькому академізмі, в нездатності сприйняти нове й у відриві від практики. Прикладники, у свою чергу, засуджувалися за вузький практицизм, що суперечить духу науки, за відрив від педагогіки, психології; вони звинувачувалися також у голом емпіризмі, наслідуванні західних зразків і в надмірному захопленні тестами.
Розрив між фундаментальним і прикладним напрямками був до недавнього часу характерний для багатьох інших наук, але не скрізь він протікав настільки болісно, ​​як у педагогіці. Для представників "чистої науки" прікладность не мала помітної цінності. У 30-х роках вчені Кембриджу, як згадує Ч. Сноу, найбільше пишалися тим, що їх наукова діяльність ні за яких мислимих обставин не може мати практичного сенсу. Методи і результати педології лежали в сфері прикладної діяльності, в той час як зусилля традиційної педагогіки були спрямовані на створення загальної теорії. Ці ж роки характеризуються широким використанням тестів в інших країнах. У Франції вони стали застосовуватися для дефектологічних цілей і для профорієнтації, у США тести використовувалися при прийомі на роботу, у вузи, для оцінки знань школярів і студентів, для проведення соціально - психологічних досліджень. Була зроблена перша спроба об'єктивно порівняти знання студентів різних коледжів штату Пенсільванія. Але й критика не заспокоювалася. Вона починала набувати все більш широкого розмаху і виходити за рамки чисто наукових дискусій.
У США проти використання тестів виступали представники основних груп населення - дорослі і діти, білі і негри, робітники і управлінський персонал, а також представники національних меншин. Дослідження за соціальними наслідками тестування з'ясували, що 37% опитаних заперечували проти використання тестів при вступі на роботу, 50% - при просуванні по службі, 25% - проти використання тестів у школі. Випадки порушення етики у використанні тестів виявилися настільки злободенними, що ними змушений був зайнятися конгрес, який влаштував спеціальні слухання у цій справі. У результаті було прийнято рішення, яке засуджує неетичну використання тестів. У серпні 1966 р. в сенаті США обговорювалася пропозиція про повну заборону тестів, але ця пропозиція не була підтримана більшістю.
У зарубіжній літературі виділяється декілька джерел критики тестів. Перше джерело Брим вбачає в особистісному портреті критиків. У числі останніх частіше за інших виявляються ті, хто не схильний до інтроспекції, авторитарний в міжособистісних відносинах, нетерпимий до думки інших і заперечує проти будь-яких соціальних змін. Як правило, в США ці особи примикають до правих політичних груп, які вимагають заборони тестів. Друге джерело критики бачить в системі соціальних цінностей, що має своє коріння у ставленні до питань рівності людей. Якщо в суспільстві схвалюється принцип відкритого змагання його членів, то в кожному поколінні на передові позиції висуваються найбільш талановиті люди. У такому суспільстві кожен має можливість внести свій внесок у відповідності зі своїми здібностями. Останні повинні бути оцінені, і тому орієнтація на цей принцип створює сприятливе ставлення до тестів. Третє джерело, на думку Кеттела, є наслідком емоційного і сентиментального ставлення людей естетичного та нарцісстіческого типу до всякої спробі представити "унікальну, художню особистість", як він пише, у вигляді формул і т.п.
Тести застосовувалися у двох основних сферах: в освіті і в сфері профвідбору-профорієнтації. Порушені тестами настільки важливі сфери життя і прямий вплив результатів тестового контролю на долі мільйонів людей породили широку гаму думок на користь і проти тестів. Великий ентузіазм тих, хто їх застосовував, і не менший песимізм тих, хто бачив недосконалість цього методу або постраждав в результаті його неправильного використання, породили в багатьох країнах, у тому числі і в СРСР, листи в урядові органи і в газети з вимогою заборони тестів .
Застій у розробці тестів та їх застосування тривав близько сорока років - з середини 30-х до кінця 70-х років, після чого знову почали з'являтися публікації з цієї проблеми, спрямовані як на користь тестів, так і проти них. Типові аргументи опонентів тестового методу зводилися, в узагальненому вигляді, до наступних тверджень:
- Тести використовуються в капіталістичних країнах, де з їх допомогою вирішуються питання расової і класової диференціації;
- Застосування тестів принижує гідність особистості, особливо у випадках, коли одержувані бали виявляються нижче середнього рівня;
- Ніякі методи вимірювання не можуть замінити викладача і його особистий досвід;
- В педагогіці немає і не може бути точною одиниці виміру, і тому не слід гаяти час, сили і кошти на розробку неточних методів.
У цих твердженнях багато спірного, і навіть помилкового. Що стосується застосування тестів для цілей расової і класової диференціації, то навряд чи тут треба звинувачувати тести. Як всякий засіб, вони можуть бути використані на користь чи на шкоду, залежно від ідеології, політики, компетенції, цільових установок і т.п. Про можливе приниженні гідності особистості, наклеюванні ярликів тощо можна сказати, що для запобігання неприємних наслідків такого роду, якщо це взагалі можливо при культурній роботі, розроблені спеціальні правила поводження з тестами і випробуваними. У цих правилах всі виникаючі питання етичного характеру передбачено вирішувати на користь особистості. Дотримання етичних норм є неодмінною частиною професійної підготовки тих, хто працює з тестами. Тестові методи не покликані заміняти викладача і його особистий досвід, а навпаки, покликані допомагати йому, звільнивши його від рутинної роботи і дати, тим самим, йому можливість зосередитися на підвищенні якості викладання. По-друге, хоча точність педагогічних вимірювань і не може зрівнятися з точністю фізичних вимірювань, переваги перших, тим не менш, досить очевидні, вони описані повсюдно.
У той час як у нашій країні обговорювалося питання, бути тестів чи не бути, в США ставилися інші питання: як підвищити якість тестів, як зробити результати тестування незалежними від групи випробовуваних і від того чи іншого набору завдань? До початку другої світової війни там уже був накопичений великий досвід розробки тестів. Війна дала сильний поштовх авіабудування. Відповідно, знадобилися сотні тисяч пілотів, штурманів, механіків, стрільців-радистів, фахівців з налагодження навігаційного обладнання. Кожна з перелічених професій вимагала наявності певних здібностей - інтелектуальних, фізичних, психомоторних, і всі ці здібності треба було швидко і ефективно оцінити. Для участі в цій роботі були мобілізовані вчені, які займалися питаннями вимірювання в психології і в соціології. За початкової освіти це були, в основному, математиків, які займалися питаннями відповідних психологічних або соціологічних вимірів. З початком війни майже всі кадри так званих психометрики були направлені в спеціально створену військову частину на авіабазі Рандольфільд, для проведення там, на основі багатостороннього тестування, професійного відбору та класифікації готується по всій країні персоналу з числа льотчиків, штурманів, мотористів і т. д. Оскільки війна диктувала короткі терміни проведення дослідження, а тестів не вистачало, вся робота по профотбору, створенню і з перевірки якості тестів велася паралельно. Наприклад, з 550 тисяч осіб, підданих тестового контролю в одному, 1942 року, приблизно тільки половина була допущена до навчання зазначеним професіям.
Тим часом громадськість продовжувала висловлювати сумніви в якості використовуваних тестів. Тому було вирішено провести експеримент. У лавах самих експериментаторів не було одностайності, оскільки потрібно було перевірити ефективність їхньої власної роботи. Серед аргументів, що висувалися проти експерименту, були: чи потрібен він у важкий воєнний час; а раптом розкриють недоліки тестів, що здаються зараз цілком працездатними, а головне, вже затверджених керівництвом ...".
Експериментальна група складалася з 1143 чоловік, відібраних у випадковому порядку з числа осіб, які пройшли тестування за повною програмою та зарахованих на курси підготовки військових льотчиків, незалежно від показаних ними результатів у тестуванні. Контрольну групу склали понад 230000 осіб, допущених до навчання в 1943 році в залежності від отриманих ними тестових балів. Результати порівняння виявилися наступними: в експериментальній групі тільки 23 відсотки змогли закінчити курс навчання, в той час як серед відібраних за допомогою тестів відсоток успішно закінчили льотні школи виявився більш 60. Відмінності, як кажуть статистики, виявилися досить достовірними. Оскільки навчання військового льотчика коштує дорожче підготовки професора, а відрахування невдах проводилося, як правило, не раніше того, як курсанти проходили приблизно третю частину терміну підготовки, неважко було уявити собі масштаби економії коштів за рахунок використання тестів. Один з активних учасників процесу відбору військових фахівців підрахував, що на кожен долар, витрачений на цю програму, бюджет заощадив тисячу доларів.
Інший проект використання тестів у США був спрямований на вивчення і вдосконалення методів адаптації призовників до військової служби. Зокрема, він мав на меті підняти боєздатність американських солдатів за рахунок зниження в них почуття страху. Відповідно до вчення З. Фрейда, це почуття відносилося до прихованих, або, інакше, латентним властивостями особистості. Звідси і назва загальної методології дослідження таких властивостей - латентно-структурний аналіз (від англ. Latent Structure Analyses, або скорочено, LSA). Ця методологія націлена на виявлення латентних якостей і факторів поведінки за допомогою математико-статистичних моделей вимірювання. Було проведено широкомасштабне соціально-психологічне дослідження "American Soldier", покликане підвищити боєздатність солдатів за рахунок виявлення та усунення тих прихованих чинників, які впливають на поведінку солдатів у бойовій обстановці.
Поняття "латентна", або, як іноді пишуть у нашій літературі, "прихована" змінна мимоволі викликає асоціацію з метафізичним вченням про якісь прихованих від безпосереднього сприйняття "сверхфізіческая" сутності кожної речі або явища, узятих поза їх зв'язків і відносин в оточуючому їх світі. Грунтуючись на цій помилкової асоціації, можна було б, як робилося раніше, взагалі не розглядати ідею латентно-структурного аналізу, вважаючи її черговим проявом антідіалектізма в науці. Однак такий хід мислення привів би до помилки, бо наукове мислення спирається не стільки на асоціації, скільки на раціональність. А це, перш за все, є сфера принципів, припущень і процедур, що забезпечують об'єктивність, логічну примусовість та результативність у процесі пізнання.
Сенс введення латентної змінної вимагає короткого роз'яснення. Вона являє собою найпростішу форму реалізації ідеї існування прихованого фактор, що впливає на результати піддослідних. Результати тесту завжди містять у собі помилки вимірювання, що утрудняють оцінку істинного значення тестового бала на латентної змінної. Оскільки латентна змінна з'являється в результаті концептуалізації, вона завжди залишається гіпотетичної змінної, на якій з більшою чи меншою точністю оцінюються істинні результати піддослідних. Латентна мінлива являє собою концептуальну модель даного дослідника якості піддослідних.
Спроби судити про невидимих ​​речах із видимих ​​проявів мали місце ще в далекій давнині. Так, наприклад, Платон стверджував, що справжня астрономія займається не вивченням руху спостережуваних небесних тіл, а вивченням законів руху зірок з математичного неба; недосконалим зображенням останнього є видиме небо. В епоху Відродження приховані якості розглядалися як певні сили, властиві усім речам, причому кожна річ представлялася як щось двоїсте: чуттєво сприйманий предмет і внутрішнє "приховане якість", яке викликало зміна спостережуваних властивостей. Ця ідея знову пробила собі дорогу в науці середини ХХ століття.
Розвиток тестування в Росії
Можна сказати, що Росія кінця XIX століття запозичила в основному німецький варіант перевірки знань. Але в ті роки тут про тести ніхто ще нічого не написав. Схоже, що в країні їх не було.
У Росії кінця XIX - початку XX століття питання розробки тестів та їх застосування для оцінки знань не ставилося і не обговорювалося. Як свідчать перші звіти Санкт-Петербурзького педагогічного товариства, ще в 1872-1875гг. йшли дискусії лише про корисність і шкідливість бальних оцінок.
Суть і дух дискусій передає уривок зі статті О. Ерна: "... ні по одному з поставлених питань члени педагогічного товариства не змогли прийти до угоди. Правда, під кінець дебатів захисники балів готові були майже поступитися своїм опонентам. Вони погоджувалися визнати, що оцінка успіхів учнів балами у багатьох відношеннях незручна і вносить до школи багато небажаних елементів; вони наважувалися навіть відмовитися від системи оцінок, але тільки під однією умовою: вони вимагали, щоб їм точно і виразно було вказано, ніж передбачається замінити бали ". Позиція прихильників вигнання бальної оцінки з російської школи чітко була виражена словами члена педагогічного товариства Миропольского: ... "Смерть балам загрожує неминуча; не сьогодні, завтра, дні їх полічені". Учасник тих дискусій К. Сент-Ілер поставив ряд питань, що стосуються застосування відміток (балів) у школі. Основним з питань було: слід або не слід успіхи учнів висловлювати цифрами? Певної відповіді на нього не було отримано.
Відповідно, не велася наукова робота в цій області. Але приділялася увага поліпшенню якості контролю знань. У кінці XIX століття в пресі обговорювалося питання про введення іспитів. У циркулярі по Санкт-Петербурзькому навчального округу "Про виробництво випробувань зрілості без послаблень", повідомлялося, що в багатьох гімназіях випробування зрілості виробляються вкрай поблажливо, з дуже великими послабленнями. А ця обставина, у свою чергу, дуже несприятливо відгукується на всьому ході навчального справи, привчаючи вихованців поверхнево відноситься до засвоєння викладаються ними наук в надії на очікувані послаблення на випробуваннях. У цьому ж циркулярі є вражаюче точні слова про вимоги до змісту контрольних матеріалів: "не обтяжуючи вимогами дрібних і другорядних подробиць ... необхідно упевнитися в знанні істотно-важливого в кожному предметі".
У травні 1918 року було прийнято Постанову Народного Комісаріату по освіті РРФСР, в якому були скасовані всі іспити - вступні, перехідні і випускні. Разом з цим була скасована і бальна система оцінки, як там написано, "пізнань і поведінки учнів у всіх, без винятку, випадках шкільного життя. Переклад з класу в клас, і видача свідоцтв повинні проводитися на підставі успіхів учнів, за відгуками педагогічної ради про виконання навчальної роботи. 2 серпня 1918 був прийнятий декрет Ради Народних Комісарів РРФСР "Про правила прийому до вищих навчальних закладів", в якому стверджувалося буквально наступне: "Кожна особа може вступити до числа слухачів будь-якого вищого навчального закладу без надання диплома, атестата або свідоцтва про закінчення середньої або будь-якої школи ". Пізніше було підведено та обгрунтування під рішення про скасування іспитів: "шляхом іспиту не можна скласти правильне уявлення про знання й про розумовому розвитку учнів" і що "іспит чинить руйнівну дію на учнів і студентів", "має стільки смертних гріхів, що навряд чи знайдуться його захисники ".
Відхід від такого роду нігілізму настав спочатку у вищій школі, що трапилося в 1924 році. Постановою другої сесії ВЦВК було запропоновано "розробити питання про форми перевірки придатності кандидатів до вступу до ВНЗ, а також виробити нову систему перевірки знань і обліку успішності студентів". У 1932 році ЦК ВКП (б) у своїй постанові вважає за необхідне "встановлення наприкінці року перевірочних випробувань для всіх учнів. У цій же постанові є цікавий пункт. "Всякі складні схеми і форми обліку та звітності заборонити".
Поступово зростав і рівень загального обов'язкового освіти, з 7 до 10 класів середньої школи, тобто вирішувалося завдання народної освіти. Під впливом егалітарістскіе установок у педагогічному середовищі актуалізувалося безліч розхожих афоризмів типу "незамінних людей немає", "немає поганих учнів, є погані вчителі", "не висовуватися" і т.п. У країні, влаштованій після егалітарної принципом, люди розглядалися як взаємозамінні "гвинтики" суспільної машини, керованої Вождем. З початку тридцятих років дозріла ідея тотального контролю, в рамках якої в системі освіти знову почали використовуватися іспити.
У середині тридцятих років виявилася неадекватність системи оцінки знань завданням, поставленим партією перед радянською школою. У Постанові Ради народних Комісарів і ЦК ВКП (б) від 3 вересня 1935 стверджувалося, що "встановлена ​​Наркомпросса система оцінки успішності не дає уявлення про фактичні знання учнів і веде, на практиці, до зниження рівня навчання". Там же доручалося відділу ЦК ВКП (б) розробити, обов'язкове для всіх шкіл СРСР, норми оцінки успішності учнів, з тим, щоб один і той же рівень знань однаково оцінювався в усіх школах ". Зважаючи на нездатність навчального відділу ЦК партії вирішити цю методичну завдання доручення так і залишилося невиконаним. Не вирішили її й усі наступні покоління керівних діячів союзного і російської освіти.
Насувалася друга світова війна, для перемоги в якій були потрібні мільйони технічно підготовлених фахівців. По всій країні відкривалися нові навчальні та науково-дослідні інститути, військові училища. Промисловість поступово переводилася на військові рейки. Для відбору курсантів у льотні училища створювалися медичні комісії, які й повинні були займатися питаннями якщо не професійного відбору, то хоча б відбраковуванням тих, хто не годився для виконання льотної роботи за показниками здоров'я. Тестів як системи завдань зростаючої труднощі в цих комісіях ще не було. В основному там використовувалися різні проби, вимірювання рівня тиску крові, пульсу, перевірялися здатність розрізняти кольори, реакція на звук, нервова провідність, стійкість до запаморочення. За допомогою контрольних нормативів перевірялася і фізична підготовленість.
Відроджуватися після революційних потрясінь радянська школа відкрилася практично всім відомим тоді в світі педагогічним новаціям, таким як Вальдорфские і Монтессорі-школи, Дальтон-план та ін Серед цих новацій були і тести. Розквіт був, однак, недовгим. До початку 30-х років все почало згортатися і повертатися до старих форм. У 1933 році було прийнято рішення про проведення перших в історії радянської держави перевірочних випробувань всіх школярів. У керівному документах з цього приводу спеціально відзначалася "неприпустимість - як там було написано - навмисного" срезиванія "учнів шляхом постановки особливо важких для них," каверзних питань ". Оскільки подібні явища відбувалися не тільки тоді, але відбуваються, в масовому порядку і зараз на вступних екзаменах до вузів, то щось подібне, але в сучасному формулюванні, і з мірою відповідальності, корисно було б ввести і в "Порядок прийому до державних освітніх установ вищої професійної освіти", яким Міносвіти намагається зараз регламентувати процес оцінки знань абітурієнтів.
Введення масового контролю знань школярів збіглося за часом з періодом зміцнення режиму особистої влади Сталіна, з його прагненням напряму підпорядкувати собі роботу Наркомосом. У зв'язку з тим, що більшість його політичних опонентів доброзичливо ставилися до педології і до ідеї тестування, Сталін розгорнув боротьбу проти педологів, вважаючи їх своїми якщо не явними, то потенційними супротивниками. Поява у той час педології не було історичною випадковістю. Це було так само неминуче, як поява та інших прикладних наук. Хоча педологія претендувала на статус фундаментальної науки про комплексний розвиток дитини, вона була, якщо судити за методами і результатами, все-таки прикладної педагогікою, необхідно доповнювати педагогіку в її самому слабкому місці - зв'язку науки з практикою освіти і навчання. Однак замість співпраці педагогіки та педології почалося політичне побиття останньої, що закінчилося не наукової, а швидше, політичною "перемогою" прихильників "чистої" педагогіки. Таким чином, педологія стала першою в списку наук, які пізніше назвуть репресованими.
Заборона педології, а разом з нею і тестів, стало одним з перших фактів ідеологічного тиску на неугодні науки, наукові напрями і на окремих вчених. У числі постраждалих від такого тиску, а часом просто нахабною і підлої цькування, виявилися автори випускалися в кінці 20-х - початку 30-х років збірок "Тести: теорія і практика". Це М.Я. Басов, М.С. Бернштейн, П.П. Блонський, А.П. Болтунов, С.М. Васілейскій. Запанувала після заборони ситуація негативного ставлення до тестів, в якій останні відкидалися, як то кажуть, з порога не давала практичної можливості публікувати що-небудь в їх захист. Усього в 1937 році було репресовано понад 300 вчених - педагогів і педологів. Були репресовані також наркоми освіти Cоюза і всіх республік, їх заступники, начальники відділів та багато інших. У політичному житті країни різко посилився суб'єктивізм. Суб'єктивізм у політиці, а потім і в педагогіці, перешкоджав розвитку будь-якого об'єктивного методу контролю, бо в останньому вбачалася загроза існуванню командно-адміністративної системи, з її ретельно культивуються "негативним" підбором кадрів, відповідно до якого кожне наступне покоління управлінських кадрів виявляється гіршим за попередній . Це відбувається, зокрема, через те, що вирішальними ознакою підбору стають не знання і не здібності, а слухняність у виконанні наказів вищих, часто некомпетентних, а то й психічно нездорових осіб. Слухняними легко керувати. На жаль, помилкова кадрова політика триває в Росії і зараз.
Тести виникли значно пізніше того періоду, коли в Європі вже склалися перші педагогічні системи Коменського, Ушинського, Дістервега, Гербарта, Песталоцці та ін Ідея Гельвеція про всемогутність виховання була підхоплена Марксом і абсолютизована на російському грунті з початку 30-х років - у формі панівної ідеї радянської педагогічної науки, основним предметом і метою якої стало виховання в дусі відданості відомим особам та ідеям; інші складові, такі, як освіта та навчання, могли бути тільки виховують в тому ж дусі. Побічним продуктом цієї ідеї стала так звана "виховна концепція" профорієнтації, мета і методи якої виродилися у пропаганду робітничих професій та в суперечить здоровому глузду заперечення тестів.
Тести заборонили в 1936 році як "буржуазні і шкідливі", але справжні причини заборони - розстановка сил в політичній боротьбі того періоду. Запанувала після заборони ситуація негативного ставлення до тестів не давала практичної можливості публікувати що-небудь в їх захист. І ця ситуація тривала протягом приблизно сорока років. Протягом усього цього часу друкувалися переважно статті про шкідливість тестів, про неприпустимість використання останніх у вітчизняній педагогічній науці і практиці. Відповідно, в цих умовах важко було знайти бажаючих займатися тестової проблематикою і вводити її в плани науково-дослідних установ, а також писати праці на "недіссертабельную" тему. Педагогіка того часу втратила інтерес до тестів і до проведення емпіричних досліджень; почасти тому вона протягом багатьох років залишалася однією з небагатьох суспільних наук, позбавлених якісного емпіричного базису. З тієї далекої пори емпіричне напрям педагогічних досліджень так і залишилося в нерозвиненому стані.
Хоча в тридцятих роках практична робота по тестах загальмувалася, наукове вивчення дійсних можливостей цього методу в СРСР повністю не припинялося. Частина тестів застосовувалася під виглядом контрольних завдань, випробувань. І навпаки, різні випробування нерідко називалися тестами. Практика тестування характеризувалася серйозними протиріччями, що привело до заборони застосування тестів у сфері освіти, профвідбору та профорієнтації.
З тих пір ставлення до тестів стало неоднозначним. Одні бачили в тестовому контролі засіб приниження ролі педагога, сприймали тести як засіб виразу недовіри до традиційно виставляються оцінками і тому виявляли певну настороженість. Інші вважали самі тести винними в різних порушеннях і тому відкидали ідею тестового контролю знань, як то кажуть, з порога. І тільки деякі розглядали їх як засіб радикального перетворення навчального процесу в бік його об'єктивізації - і ставали ентузіастами цього методу. Як прозорливо зазначав П.П. Блонський, тести - це більше, ніж засіб контролю; це засіб раціоналізації шкільної справи, і хочеться додати, освіти в цілому.
Оскільки тести вважалися основним методом педології, то відмовивши в науковості педології, керівники педагогічної науки тих років відмовилися визнати також і науковість тестів. Тут було допущено відразу декілька помилок, можливо, навмисних. Одна - у ставленні до педології, яка мала ряд цікавих наукових досягнень, не вписувалися в сучасну їй педагогіку. Друга помилка - у визнанні тестів в якості специфічного методу педології. Хоча відомо, що абсолютно специфічних приватних методів (у яких би не були присутні елементи пізнання, що застосовуються в інших методах) немає. І третя помилка - відмова у визнанні науковості тестового методу. Це сильно загальмувало розвиток самої педагогічної науки, позбавивши її передумов для розробки самого ефективного методу контролю знань.
У СРСР умов для занять тестами фактично не було.
Тестування в СРСР і Росії періоду п'ятдесятих - сімдесятих років нашого століття можна охарактеризувати як застій. Над суспільним устроєм життя був достатній суб'єктивізм членів Політбюро ЦК КПРС. Суб'єктивізм, як відомо, світоглядна позиція, що ігнорує об'єктивний підхід до дійсності, яка заперечує об'єктивні закони природи і суспільства. Він завжди перешкоджав розвитку суспільства, а разом з тим, і тестових методів об'єктивного контролю знань.
У СРСР багато писалося про шкідливість і буржуазності тестів, про неприпустимість використання останніх у педагогічній науці і практиці. Суб'єктивізму і пов'язаним з ним різних порушень протиставляється така система організації контролю, яка б виключила негативні прояви у принципі, спиралася б на об'єктивувалися методи. Проте в рамках авторитарної педагогіки контроль нерідко ставав засобом не стільки спонукання, скільки примусу до гарного навчання, що викликало нерідко негативну реакцію учнів.
Аналіз стану справ з тестовим контролем в СРСР і в інших країнах показував: багато країн випереджали нас за масштабами практичної роботи, щодо фінансування наукових досліджень, за кількістю публікацій, з підготовки наукових кадрів, за рівнем та якістю розвитку теорії тестів, за технічної та програмно- обчислювальної оснащеності тестового процесу. Найбільш розвинені в тестовому відношенні країни - Нідерланди, США, Англія, Японія, Данія, Франція, Ізраїль, Фінляндія, Канада, Австралія, Нова Зеландія та ін Немає ніякої випадковості у тому, що в цей список потрапили країни з високим рівнем життя населення. На думку В.С. Аванесова, тут зв'язок опосередкована ланцюжком: застосування тестів благотворно впливає на якість освіти, якість освіти пов'язано з якістю управління; якісне управління створює передумови для підвищення якості життя населення. Така дивовижна зв'язок тестів з якістю життя.
Хоча інтерес до тестів в СРСР помітно виріс, ситуація з ними не тільки не покращилася, а в деяких аспектах навіть погіршилася. Тому що гадана простота створення тестів, у поєднанні з кон'юнктурними інтересами породили безліч неякісних саморобок, які дискредитують цей перспективний метод наукової організації самоконтролю та об'єктивного педагогічного контролю знань. Тестування ставало свого роду модою, особливо в престижних школах, де тести починають застосовувати замість приймалень та випускних іспитів. Частково це відбувалося через те, що найбільш поширеним і визнаним у світі методом об'єктивної оцінки знань вважався саме тест.
І це не випадково. Тести дають можливість помітно поліпшити освітній процес, тому що мають ряд переваг перед іншими методами контролю знань; будучи обов'язковою частиною багатьох педагогічних новацій, вони знижують витрати на перевірку знань, допомагають виявити індивідуальний темп навчання, а також прогалини у поточній та підсумкової підготовці. У поєднанні з персональними ЕОМ, тести допомагають перейти до створення сучасних систем адаптивного навчання та контролю - найбільш сучасних організації навчального процесу. Без тестів неможливий перехід до самої прогресивному на сьогодні навчання учнів на основі, так званої у нас системи повного засвоєння знань. Саме в такій системі тести і завдання у тестовій формі буквально пронизують всю навчальну діяльність викладачів та учнів. Навчання починається з вхідного тестування, супроводжується поточним контролем за допомогою завдань у тестовій формі і закінчується об'єктивним тестуванням навчальних досягнень. Крім того, тести дозволяють налагодити самоконтроль - найкориснішу для навчання і гуманну форму контролю знань, а також організувати рейтинг - ефективний засіб підвищення навчальної мотивації.
Сучасна теорія тестів (IRT)
Педагогічне вимірювання латентних якостей у західній літературі асоціюється з Latent Trait Theory; цією назвою затверджується специфічна спрямованість і навіть унікальність даної теорії для вимірювання саме латентних якостей. Однак це неправильно. Насправді всі, без винятку, теорії тестів спрямовані на оцінку справжніх компонентів вимірювань, явно не спостерігаються.
І все теорії виходять з аксіоми стійкого існування істинних (латентних) компонентів вимірювання піддослідних. На початку 30-х років класик Чиказької психометрической школи Тюрстон підкреслював важливість індексу надійності результатів вимірювання (r xt). Цей індекс є мірою зв'язку спостережуваних значень кожного варіанта тесту з істинними, неспостережний компонентами вимірювань. У силу наведених аргументів назва Latent Trait Theory не можна визнати правильним.
Ймовірно, тому часто застосовується друга назва Latent Trait Theory - Item Response Theory. Зважаючи на відсутність прийнятного аналога назви цієї теорії російською мовою російський тестологи В.С. Аванесов, як і більшість на Заході, називає її сучасною.
У фокусі вивчення IRT знаходиться, строго кажучи, не тести, як системи завдань, а окремі завдання. Ось чому це скоріше не теорія «тестів», а математизована теорія аналізу характеристик тестових завдань.
Не випадково головним у IRT є твердження про залежність ймовірності правильної відповіді випробуваного від рівня підготовленості випробуваного і від параметрів завдання. Цю залежність зручніше представляти у вигляді логістичної функції.
Числу розглянутих параметрів ставиться у відповідність одна-, двох-і трипараметричного моделі вимірювання. Ці моделі з належною повнотою викладені в роботах багатьох західних дослідників. Одним із перших дослідником цих моделей вимірювання в Росії був В.С. Аванесов.
Хоча окремі методи IRT (наприклад, розрахунок інформаційної функції тесту) застосовуються для оцінки відповідності тесту рівня підготовленості випробуваних, це - наслідок підсумовування значень інформаційних функцій окремих завдань. Все зазначене дозволяє запропонувати новий варіант перекладу назви IRT на російську мову як математико-статистичної теорії аналізу тестових завдань. Що близько до змісту назви оригіналу і узгоджується з викладається нижче класифікацією теорій педагогічного виміру латентних якостей.
Додати в блог або на сайт

Цей текст може містити помилки.

Педагогіка | Лекція
102кб. | скачати


Схожі роботи:
Історія розвитку маркетинг в Росії і за кордоном
Історія розвитку судової системи в Росії
Історія розвитку банківської системи в Росії
Історія розвитку банківської системи Росії
Історія реформування системи державного управління за кордоном
Системи гарантування вкладів громадян в Росії і за кордоном
Розвиток стандартизації як системи управління якістю в Росії і за кордоном
Тенденції та перспективи розвитку лізингу в Росії і за кордоном
Історія становлення і етапи розвитку тестування як форми організації зворотного зв`язку в умовах
© Усі права захищені
написати до нас