SCIO

scio_web.span_sr-only.basket

Validita testu

Validita patří k základním pojmům testování (educational measurement). Můžeme ji posuzovat z několika hledisek.

Obsahová (kurikulární) validita se zakládá na posudku kompetentních osob, do jaké míry je test v souladu s tím, co skutečně zamýšlíme testovat (konkrétně v oblasti vzdělávání tedy např. posuzujeme, nakolik je obsah testu v souladu s tím, co je v osnovách, standardech a jiných materiálech určujících studijní program, a také s tím, co je skutečně na hodinách vyučováno).

Konstruktová validita udává, nakolik test měří určitou charakteristiku testovaného (např. komunikativnost), eventuálně nějaký psychologický konstrukt (např. sebehodnocení).

Kriteriální (souběžná) validita – výsledek měření se porovná s jinými všeobecně uznávanými údaji o účastnících, které sledují stejné kvality (např. klasifikace). Speciálním případem kriteriální validity je predikční validita, kdy se výsledek testu porovnává s úspěšností účastníka testu v těch oblastech, ve kterých se uplatňují kvality měřené testem – typicky výsledek přijímací zkoušky a úspěšnost ve studiu.

U všech typů testů zpravidla neposuzujeme všechny druhy validity, například při konstrukci vědomostního testu pro nás je nejdůležitější obsahová validita, při posuzování testu studijních předpokladů validita predikční (kriteriální).

Obsahová validita

Obsahovou validitu zjišťujeme téměř výhradně v případě vědomostních testů. Udává, do jaké míry jsou testové položky reprezentativním zastoupením zjišťovaného, respektive probíraného učiva. Představme si modelovou situaci, že zjišťujeme validitu testu na vyjmenovaná slova. Aby měl tento test únosnou délku, bylo možno do něj zařadit pouze některá vyjmenovaná slova. Při posuzování obsahové validity budeme porovnávat slova v testu se všemi existujícími vyjmenovanými slovy a posoudíme, zda test obsahuje jejich reprezentativní výběr. Tedy posoudíme, zda na podkladě dobrého výsledku žáka v testu můžeme učinit závěr, že žák zná vyjmenovaná slova. Bude-li test například obsahovat pouze vyjmenovaná slova po "b" tento závěr pravděpodobně učinit nemůžeme, protože se může stát, že žák skončil u písmene b a k dalším vyjmenovaným slovům se již nedostal. Při posuzování obsahové validity porovnáváme testové položky s popisem testované oblasti, respektive s kurikulárním rámcem sloužícím za podklad k danému testu.

Abychom docílili dobré obsahové validity při konstrukci vlastního testu, musíme dobře specifikovat testovanou oblast. Velmi pomáhá podrobný kurikulární rámec a testová šablona. Pro dobrou obsahovou validitu testu je důležité, aby byl test ve shodě s náplní výuky, to znamená, aby byly testové položky v testové šabloně zastoupeny podle významu kladeného na jednotlivé obsahové a kognitivní cíle. To zpravidla nečiní žádné problémy v případě testů konstruovaných učiteli pro využití pro potřeby hodnocení v jejich třídách. Bývá to však velkým problémem v případě testů určených pro celostátní a mezinárodní šetření. Další podmínkou obsahové validity jsou dobré vlastnosti testových položek.

Obsahovou validitu nemůžeme zaměňovat s ”face validitou”, kterou používáme pro první hrubé posouzení testu. Spočívá v tom, že ukážeme test několika odborníkům, a oni řeknou, jak se jim test jeví. Toto posouzení může být v mnoha případech užitečné, ale od důkladného posouzení testových položek vzhledem k testovanému učivu, které je základem stanovení obsahové validity, je hodně vzdáleno.

Konstruktová validita

S tímto typem validity pracujeme, používáme-li test zjišťující nějaký rys či charakteristiku založenou na nějakém teoretickém modelu: například logické uvažování, inteligenci, kreativitu. Posuzování konstruktové validity znamená shromáždění nějakých důkazů, že test skutečně měří tento rys či charakteristiku. Shromáždit takové důkazy nebývá jednoduché. Představme si teoretickou situaci, že chceme sestavit test, který bude měřit bojácnost. Abychom posoudili, zda náš test bojácnost opravdu měří, učiníme s osobami, které absolvovaly náš test následující experiment. Posadíme je do čekárny zubního lékaře a podrobíme je nějakému fyziologickému měření – budeme zjišťovat fyziologické projevy strachu (např. pocení). Pokud náš test byl validním nástrojem na měření bojácnosti, budou fyziologické projevy testovaných osob ve shodě s výsledky v testu.

Kriteriální validita

Kriteriální validita posuzuje vztah mezi výsledky testu a kritériem, které chceme na základě testu předpovídat, eventuálně posuzovat. Za taková kritéria můžeme považovat například studijní předpoklady žáků, jiným příkladem může být inteligence. Výsledky validního testu studijních předpokladů by měly být ve shodě s výsledky žáka v pozdějším studiu, výsledky v novém testu inteligence by měly být ve shodě s výsledky v jiných dostupných inteligenčních testech.
Při posuzování kriteriální validity porovnáváme výsledky v testu s nějakými jinými hodnotami charakterizujícími dané kritérium. Nejužívanější metodou, jak provést takové ”porovnání”, je spočítat korelační koeficient mezi těmito dvěma hodnotami.

I kdybychom si samozřejmě přáli mít testy s vysokými hodnotami kriteriální validity, v praxi se s nimi příliš často nesetkáváme. Například američtí studenti skládají před svými vysokoškolskými studii SAT Reasoning Test (dříve nazývaný Scholastic Aptitute Test, poté Scholastic Assessment Test), což je jakýsi test studijních předpokladů. Korelační koeficient mezi výsledkem v tomto testu a prospěchem v prvním roce studia je ”pouze” 0,62. Obecně platí, že test, který má korelační koeficient mezi výsledkem v testu a kritériem větší než 0,4, nám může poskytnout užitečnou informaci.

Faktory ovlivňující validitu

Validita testu je samozřejmě ovlivňována všemi nedostatky v testu i v jeho administraci. Nízkou validitu testu budou mít za následek například nejasné a nesrozumitelné pokyny či příliš obtížný jazyk testu, položky s příliš malou či příliš velkou obtížností, položky se špatně volenými alternativami či položky nejednoznačné. Typickou ukázkou jsou některé přijímací testy na vysoké školy, které mohou mít několik správných odpovědí a výběr správných odpovědí se ještě složitým způsobem kóduje. Takový test, i když je třeba zdánlivě z biologie, testuje schopnost orientovat se ve složité struktuře odpovědí a tím snižuje validitu testu jako testu z biologie.
Validitu testu rovněž ohrožuje jeho špatná administrace, zejména opisování žáků, a špatné vyhodnocení, např. subjektivní hodnocení položek s otevřenou odpovědí.
Validita je také snižována faktory na straně žáka, například strachem z výsledku, příliš zbrklou a nepřesnou prací atd.