Kontakt:
e-mail: scio@scio.cz
telefon: 234 705 555

Testy absolutního a relativního výkonu

Paní učitelka Voděnková chtěla uspořádat soutěž v počítání. Připravila si ceny pro prvního, druhého a třetího počtáře a žebříček od nejlepšího k nejhoršímu, kam chtěla své žáky vepsat. Pro svých 20 žáků si připravila test s 15 příklady na sčítání, odčítání a násobení, takovými, jaké již mnohokrát procvičovali. Jaké však bylo její překvapení, když celkem 8 žáků vyřešilo správně všechny příklady, 4 další měli jen jednu chybu a 5 žáků vyřešilo všechny příklady na sčítání i odčítání a žádný příklad na násobení. Jen zbývající dva žáci měli více chyb. Do první položky žebříčku se všech osm „nejlepších“ nevešlo, ale ceny naštěstí byly k snědku, a tak se o ně žáci rozdělili.

Pan profesor Pišta skončil jedno z méně zábavných témat – minulý čas prostý. Chtěl se přesvědčit, jak žáci tuto gramatiku pochopili. Aby však testování nebylo tak nudné, jako bylo procvičování na příkladech v učebnici, vymyslel sám sadu úkolů, ve kterých museli žáci nejen využít minulého času, ale ukázat, jak ovládají slovní zásobu, a prokázat ovládnutí i starší gramatiky. Test ukázal kolegům, všem se moc líbil, byl nápaditý, prověřoval mnoho různých dovedností, rozhodně se bude líbit i žákům. Když však pan profesor Pišta testy zadané ve své třídě opravoval, byl velmi zklamán, bylo v nich spousta chyb, mnoho žáků chybovalo v minulém čase, ale ještě víc chyb pocházelo z nezvládnuté slovní zásoby a starší gramatiky. Když se nad výsledky pan profesor zamyslel, musel konstatovat, že to, jak jeho žáci zvládli minulý čas, se nedozvěděl.

Jakou vlastně udělali oba učitelé chybu? Prostě užili test k jinému účelu, než pro jaký byl vhodný. Test paní učitelky Voděnkové by velmi dobře posloužil právě pro ověření toho, jak žáci zvládli sčítání, odčítání a násobení. Paní učitelka se přece z testování dozvěděla, že sčítání a odčítání zvládli skoro všichni, zatímco u násobení zbývá nejméně pět žáků, kteří jej neumí. K vzájemnému porovnávání žáků se však nehodil. Naproti tomu test pana profesora Pišty by byl nejspíše velmi vhodný, kdyby chtěl udělat závěrečné opakování, popřípadě své žáky na základě testu seřadit podle úspěšnosti, neposloužil však k tomu, aby ověřil zvládnutí přesně vymezené látky.

Právě aby nedocházelo k podobným nepříjemným překvapením, je obvyklé rozlišovat podle účelu dva základní druhy testů. Testy relativního výkonu
(často se používá ještě pojmů srovnávací testy nebo NR-testy) a testy absolutního výkonu (často se používá ještě pojmů rozlišující test nebo CR-testy).

Hlavním smyslem testu relativního výkonu je rozlišit jednotlivé žáky či členy nějaké skupiny podle toho, jak danou látku zvládli. Velmi často je výsledkem testování pořadí žáků od nejlepšího k nejhoršímu. Výsledek jednotlivce je vždy vztažen ke skupině ostatních účastníků testování.

Naopak u testu absolutního výkonu jde o to ověřit, zda a jak žák či žáci zvládli danou látku. U jednotlivého žáka může být výsledkem jednoduché hodnocení prospěl - neprospěl nebo např. známka. Pokud se test absolutního výkonu užije např. v celé třídě, může být výsledkem informace o tom, kolik procent žáků látku zvládlo. Výsledek žáka je nezávislý na ostatních – je absolutní. Klíčový rozdíl spočívá v tom, že zatímco u testu relativního výkonu porovnáváme žáky mezi sebou, u testu absolutního výkonu ověřujeme, zda žák vyhověl předem daným kritériím.

Typickými testy absolutního výkonu jsou např. testy v autoškole či státní jazykové zkoušky. Typickými testy relativního výkonu jsou všechny soutěže – předmětové olympiády, z hlediska účelu jsou to testy relativního výkonu i všechny typy přijímacích zkoušek, u kterých je předem dán počet přijatých. Podívejme se na některé obvyklé situace podrobněji.

Diktát:
Pan učitel Orel si po procvičení vyjmenovaných slov po "v" vybral ve sbírce diktátů jeden, který ověřuje zvládnutí této látky. Předem se rozhodl, že za každé dvě chyby ve vyjmenovaných slovech po "v" sníží klasifikaci o jeden stupeň a že ostatní chyby nebude do známky počítat. Rozhodl se také, že pokud nebude mít alespoň polovina žáků jedničky, k vyjmenovaným slovům po v se ještě vrátí, když naopak bude jedniček více než polovina, pokročí k vyjmenovaným slovům po z. Speciální úkoly pak zadá všem, kteří budou mít horší známku než dvojku.

Pan učitel Orel předvedl ukázkové užití testu absolutního výkonu. Zaměřil se na úzkou oblast probírané látky, předem přesně stanovil kritéria vyhodnocení testu a dokonce i další postup. Důležité také je, že si vybral test z relativně nezávislého zdroje. Samozřejmě, že podle výsledků v diktátu mohl pan učitel Orel jednotlivé žáky ve třídě rozlišit či uspořádat, cílem to ovšem určitě nebylo a pan učitel Orel jistě nebude zklamán, když dvě třetiny žáků napíší diktát bez chyby a o­n rozdá spoustu jedniček.

Takto „čistý“ test absolutního výkonu se ovšem ve školní praxi vyskytuje spíše zřídka. V běžném diktátu se většinou objevuje celá řada různých gramatických jevů a i když se diktát soustřeďuje na některý vybraný jev (např. interpunkci), většinou učitel do známky započte i všechny ostatní chyby. U takového diktátu pak ovšem nelze rozhodnout, zda ověřuje zvládnutí pravopisu v širším slova smyslu či zvládnutí interpunkce, a bylo by proto velmi obtížné na základě výsledků dělat podobně jednoznačné a jasné závěry tak, jako to udělal pak učitel Orel.

Písemka z matematiky:
Obvykle ověřuje, zda žáci zvládli látku za poslední období, mívá 4, případně 5 úloh. Na jedničku je třeba vyřešit správně všechny, na dvojku může být jeden špatně atd. Zcela určitě se jedná o test absolutního výkonu. Někdy se ovšem stane, a stát se to může i u diktátu, že učitel neodhadne zcela správně dosaženou úroveň. Pokud žáky podcení, obvykle s radostí dá více jedniček, než očekával, pokud je však písemka nepřiměřeně těžká (např. použije loňskou písemku, ale celková úroveň třídy je horší), znamenalo by dodržení předem ohlášených kritérií příliš přísnou klasifikaci. Mnozí učitelé v takové situaci kritéria hodnocení poněkud zmírní, např. dají jedničku i jen za tři správně vyřešené příklady nebo ještě za jednu hrubou chybu v diktátu. Tím je sice porušena zásada, že u testu absolutního výkonu musí být kritéria hodnocení známa předem, ale na druhé straně může přinést mnoho pozitivního do další výuky. Je vždy věcí učitele, zda a proč se v konkrétním případě rozhodne původně stanovená kritéria pozměnit. V tom spočívá jeden z rozdílů mezi klasickým testováním a hodnocením žáků ve třídě. Testování má být především pedagogickým měřením, má poskytnout kvalitní objektivní informace o žákovi a musí proto splňovat určité parametry a na konkrétního žáka se příliš neohlíží. Naproti tomu hodnocení žáků ve třídě je především jedním z kroků k tomu, aby žáci získali co nejlepší vzdělání, aby se co nejvíce naučili. Cílem není pouhé „známkování“ a v zájmu toho je možné z některých striktních požadavků pedagogického měření slevit.

Proč se vlastně ve škole většinou užívá test absolutního výkonu? Představme si na chvíli, že by se učitel rozhodl zadat písemku jako test relativního výkonu. Hlavní rozdíl by spočíval v pojetí klasifikace. Obvyklý postup u testu absolutního výkonu jsme popsali – známka závisí jen na tom, jak žák písemku zvládne. U testu relativního výkonu by však výsledek musel záviset na úspěšnosti ostatních. Učitel by například mohl vyhlásit, že 4 nejlepší budou mít jedničku, dalších 7 dvojku, atd. až po dva nejhorší, kteří dostanou nedostatečnou. Pak by se ovšem mohlo stát, že žák, který by se na písemku důkladně připravil a prokázal v ní výborné znalosti či dovednosti, by mohl dostat trojku, protože 11 jiných žáků podalo ještě lepší výkon, nebo naopak i velmi slabě napsaná písemka by znamenala jedničku, protože ostatní ji napsali ještě hůř. Ačkoliv v České republice se může zdát takový postup zcela absurdní, je třeba poznamenat, že podobně se běžně postupovalo v Japonsku. Výsledkem byla velká soutěživost mezi žáky, o nějakém opisování či vzájemné pomoci mezi žáky nemohla být řeč, žák byl pod velkým stresem, protože si nikdy nemohl být jist, zda jeho příprava byla dostatečná.

Termín „absolutní výkon“ svádí k domněnce, že výsledek takového testu je skutečně absolutní. Je třeba připomenout prostou pravdu: když učitel zadá lehkou písemku, budou výsledky lepší, než když zadá těžkou. Ve škole učitel zpravidla vybírá či připravuje takový test či písemku, která je „přiměřená“ úrovni žáků, to může např. znamenat, že nejlepší žáci budou mít jedničku a nejhorší čtyřku nebo pětku. Vidíme, že se tak vlastně trochu přibližujeme „japonskému“ modelu. Každá jednotlivá písemka nebo test (a také zkoušení) ve škole jsou tak sice testem absolutního výkonu, ale protože výběr testu je většinou relativizován vzhledem k úrovni třídy, jsou výsledky, a tudíž i souhrnná klasifikace, pouze relativní výpovědí o úrovni žáka. To je také jeden z důvodů, proč školní praxe příliš nepociťuje potřebu rozlišovat testy absolutního výkonu a relativního výkonu. Jsou ovšem situace, kde se právě tato neujasněnost velmi nepříjemně projevuje. Jedním z takových případů je maturita. Budeme se jí věnovat i přesto, že jde o ústní zkoušku, a tedy nepatří do rámce této knihy.

Maturita:
O obsahu i o kritériích hodnocení maturitní zkoušky rozhoduje škola, a protože chybějí závazná (státem stanovená) pravidla, postupuje zpravidla částečně podle obecně uznávaných (tradovaných) hledisek a částečně podle možností a celkové úrovně svých žáků. Vědomě či podvědomě se většinou postupuje tak, aby nejlepší žáci maturovali na jedničku, aby však jednička rozhodně nebyla zadarmo a neměli ji všichni. Kritéria pro hodnocení u maturitní zkoušky často ani nejsou striktně neměnná, jak by to u zkoušky absolutního výkonu mělo být, ale částečně se dotvářejí i během zkoušky. Při jednání maturitní komise je např. možné slyšet. „Vopěnka byl o trošku horší než Adam, a tomu jsme dali trojku, tak přece...“ nebo „Nebylo to úplně skvělé, ale byl zatím ze všech nejlepší, tak alespoň Grušovi dáme jedničku“. Nicméně z vnitřního pohledu školy je maturita zkouškou absolutního výkonu, která vyhovuje potřebě završení středoškolského studia.

Z vnějšího pohledu by certifikát o vykonání maturitní zkoušky – maturitní vysvědčení – měl mít jednoznačný a všeobecně srozumitelný obsah, jinými slovy maturita by měla být testem absolutního výkonu nejen v rámci školy, ale nezávisle na škole. Toho je ovšem možné dosáhnout jedině tak, že by obsah i kritéria hodnocení byla stanovena pro všechny stejně. Je otázkou, která zcela vybočuje z rámce této knihy, zda klady takového řešení převažují nad jeho zápory.

Sondy maturant:
Testy Sonda ´97 a ´98 a v Sondě maturant ´99 ty testy, které připravilo Scio, byly koncipovány, zadány a vyhodnoceny jako testy relativního výkonu, tím se významně odlišují od případné standardizované písemné části maturitní zkoušky, která z výše uvedených důvodů musí být testem absolutního výkonu. Sonda maturant je také ukázkou testů, které nesledují jen výkon jednotlivého žáka, ale i výkon třídy či celé školy, ve všech případech jde o test relativního výkonu.

Testy Kalibro:
Tyto testy jsou nejčasněji využívány k vzájemnému srovnávání škol a tříd. Mělo by tedy jít o testy relativního výkonu. Tomu by odpovídala i šíře záběru jednotlivých testů. Když se však podíváme na jednotlivé úlohy a na způsob, jak se s výsledky pracuje ve výkladu, který doprovází výsledky každého testování, musíme dojít k závěru, že srovnávání tříd ani škol není cílem testování. Mnohem spíše jde v celém projektu o to, aby si každá škola mohla ověřit, jak její žáci zvládli látku obsaženou v jednotlivých úlohách. Jinými slovy každá úloha nebo skupina úloh je vlastně malým testem absolutního výkonu. Škole se mnohem důrazněji nabízí informace typu, že pouze 30 % žáků 7. tříd se bezchybně vyzná v jízdním řádu (což je nepochybně málo), zatímco 75 % žáků dokáže odlišit přívlastek shodný a neshodný (což je s ohledem na praktickou použitelnost ve srovnání s výsledkem u jízdního řádu zarážející).

Přijímací zkoušky na vysoké školy:
V ideálním případě by přijímací zkoušky na vysoké školy měly být typické testy absolutního výkonu, měly by ověřit, zda uchazeč má či nemá předpoklady ke studiu příslušného oboru. Každá fakulta by měla jasně stanovit a vyhlásit svá kritéria a ta pak ověřovat. Na školu by měli být přijati všichni uchazeči, kteří kritéria splňují, a naopak odmítnuti všichni, kteří je nesplňují.

Tak se ovšem nepostupuje, a to hlavně proto, že na jedné straně mají fakulty jen omezenou kapacitu a na druhé straně jsou financovány podle počtu studujících. Fakulty, které mají příliš mnoho zájemců, tak přijmou jen skupinu nejlepších, a naopak fakulty, které mají málo zájemců, přijmou často i ty, jejichž předpoklady ke studiu jsou sporné. V praxi jsou tak přijímací zkoušky typickými testy relativního výkonu. Jejich hlavním účelem, zejména u fakult, kde zájem vysoko převyšuje možnosti školy, je vytvořit pořadí uchazečů, přijati jsou pak všichni „nad čarou“. Později uvidíme, že některé z těchto přijímacích zkoušek nesplňují požadavky kladené na testy relativního výkonu.

Testy v učebnicích:
V některých našich ale mnohem častěji v zahraničních učebnicích se lze setkat s předem připravenými, odborně zpracovanými testy. Tam, kde je testování žáků obvyklejší, můžeme někdy v metodické příručce dokonce najít i doporučená kritéria hodnocení. Jde o testy absolutního výkonu. Tyto testy podrobně ověřují zvládnutí dílčí partie učiva, která předchází testu.

Vlastnosti testů relativního výkonu a absolutního výkonu

Testy absolutního výkonu

Jak je patrné z příkladů, které jsme uvedli, testy absolutního výkonu se dobře hodí k takzvanému formativnímu hodnocení, tedy hodnocení, které se používá ve škole jako zpětná vazba pro žáky i učitele v průběhu výuky. Žáci se jeho prostřednictvím dozvídají, zda a jak nějakou část učiva zvládli, učitel dostává podněty k modifikaci výuky. Může například získat informaci, že má postupovat pomaleji, na podkladě výsledků může skupině žáků či jednotlivcům zadat speciální úkoly, poskytnout doučování apod. Testy absolutního výkonu mohou také sloužit ke klasifikaci. Úspěšné absolvování testu absolutního výkonu bývá také stanoveno jako podmínka pro absolvování nějaké výukové jednotky, např. jako vstupní test do středně pokročilé úrovně jazykového kursu.

Testy absolutního výkonu většinou mívají záběr spíše úzký, tedy se soustřeďují na jednu či několik málo znalostí a dovedností, aby se zjistilo, do jaké míry žák zvládá tuto dílčí partii učiva. V takových případech je nutné, aby testové položky pokrývaly všechny sledované části učiva. Jde-li např. o test na vyjmenovaná slova po "v", měla by se v testu objevit všechna, jde-li o test na kvadratické rovnice, měli by se pokud možno v testu objevit zástupci všech probíraných typů. K testům absolutního výkonu ovšem patří i mnohé závěrečné – certifikované zkoušky (např. známe jazykové zkoušky TOEFEL a FCE, státní jazyková zkouška, test k řidičskému průkazu a sem musí také patřit standardizovaná část maturitní zkoušky) – tyto zkoušky naopak mají velmi široký záběr a zahrnují celou příslušnou oblast. Zde je ovšem nemožné, aby test vyčerpávajícím způsobem pokrýval celou zkoušenou látku, a proto jsou položky vždy určitým reprezentativním výběrem.

V testech absolutního výkonu se zpravidla volí spíše snazší testové položky, takové, které by měl vyřešit každý žák zvládající látku alespoň průměrně; mohou se vyskytovat i položky, které správně vyřeší všichni žáci, a naopak položky, které vyřeší méně než polovina žáků, se u testů absolutního výkonu užívají jen výjimečně a ve speciálních případech, např. při testování zvládnutí kreativních postupů.

Skóre na úrovni 80 % maxima (např. 8 správně vyřešených úloh z 10) se obvykle pokládá za hranici dobrého zvládnutí příslušné partie. Pokud je výsledek testu absolutního výkonu převeden na nějakou předem danou stupnici, jak je tomu např. u klasifikace, není neobvyklé, že na nejlepší hodnocení (jedničku) je třeba 100 % výkon (viz náš příklad s písemkou z matematiky). Výsledek testu absolutního výkonu ovšem není nezbytné převádět na nějakou speciální stupnici, někdy je prostě výsledkem údaj, že žák úspěšně vyřešil třeba 92 % úloh.

Testy relativního výkonu

Testy relativního výkonu mívají záběr široký, zjišťují znalosti a dovednosti žáků na velkém celku učiva. Úlohy do testu bývají zpravidla voleny tak, aby je správně vyřešilo kolem 50 % testovaných žáků. Takto volený test mezi žáky dobře rozlišuje a umožňuje tedy např. rozdělit žáky do výkonnostních skupin, např. nejhorších 20 %, nejlepších 20 %, respektive je ohodnotit na nějaké stupnici. Velmi snadné položky, které vyřeší téměř všichni žáci, nebo obtížné položky, které vyřeší málo žáků, mají malou rozlišovací schopnost, a proto nebývají pro tento typ testu přínosem.

V zahraničí je běžné, že se testy relativního výkonu používají k tzv. sumativnímu neboli finálnímu hodnocení, jde o hodnocení v závěrečné fázi nějaké části výuky, např. na konci ročníku nebo na konci studia. Jeho účelem zpravidla bývá žáky ohodnotit podle toho, jak zvládli nějakou ucelenou část učiva. Výsledky jednotlivých žáků se v tomto případě neprezentují ve formě „zvládl - nezvládl”, jako je to běžné u testu absolutního výkonu, ale ve srovnání s žáky nějaké předem definované skupiny. Touto skupinou může být třída, ročník žáků dané školy, v případě plošných státních zkoušek všichni žáci daného ročníku v zemi, atd. U nás bylo testováním podobného typu provedení Sond maturant a v jistém smyslu sem patří i přijímací zkoušky na vysoké školy.

V České republice se ovšem testy relativního výkonu pro testování jednotlivce příliš neužívají, jen výjimečně a spíše pro zpestření výuky užije učitel test podobně, jak to měla v úmyslu (a příliš se jí to nepovedlo) paní učitelka Voděnková z počátku této kapitoly.

Testy relativního výkonu se ovšem často používají pro porovnávání skupin žáků. Mnohé školy např. každoročně pořádají tzv. srovnávací písemky, ty slouží k tomu, aby se navzájem porovnaly výsledky jednotlivých tříd školy. Podobně ale v širším rozsahu byly koncipovány např. Srovnávací testy Scio nebo Sondy maturant, ve všech těchto případech je sice vždy vypočten výsledek každého zúčastněného žáka, větší důraz je však položen na výsledek školy či třídy, a to v rámci celku všech zúčastěných škol, resp. v rámci škol podobného typu.

Pro interpretaci výsledků testování relativního výkonu je vždy nezbytné uvést v rámci jakého celku výsledek jednotlivce či skupiny posuzujeme. Žák, jehož výsledek v matematice je v rámci matematické třídy průměrný, může být vysoce nadprůměrný v rámci vlastního gymnázia a třeba špičkový v rámci všech žáků středních škol.

2008 © www.SCIO.cz s.r.o
Scio.cz
webdesign: beeonline.cz