Proč mají ženy v testech horší výsledky? Roli nehraje jen inteligence
Ženy dosahují v přijímacích testech na vysoké školy z Obecných studijních předpokladů v průměru o 10 percentilových bodů horších výsledků než muži, přestože mají často lepší známky ve škole. K tomuto rozdílu může přispívat i menší ochota žen riskovat. A jakou roli hraje v rozdílnosti výsledků podle pohlaví struktura a obsah úloh?
Deset bodů rozdíl: co za ním stojí?
Čísla z Národních srovnávacích zkoušek (NSZ) od Scio poukazují na zajímavý trend. Testů Obecných studijních předpokladů (OSP) se v akademickém roce 2024/2025 zúčastnilo přibližně 14 000 žen a 9 500 mužů — ženy tedy tvořily asi 60 % všech řešitelů. Dosáhly však průměrného percentilu 46,1, zatímco průměrný percentil mužů byl 55,2. Rozdíl téměř deseti percentilových bodů by mohl snadno svádět k závěru, že muži prostě mají lepší studijní předpoklady. Takový závěr by ale byl unáhlený.
Víme, že průměrná inteligence mužů a žen je v podstatě stejná. Pozorované rozdíly ve výsledcích jsou mimo jiné odrazem toho, jaká skupina řešitelů k testům přichází. NSZ využívají hlavně pedagogické, humanitní a společenskovědní fakulty. Technické obory si přijímací zkoušky mnohdy buď organizují samy, nebo přijímají uchazeče bez nich. Toto společně se šedesátiprocentním zastoupením žen mezi řešiteli naznačuje, že k OSP přicházejí odlišné výběry z populace mužů a žen. Přímé srovnání percentilů napříč pohlavími má proto své limity. K pozorovanému rozdílu může přispívat ještě další důvod — strategie tipování.
Graf 1: Rozdíl v průměrném percentilu muži vs. ženy
Ženy nerady tipují. Je to problém?
V testech NSZ se za chybnou odpověď odečítá třetina bodu. Tento systém penalizace má racionální důvod: odradit od čistě náhodného tipování. Jenže jeho dopad na muže a ženy není stejný.
Data ukazují, že ženy se tipování vyhýbají výrazně více. Průměrný muž vynechá v testu zhruba 16 otázek, průměrná žena 19. Podstatné je ale zjištění, které jde hlouběji: porovnáme-li muže a ženy se stejným výsledným skóre z OSP, ženy přesto vynechávají více odpovědí než muži. Jinými slovy — i tam, kde jsou na tom se studijními předpoklady stejně jako muži, tipují ženy méně.
Averze k tipování přitom nesouvisí jen s pravidlem penalizace — jde o hlubší psychologický jev. Některé zahraniční výzkumy ukazují, že i v testech, kde za chybnou odpověď žádné odečítání bodů nehrozí, tipují ženy méně než muži. Bez penalizace jsou ochotnější tipovat, ale stále leckdy méně než jejich mužské protějšky. Nejspíš je to dáno tím, že ženy mají obecně větší neochotu riskovat. Do jaké míry je to vrozené a do jaké společensky podmíněné, zůstává otázkou pro sociology.
Přitom platí jednoduchá matematika: pokud jste ze čtyř možností vyřadili dvě a váháte mezi zbývajícími, statisticky se tipování vyplatí. Jenže právě tuto kalkulaci ženy v praxi, zdá se, podvědomě odmítají.
Potvrzuje to i průzkum preferencí. Skórování bez penalizace (tzn. bez odečtení části bodu za chybnou odpověď) by preferovalo 82 % žen, ale jen 65 % mužů. Ženy aktivně vyhledávají podmínky, kde nemusejí riskovat.
Graf 2: Počet vynechaných odpovědí podle pohlaví + preference bez penalizace
703 úloh pod drobnohledem: záleží na tématu i formátu
Samotná averze k tipování ale nevysvětluje vše. Pátrali jsme dál: jsou snad některé typy úloh svou strukturou a obsahem pro ženy obtížnější než pro muže? K odpovědi posloužila analýza 703 unikátních úloh metodou DIF — odlišného fungování položek (Differential Item Functioning). Ta zkoumá, zda dvě skupiny řešitelů i při stejné celkové úrovni dovedností dosahují u konkrétní úlohy odlišných výsledků. Pokud ano, znamená to, že jedna ze skupin má i při stejných studijních předpokladech vyšší nebo nižší šanci zodpovědět úlohu správně než druhá. Takový rozdíl může signalizovat, že úloha obsahuje prvky nesouvisející s měřenou dovedností, které některou skupinu zvýhodňují, například genderově specifický kontext.
Ze 703 úloh vykazovalo odlišné fungování pouze 10 % z nich a to, pro koho byly tyto úlohy jednodušší, bylo v testech rozloženo rovnoměrně: část zvýhodňovala muže, část ženy. Valná většina úloh je tedy pro obě pohlaví stejně obtížná.
Zajímavé také je, kde se rozdíly projevují a v jakém směru. V testu OSP “jdou” ženám lépe tzv. zebry — příběhové logické úlohy z analytického oddílu, v nichž dostanete sadu podmínek a odvozujete, co je a co není možné. Proč zrovna tento typ úloh? Nejspíš proto, že ačkoli jde o analytické úlohy, vizuálně a formátově připomínají spíš příběh než matematiku. I ty ženy, které se matematiky bojí, k nim mohou přistupovat s menšími zábranami. Mužům naopak lépe jdou úlohy z klasické matematiky.
Zajímavý vhled přináší také analýza úloh z testů Základů společenských věd (ZSV). I tam se ukazují systematické rozdíly: ženy mají (při stejné celkové úrovni znalostí ZSV) oproti mužům vyšší šanci na úspěch v úlohách z psychologie, muži naopak v úlohách z moderních dějin — pravděpodobně díky vyššímu zájmu o události druhé světové války a vojenskou historii. Autorky a autoři úloh přitom výsledky výrazně neovlivňují. Analýza ukázala, že pohlaví tvůrce úlohy je z hlediska vlivu na výsledky zanedbatelné (polovinu úloh psaly muži a polovinu ženy). Rozhoduje spíše téma a formát než to, kdo úlohu vytvořil.
Gender gap v testech řeší i v zahraničí
Genderový rozdíl v testování není jen český fenomén. Na konferenci AEA Europe 2025 v Haagu se ukázalo, že podobné výzvy řeší testovací organizace po celém světě.
Ze Švédska zaznělo, že tamní systém standardizovaného testování (SweSAT) za chybné odpovědi nepenalizuje, ale současně také nabízí více úloh. Prodloužení testu je totiž jednou z možností, jak kompenzovat nižší spolehlivost měření způsobenou tipováním – s rostoucím počtem úloh vliv náhody na celkový výsledek klesá.
Jiným přístupem je adaptivní testování, které využívá například americký SAT: obtížnost v druhé části testu se přizpůsobí úrovni řešitele prokázané v první části testu, což zvyšuje přesnost měření při menším počtu položek.
Co z toho plyne pro praxi? Genderový rozdíl v úlohách NSZ není důkazem toho, že testy jsou špatně sestavené — DIF analýza ukazuje, že drtivá většina úloh funguje pro obě pohlaví stejně. K férovosti pomáhá i to, že se autoři záměrně vyhýbají tématům, která jsou výrazně genderovaná: úlohy o sportu, kosmetice nebo typicky mužských či ženských zájmech do testu, jenž má měřit obecné studijní předpoklady, zkrátka nepatří.
V oblasti tipování se však způsob, jakým studentky a studenti k testu přistupují, liší. Ženám nesvědčí ani časový stres, který je při přijímacích testech prakticky nevyhnutelný. Ale to je věc, se kterou se dá pracovat. Kdo se s formátem testu předem seznámí, procvičí si práci s nejistotou a naučí se vědomě zvažovat, kdy tipování statisticky dává smysl, může výsledky citelně zlepšit.
Tvůrcům testů pak data slouží jako neustálá zpětná vazba: pravidelně sledujeme, zda naše úlohy fungují férově napříč různými skupinami řešitelů. A pokud DIF analýza ukáže odlišné fungování, ptáme se proč a zjišťujeme, co můžeme udělat pro nápravu.
Kde najdete více informací
Výsledky prezentované v tomto článku vycházejí z přednášky na konferenci AEA Europe 2025 v Haagu. Více o tom, jak NSZ vznikají a jak je zajišťována jejich férovost, najdete na www.scio.cz/nsz.
Ing. Lenka Fiřtová, analytička a akreditovaná testařka ve Scio