Článek
Proč vlastně Mensa potřebuje nové testy?
Testy zastarávají. Když si vezmete pravítko o délce sto centimetrů a přiložíte k nějaké věci, dostanete jasné číslo. U hodnoty IQ to bohužel nejde. Test inteligence vždy zjišťuje lidský výkon nebo určité vlastnosti vzhledem k určité populaci. Předem tedy nevíte, co je hodně a co málo. Jediné, co máte, jsou hodnoty intelektového výkonu v populaci – její průměr a rozptyl hodnot kolem něj. Abyste to zjistila, musíte otestovat třeba tisíc lidí, a až přijde ten tisící první, už ho dokážete zařadit do percentilu. To také znamená, že když se mění populace, mění se technicky vzato také IQ daného člověka. Test, který používala Mensa, byl už starý a je běžná praxe jej aktualizovat nebo minimálně znovu nanormovat na současnou populaci.
Vy jste testy „jen“ normovali nebo jsou i úkoly zcela nové?
My jsme jak u testu pro děti, tak i pro dospělé, vytvářeli úplně nové úkoly i normy. A zhruba za 10 let bychom jej měli znovu nanormovat. Tím spíš, pokud nás zajímají poslední milimetry křivky. Právě tam se totiž nepřesnosti nejvíce projevují. U nadaných jedinců.
Znamená to, že musíte vytvářet těžší testy, protože jsme generaci od generace inteligentnější?
Existuje takzvaný Flynnův efekt, který vlastně říká, že pokud byste současný test dala před 55 lety své babičce, tedy v době, když jí bylo tolik, kolik nám teď, vyšlo by jí zhruba o dvacet bodů méně než nám teď. To ale neznamená, že je slaboduchá. Neví se přesně proč, ale v civilizovaných zemích postupně jakoby opticky stoupá hodnota IQ. Neumíme přesně říct, čím to je. Víme však, že čím je země civilizovanější, tím je stoupání pomalejší. V průměru se jedná zhruba o 3,5 bodu na 10 let a v každé zemi je to trochu jinak. Nejvíce patrný je v současné době u afrických zemí, naopak v některých vyspělých státech se to obrací a hodnoty lehce klesají.
Ví se, jak se v tomto ohledu například projevil rok 1989? I když možná větším milníkem bude rozšíření internetu?
Takovou studii jsem neviděl. Ale existuje řada teorií. Podle jedné z nich byl zlom, když se přestaly používat olověné přípravky, další mluví o změnách v souvislosti s lepší výživou, další s kulturou, rozvojem digitalizace. Může to být ale také tím, že se zlepšuje kvalita školství. Každopádně ať už je důvod jakýkoliv, Flynnův efekt způsobuje, že se testy stávají časem nepřesnými.
Nejsou ale nepřesné samy o sobě vzhledem k tomu, že vám mohou pokaždé vyjít trochu jinak?
To je další velká věc, která jakékoliv zobecňování výsledků komplikuje. V IQ testu je těžké získat větší počet bodů náhodou, protože vybíráte třeba z osmi odpovědí. Ale je mnoho faktorů, kvůli kterým vám výsledek vyjde nerealisticky nízký. Můžete být nevyspalá, vystresovaná, ale třeba i zamilovaná a nějaký test je vám v tu chvíli jedno. Zkrátka existuje sto důvodů, proč nemusíte podat optimální výkon. Navíc žádný psychologický test na světě nemá dokonalou spolehlivost, což znamená, že i v ideálních podmínkách naměří pokaždé u toho samého člověka trochu jiný výsledek. A pak je tu ještě jedna věc, co se týče nepřesnosti testů. IQ je vlastně vždy jenom odhad.
V jakém smyslu?
Protože nemůžete změřit celou populaci. Vy jste změřila jeden tisíc lidí. Když pak přijde tisící první, dokážete ho zařadit mezi jiné dva. A každý z těch dvou dotyčných tak vlastně v přepočtu na českou populaci reprezentuje deset tisíc lidí. Takže logicky je hodnota toho konkrétního člověka v testu plus minus deset tisíc lidí, což představuje třeba plus minus 5 bodů, i kdyby tam nebyly žádné další nepřesnosti – což ale, jak jsme zmínili, jsou.
Možná jsme s tím měli začít, ale dá se tedy vůbec IQ určit?
Když půjdeme do detailu, tak je to stejné, jako bychom se ptali, co je fyzická kondice. Vy víte, co to je, ale pokud ji chcete vyjádřit jedním číslem, co to bude? Jak ho získáte? Výkonem ve sprintu? Při vzpírání? Plavání? Maratonu? Takže se vytvoří test, takový pomyslný desetiboj, a z toho vyjde určité číslo. Tyto naše screeningové testy ve školách, které dělá Mensa, jsou skupinové a trvají dvacet, nově tedy dvakrát dvacet minut – pro každou ze dvou „disciplín“. Snaží se zachytit co největší úsek inteligence, který obvykle koreluje s ostatními. Přesto je dobré ho brát jen jako vodítko a zajít si k psychologovi, který bude po několika hodinách individuálních testů a vyšetření schopen vytvořit intelektový profil. Když test dobře měří, co má měřit, tedy inteligenci, odborně říkáme, že má dobrou validitu.
Když se vrátíme k samotné tvorbě testu. Jak získáváte onen reprezentativní vzorek tisíce lidí, který je vlastně základem pro normování?
To je velmi těžké a je to jedna z věcí, proč jsou testy tak náročné a drahé na tvorbu. U testů pro děti jsme navíc netestovali jen tisíc, ale patnáct set dětí, abychom získali lepší citlivost rozlišování. Pomohly nám ale školy po celé České republice, které nám umožnily otestovat celé ročníky. U dětí to tak bylo o něco jednodušší.
A jak to bude u dospělých?
To už je horší. Potřebujeme různorodou reprezentativní skupinu. Pro naše účely nehraje roli například pohlaví nebo introverze/extraverze, ale rozlišujeme věk, různé stupně vzdělání, velikost sídla a další, jak jsou rozvrstveny v ČR dle Českého statistického úřadu. Může se to zdát jednoduché, podobně se provádí průzkumy veřejného mínění, ale zkušební testy nemůže zadávat každý, dotyčný musí být vyškolený, musí zachovávat správný postup a také dbát na utajení. Protože v okamžiku, kdy test unikne na veřejnost, ztrácí význam. Pokud ho znáte předem, nebude mít vypovídající hodnotu. Takže testovaní například nesmějí mít u sebe žádné elektronické přístroje, nedá se to dělat na počítači a tak dále.
V jaké jste nyní fázi? Mohou se čtenáři třeba přihlásit jako testovací osoby?
Momentálně máme po několika beta verzích a zkušebních testováních vytvořenou finální podobu testu a začínáme normování. Potřebujeme co nejreprezentativnější a největší vzorek, takže každý zájemce je vítán. Více informací a registraci naleznete na adrese mensa.click/u4.
Jak moc se liší nové úlohy od těch starých?
Dost. Už jen tím, že nově není jen jedna sada, ale jsou dva subtesty. K měření inteligence u dětí se používají nejčastěji matice, kde testovaný vidí určitý sled obrázků, ke kterým má doplnit nějaký chybějící. K tomu má na výběr několik, obvykle osm možností. Druhý je pak taková matematika bez čísel, kde děti vyvažují misky vah. Každý z nich trvá zhruba dvacet minut. U dospělých budeme mít také dva subtesty, první budou opět matice a druhý číselné řady. Občas nám lidé říkají, že se matematiky bojí, že jim nikdy nešla… ale o matematiku zde opravdu nejde. Spíš o kombinatoriku jednotlivých číslic, kdy se zamýšlíte nad tím, co s čím a jak souvisí. Jediné, co musíte umět, jsou základní operace s číslicemi na úrovni třeba 3. – 4. třídy základní školy.
Těm, kterým starý test naměřil například 130, získali v novém 125 nebo i méně. Je vidět, že se populace za těch dvacet let trochu posunula a test to odráží, nicméně konkrétní čísla je třeba brát s rezervou.
Když srovnáte první verzi testu a tu finální… Jak moc se u dětí liší?
Tu první byste v té finální vůbec nepoznala. My jsme ale předem počítali s tím, že se polovina položek úplně vyhodí, druhá se ještě doplní, část se reorganizuje a stále se to bude pročesávat, pročesávat, pročesávat.
V čem konkrétně?
Například na začátku vytvoříte test s dvaceti položkami a ověřujete, jestli je děti mohou do časového limitu stihnout. Pak přichází na řadu obtížnost. Protože test vzniká pro účely Mensy, chcete, aby dobře rozlišil úroveň kolem 130 bodů. Takže zase musíte skloubit obtížnost a časový limit. Pak musíte položky roztřídit a seřadit podle obtížnosti. A to jde opět jen tak, že verzi předložíte určitému počtu lidí. Pak například zjistíte, že děti, které jej vyplnily téměř bezchybně, často pohořely na určité položce. Což ukazuje, že je pro ně ten daný bod matoucí. Tak se musí přepracovat, protože vy nechcete testovat pozornost, ale inteligenci. Ven musí všechny možné nejasnosti. Nesourodost položek se zjišťuje i různými statistickými metodami, ale výsledky musí vždy interpretovat člověk – software neví, co měří, jen ukáže, že tam něco nesedí.
Testujete tedy postupně na různých skupinách?
Ano, první kola byla vždy zhruba na padesáti šedesáti dětech a postupně jsme jejich počet zvyšovali. Oněch patnáct set, to byla ta poslední, velká skupina. Předtím jsme test vyvíjeli a průběžně testovali na celkem několika stovkách dětí.
Mluvili jsme o Flynnově efektu, zkoušeli jste v praxi, jestli se u dětí budou lišit výsledky starého a nového testu?
To nás také zajímalo a očekávali jsme, že rozdíly budou. Proto jsme udělali experiment, v níž skupina třiceti dětí dělala jak ten starý test, tak i ten nový. A rozdíl byl několik bodů ve prospěch toho starého. Okolo středu byly výsledky téměř shodné, ale čím jsme šli výše, tím byly rozdíly vyšší. Čili těm, kterým starý test naměřil například 130, získali v novém 125 nebo i méně. Je vidět, že se populace za těch dvacet let trochu posunula a test to odráží, nicméně konkrétní čísla je třeba brát s rezervou.
Do jakých hodnot vaše testy spolehlivě měří?
To je trochu kámen úrazu všech testů. Záleží totiž na tom, kolik lidí se otestovalo na úvod. Žádný test vám přesně neurčí hodnoty nad 150. Když si to vezmete matematicky, tak víte, že IQ nad 100 má jeden ze dvou lidí, IQ 110 a vyšší jeden ze čtyř lidí, IQ 120 a vyšší jeden z deseti a IQ 145 a víc má pak jeden člověk z tisíce. To znamená, že vy potřebujete otestovat při normování nejméně tisíc lidí, abyste toho jednoho dokázali správně zařadit. Normování je však možné na jeden, dva, výjimečně i tři tisíce lidí, ale ani tak se statisticky nedostaneme na IQ vyšší než 150. Nicméně tak vysoko měří některé světové testy. Ale pokud vám někdo říká, že má IQ 168 nebo 200, je to hloupost. Jedná se o velmi hrubý odhad. V našich testech tak máme kategorii pro děti s hodnotou IQ 145+.
Tvorba takového testu je ohromná zodpovědnost…
Ano, zodpovědnost cítím velikou. A nejen z testu samotného, mnohem víc možná z jeho interpretace. I proto po jeho absolvování v Mense nezískáte jen číslo, ale i komentář na A4. V něm jsem stokrát vážil každé slovo, abych dostatečně zdůraznil, že se jedná o orientační hodnotu, o percentil populace, že existuje tisíc a jedna okolnost, kdy vám test naměří nižší hodnotu než je ta reálná, a že to vůbec nic nemusí znamenat. Že vyšší či nižší IQ nedělá člověka šťastným či nešťastným. Takže ano, zodpovědnost je to opravdu velká.
To trochu zní, jako by to ani nebylo důležité…
Myslím si, že dříve hodnotu IQ značně přeceňovali odborníci a dnes ji přeceňuje veřejnost. Odborníci už vědí, že o úspěchu či neúspěchu v práci i životě rozhoduje celá řada faktorů. U laiků se však setkávám s tím, že vysoké IQ je pro ně něco, co je hodné následování. Často si myslíme, že to dává člověku jakousi větší pravdu nebo autoritu. Ale přitom když si vezmete dva lidi, kteří mají stejně vysoké IQ, často mají opačné názory, pohledy na politiku, na společenská témata, na cokoliv. Vysoké IQ tak pro mě automaticky moc neznamená. Pokud máme společnou oblast zájmu nebo si sedneme osobnostně, znamená to, že si asi dobře pokecáme, ale samotná inteligence? Je to samozřejmě výborná věc, fascinuje mě, ale myslím, že ji trochu přeceňujeme.
Vladimír Marček je brněnský psycholog a psychoterapeut. Zaměřuje se na práci s nadanými dětmi, pro organizaci Mensa vytváří nové IQ testy pro děti i dospělé, pravidelně také jezdí jako psycholog na tábory pro nadané děti, které Mensa organizuje.
Text vyšel také na webu eduzin.cz.
Autor/ka: Lucie Rybová