Článek
Ach ta statistika…
Průměr, modus, medián… Představte si naši autorskou dvojici, která si předem objednala oběd v restauraci. Pokud by tam Luboš přišel trochu dříve a Honza nedodržel akademickou čtvrthodinku, Luboš by po ranním běhání – snad s výčitkami – snědl oba obědy. Statisticky vzato měl každý z nás v průměru jeden oběd, ale ve skutečnosti měl Luboš obědy dva a Honza hladověl. Toto je dnes již klasický příklad, jak může být statistika při použití nejčastěji využívaného aritmetického průměru zavádějící. Jiným příkladem může být výpočet průměrné mzdy v ekonomice. Díky malému procentu lidí s velmi vysokými příjmy vychází průměrná mzda (počítaná na základě aritmetického průměru) tak vysoká, že cca dvě třetiny zaměstnanců mají mzdu nižší než tento průměr, a jen zhruba třetina jich má mzdu vyšší. Proto je běžné u mezd kromě průměru uvádět i medián, kdy skutečně polovina lidí má mzdu vyšší a polovina nižší než tento ukazatel.
Podobný problém může nastat i se standardním měřením inflace na základě průměrného pohybu cen výrobků a služeb obsažených ve spotřebitelském koši. Právě tak totiž Český statistický úřad (ČSÚ), ale i jiné statistické úřady ve světě, měří celkovou inflaci spotřebitelských cen. Takový výpočet inflace primárně slouží k měření vývoje životních nákladů průměrné domácnosti a k tomuto účelu je vhodný. Pro účely měnové politiky centrální banky jsou ale důležitější cenové tlaky v jádru spotřebitelského koše, které může celková inflace, počítaná pomocí váženého aritmetického průměru, při výrazných asymetrických cenových pohybech (šocích) nadhodnocovat nebo naopak podhodnocovat. Ekonomové se tak často snaží o odhad tzv. jádrové inflace, tedy té fundamentální, standardními domácími makroekonomickými faktory ovlivněné inflace.
Statistika disponuje různými odhady střední hodnoty nějakého statistického vzorku. Tyto odhady jsou teoreticky odvozeny1 na základě vlastností daného souboru dat, zejména rozdělení pravděpodobnosti výskytu jeho hodnot. Pokud je toto rozdělení tzv. normální, je jedno, zda odhadujeme střední hodnotu na základě aritmetického průměru, mediánu (prostřední hodnoty) nebo modu (hodnoty s největším výskytem). Čím více se ale statistické rozdělení uvažovaného vzorku dat liší od „normálního“, tím větší můžeme pozorovat rozdíly mezi průměrem, modem či mediánem. (Modus není jen slovenská kapela našich mladých let, ale především ta hodnota, která se v daném vzorku dat vyskytuje nejčastěji2, statistici by řekli, že má nejvyšší četnost.) Důvodem, proč se některé soubory dat svým rozdělením pravděpodobnosti odlišují od „normálního“, může být mj. výskyt většího procenta „odpadlíků“ (tedy hodnot výrazně jiných, než ty ostatní). Modus ani medián, na rozdíl od aritmetického průměru, nejsou výskytem těchto extrémních hodnot tak ovlivněny.
Co způsobil covidový a energetický šok v měření cenového vývoje?
Nedávný nejprve covidový a poté energetický šok byly důvodem, proč se do množiny cenových pohybů ve spotřebitelském koši dostalo větší množství extrémních hodnot, a proto se dále v našem příspěvku budeme zabývat možností měření inflace v těchto obdobích právě pomocí mediánu meziměsíčních cenových pohybů. Dřívější krize působily na sektory ekonomiky tak nějak symetricky, neměly jasné „poražené“ a „vítěze“. Doba covidová a energetická krize ale působily jinak.3 Lze si povšimnout, a všichni to máme tak trochu v paměti, že od roku 2020 zde máme viditelné vítěze a poražené. K vítězům, ať již zaslouženým či těm, pro které nárůst ziskovosti neodpovídal zvýšeným investicím či jinému úsilí, lze řadit farmaceutický průmysl (vakcíny a léky), IT sektor (jak oblast hardware, tak software – včetně programů pro vzdálenou komunikaci) a z části i sektor energetický či bankovní.4 Byly zde ale i části ekonomiky, zejména ze sektoru služeb, na které dopadly problémy nejen nabídkové, ale i poptávkové strany (nemožnost chodit do restaurací či cestovat). Jejich zátěž tedy byla mnohem vyšší, ale o tom možná někdy jindy a v jiném příspěvku…
Proč je mediánová inflace někdy tak odlišná od inflace průměrné?
Jak si přiblížit rozdíl mezi průměrnou a mediánovou inflací5? Je jako pomyslný stín, který je vrhán pouliční lampou. Když na nás svítí osvětlení přesně nad naší hlavou (rozdělení pravděpodobnosti cenových pohybů je „normální“ a tedy symetrické), stín není žádný, rozdíly mezi těmito inflacemi také nenajdeme. Když se však třeba v tuto zimní dobu od pouliční lampy vzdalujeme, stín narůstá a tak mohou narůstat i rozdíly mezi průměrnou a mediánovou inflací spotřebitelských cen.
V postcovidovém období klasickou inflaci hnalo vzhůru primárně malé množství položek spotřebitelského koše s relativně velkou váhou a zejména raketovým cenovým růstem, které v aritmetickém průměru nebyly kompenzovány obdobně významnými položkami s podobně výrazným cenovým poklesem. Jak bylo vysvětleno v předchozích odstavcích, medián je touto nesymetrií ovlivněn výrazně méně. V ČNB používáme více ukazatelů, které se snaží o odhad jádrové inflace. Ty jsou však většinou opět konstruovány na základě váženého aritmetického průměru, jen vylučují vlivy daňových změn a regulovaných položek, jejichž cena na měnovou politiku z definice nemůže reagovat (čistá inflace), případně dále vylučují ještě silně kolísavé ceny potravin a pohonných hmot (jádrová inflace). Z aktuálně rozdílného vývoje jednotlivých agregátů klasické inflace (celková, čistá, jádrová) se dá usuzovat na to, které položky koše způsobovaly ten vysoký cenový růst. Problematikou jádrové inflace se již před mnoha lety zabývala i práce Bryana a Cecchettiho (1994), která dochází k závěru, že vhodným měřítkem jádrové inflace může být místo váženého aritmetického průměru medián cenových pohybů ve spotřebním koši. Ten je pak odrazem domácích měnověpolitických podmínek a rozdíl mezi klasickým průměrem a mediánem je pak přisuzován „naakumulovaným vnějším vlivům“ za uplynulých 12 měsíců.
Jak mediánovou inflaci počítáme a jak se v ČR vyvíjela?
Pro výpočet mediánové inflace je z pohledu centrální banky vhodné vycházet z tzv. čisté inflace, která vylučuje položky s regulovanou cenou a změny nepřímých daní. U obsažených položek vezmeme meziměsíční cenový pohyb, očistíme jej o sezonní vlivy a o vlivy změn DPH. Takto upravené cenové pohyby seřadíme od nejmenšího po největší a postupně načítáme váhy jejich reprezentantů ve spotřebitelském koši. Meziměsíční inflaci položky, jejíž váha přispěla k přechodu načítané váhy z hodnoty nižší než 50 % na hodnotu vyšší než 50 %, prohlásíme za meziměsíční mediánovou inflaci. Meziroční mediánovou inflaci pak získáme zřetězením dvanácti meziměsíčních inflací. Vývoj obou mediánových inflací a jejich porovnání s klasickými ukazateli inflace je zachycen na Grafu 1 a 2. Je vidět, že meziměsíční mediánová inflace má výrazně hladší průběh (což by jakékoliv měřítko jádrové inflace mělo mít) než klasicky počítaná čistá inflace, a to i po sezonním očištění. Rozdíl mezi meziměsíční čistou a sezonně očištěnou čistou inflací je prohlášen za sezonní vliv. Tyto vlivy by se měly u meziroční inflace v průběhu roku kompenzovat. Rozdíl mezi meziměsíční sezonně očištěnou čistou inflací a mediánovou inflací pak dle Bryana a Cecchettiho odpovídá vnějším vlivům, které nejsou ovlivnitelné domácími měnovými podmínkami. Problémem mediánové inflace je fakt, že s každým novým měsícem je prováděno nové sezonní očištění, které mírně mění časové řady i na minulosti. To může být jedním z důvodů, proč se mediánová inflace nestala oficiálním ukazatelem. Mediánová inflace může být měřítkem jádrových inflačních tlaků, což je užitečné pro měnovou politiku, ale nemůže nahradit oficiální index spotřebitelských cen, který je stěžejní pro odhad vývoje skutečných životních nákladů domácností.
Graf 1 – Srovnání mediánové inflace s klasickými ukazateli inflace v ČR
(meziroční změny v %)
Graf 2 – Srovnání mediánové inflace s vybranými ukazateli inflace v ČR
(meziměsíční změny v %)
Mohl by medián plnit roli předstihového ukazatele inflace?
Možná vás, čtenáře, také napadlo, zda by mediánová inflace nemohla plnit roli předstihového ukazatele klasicky počítané inflace spotřebitelských cen. Bohužel jsme v minulosti došli k závěru, že mediánová inflace nefunguje jako předstihový ukazatel. Neboli, jak říkají kolegové statistiků – ekonometři, nejsilnější vzájemný vztah (korelace) obou inflací opakovaně dostáváme bez časového posunu.
Koncept mediánu se využívá i při výpočtu střední hodnoty jiných ukazatelů, např. při průzkumu inflačních očekávání…
Tyto průzkumy probíhají obvykle u analytiků finančních trhů, manažerů firem a domácností. Zde opět narážíme na problém, jak ze souboru odpovědí, např. jednotlivých analytiků, určit střední hodnotu. V úvahu přichází opět aritmetický průměr (tentokrát nevážený), modus (nejčetnější hodnota), nebo medián (hodnota, kdy cca polovina analytiků má nižší předpověď a polovina předpověď vyšší. Podle tohoto šetření za říjen zůstal mediánový odhad inflace oproti září beze změny na úrovni 4,0 % (horizont 12M) a 2,5 % (horizont 3Y). Na ročním horizontu však trh očekával pokles na 3,8 %.
Co říci závěrem?
Díky mediánové inflaci máme k dispozici měřítko aktuálního cenového vývoje, které není tolik zkresleno extrémními cenovými výkyvy několika málo položek. Nabízí tak pohled částečně vyhlazený a částečně upravený tak, aby lépe vystihoval dění v jádru spotřebního koše. Možná, že podrobnější mikroekonomická analýza bodů obratu mediánové inflace by mohla přinést i další možnosti využití tohoto ukazatele, ale to už by bylo na časově náročnější rozbor z oblasti ekonomického výzkumu.
Pro úplnost ještě dodejme, že ČSÚ počítá i inflaci pro naše starší spoluobčany (která je využívána pro valorizaci důchodů). Výhodu mají např. i Pražáci, pro které ČSÚ zvlášť inflaci také počítá. Na obojí bylo upozorněno v nedávném blogovém příspěvku ČNB. Lze očekávat nějaké změny do budoucna? Dle našeho názoru nemusí být daleko doba, kdy i za použití umělé inteligence bude možné inflaci sledovat s vyšší frekvencí, třeba denně a pro každou domácnost či každého z nás. Je k tomu již trochu nakročeno, klíčová slova zde jsou „scanner data“ a „web scraping“. Uvidíme…
- Autory příspěvku jsou Luboš Komárek a Jan Hošek ze sekce měnové ČNB.
- Příspěvek vyšel také v rubrice čnBlog na webu České národní banky.
- Více o inflaci se dočtete na podstránce Inflace na ústupu na webu ČNB.
- Vedle webu můžete sledovat informace z ČNB na oficiálních profilech na Facebooku, X, LinkedInu, Instagramu, YouTube, Spotify, Flickeru či Bluesky.
Literatura
Bryan, M. F. a Cecchetti, S. (1994): Measuring Core Inflation. In: Monetary Policy, National Bureau of Economic Research, pp. 195-219.
ČNB (2015): Zpráva o inflaci II/2015, Box: Mediánová inflace, https://www.cnb.cz/cs/menova-politika/zpravy-o-inflaci/tematicke-prilohy-a-boxy/Medianova-inflace/
Komárek, L. a Polák, P. (2023): Žije se v Praze draze? A co důchodcům? čnBlog, 7. prosinec 2023 https://www.cnb.cz/cs/o_cnb/cnblog/Zije-se-v-Praze-draze-A-co-duchodcum/
[1] Střední hodnota se získává minimalizací tzv. „ztrátové funkce“. U aritmetického průměru se minimalizuje suma čtverců vzdáleností mezi jednotlivými pozorováními a hledanou střední hodnotou. Váha extrémních hodnot tak roste se čtvercem jejich vzdálenosti od počítané střední hodnoty. U mediánu se minimalizuje při hledání střední hodnoty jen suma absolutních hodnot vzdáleností mezi jednotlivými body a hledaným průměrem. Ztrátová funkce tedy není kvadratická, ale pouze lineární, a váha „odpadlíků“ tak roste se vzdáleností od průměru jen lineárně. To zajišťuje, že 50 % uvažovaného souboru dat má hodnotu menší a 50 % hodnotu větší než medián.
[2] V jiné interpretaci dat to může být aritmetický průměr krajních bodů nejčetnějšího intervalu.
[3] Viz např. každoroční prestižní konference centrálních bankéřů v americkém Jackson Hole, která se tématu makroekonomické politiky v nerovnoměrné ekonomice věnovala v roce 2021. I sympozia v loňském a letošním roce se tohoto „nerovnoměrného“ působení z různých úhlů pohledu dotkla.
[4] Argumentace byla jejími zastánci použita pro stanovení tzv. windfall tax, tedy mimořádné daně z neočekávaných zisků.
[5] Koncept mediánové inflace ČNB představila v Boxu ve Zprávě o inflaci II/2015.