Proč žádné schéma nepopíše celý svět — a co z toho plyne pro vyhledávání

Článek

Představte si e-shop, který prodává ponožky. Tabulka Produkt, atributy barva=červená, velikost=39. SQL dotaz funguje perfektně. Model je bezrozporný, přehledný, rozšiřitelný. Teď si představte, že chcete prohledat všechnye-shopy na internetu. Jeden má barva, druhý color, třetí to schoval do textového popisu „krásné červené ponožky s proužky“. Co bylo strukturované na úrovni jednoho systému, se z pohledu celku proměnilo v nestrukturovanou haldu.

Tenhle přechod není organizační nehoda. Je to nevyhnutelný důsledek toho, jak je svět uspořádán — a jak jakýkoli konečný model naráží na své meze. Předchozí článek formuloval tezi, že realita je relační a že správně konstruovaný relační model je bezrozporný a nekonečně rozšiřitelný. Obojí platí. Tato analýza ale ukazuje, že příběh má druhou stranu: model je rozšiřitelný právě proto, že je neúplný. A neúplnost není defekt — je to cena za bezrozpornost.

Tento závěr stojí na třech nezávislých argumentech — gödelovském (databázové schéma jako formální systém), kardinalitním (spočetné schéma proti nespočetné realitě) a kolmogorovském (nekomprimovatelnost obecných konfigurací). Má přímé důsledky pro architekturu informačních systémů: fulltextové vyhledávání a vektory nejsou primitivní alternativou k elegantnímu SQL dotazu. Jsou nezbytným nástrojem pro poznávání světa, který je hlubší než jakékoli schéma.

Kde původní článek skončil

Původní článek vycházel z axiomu bezrozpornosti reality a z pozorování, že každá vazba M:N při hlubší analýze odhalí skrytou entitu. Z toho odvodil šest kroků: realita je bezrozporná; relační model s výhradně 1:N vazbami je izomorfní s popisovanou částí reality; rozšíření modelu znamená přidání nových entit a vazeb; nový aspekt reality nemůže být v rozporu s existujícími; přidání do modelu nemůže vytvořit rozpor; a to platí pro libovolné rozšíření.

Článek poctivě identifikoval krok dva — izomorfismus mezi modelem a realitou — jako nejslabší článek řetězu. Tato analýza ukazuje, že problém je hlubší.

Má realita dno?

Hierarchie hmoty poskytuje přímý empirický argument pro nekonečnou rozšiřitelnost relačního modelu:

molekula → atomy → jádro + elektrony → protony/neutrony → kvarky → (struny?)

Každá úroveň přidává nové entity a nové 1:N vazby, aniž narušuje ty vyšší. Molekula vody má stále dva vodíky a kyslík — to, že proton sestává ze tří kvarků, nic na vyšší úrovni nerozbíjí. Je to přesně ten vzorec přírůstkového rozšíření bez destruktivních změn, který původní článek předpovídá.

Planckova délka (~1,6 × 10⁻³⁵ m) bývá interpretována jako limit, pod nímž pojem prostoru ztrácí fyzikální smysl. Kvantová gravitace, teorie strun a smyčková kvantová gravitace tento limit problematizují různým způsobem. Pro náš argument ale není rozhodující, zda je hloubka skutečně nekonečná — stačí, že je prakticky neomezená vůči kapacitě jakéhokoli konečného modelu.

Na kvantové úrovni se objevuje komplikace. Entanglement — dva fotony sdílející stav nelokálně — představuje výzvu pro čistě relační interpretaci. Je to 1:N vazba přes skrytou entitu, tedy sdílený kvantový stav? Nebo zcela jiný typ vztahu?

Ontický strukturální realismus (Ladyman, French) nabízí odpověď: právě zde se ukazuje, že relace jsou primárnější než reláta. Provázané fotony nemají nezávislé vlastnosti — jsou svůj vztah. Na kvantové úrovni nejsou relace mezi entitami. Relace jsou entity.

Gödelovský moment: bezrozpornost, nebo úplnost

Původní článek tvrdil, že relační model je bezrozporný a nekonečně rozšiřitelný. To je pravda — ale je to slabší tvrzení, než si čtenář automaticky domyslí. Z nekonečné rozšiřitelnosti totiž neplyne, že model může realitu plně popsat.

Silnější formulace zní: realita je nekonečně hluboká. Na každé úrovni popisu existují další entity, další relace, další atributy, které dosud nejsou v modelu zachyceny. Žádný konečný model nemůže být kompletním popisem reality — vždy je pouze aproximací.

Správně konstruovaný relační model má dvě vlastnosti. Bezrozpornost — nikdy nevznikne vnitřní rozpor, což plyne z izomorfismu s bezrozpornou realitou. A neúplnost — vždy existují aspekty reality, které model nezachycuje. Systém je buď úplný, nebo bezrozporný — ale ne obojí.

Databázové schéma jako formální systém

Předchozí verze článku formulovala vztah ke Gödelově větě opatrně, jako paralelu nebo analogii. Ale vazba je silnější. Relační databázové schéma jeformální systém v gödelovském smyslu:

Tabulky odpovídají predikátům. Řádky jsou základní fakta (ground facts). Integritní omezení — primární klíče, cizí klíče, CHECK, UNIQUE, NOT NULL — jsou axiomy. SQL dotazy, pohledy a triggery fungují jako odvozovací pravidla. A výsledky dotazů jsou teorémy — odvozená tvrzení.

Toto není metafora. Codd relační model konstruoval na základech predikátové logiky prvního řádu — relační algebra je její podmnožinou. SQL je jazyk pro formulaci tvrzení a dotazů v tomto systému. A klíčový bod: každé praktické databázové schéma je dostatečně bohaté, aby vyjádřilo aritmetiku přirozených čísel. Stačí tabulka s jedním sloupcem typu INTEGER a integritní omezení. Tím je splněna podmínka Gödelovy první věty o neúplnosti.

Co z ní pak plyne: existují pravdivá tvrzení o datech, která nelze odvodit ze schématu, integritních omezení a uložených dat. V databázových termínech: existují validní otázky, na které strukturovaný dotaz nad daným schématem nedokáže odpovědět.

Ponožky jako důkaz

Vraťme se k úvodnímu příkladu. V jednom e-shopu je model bezrozporný a pro svou doménu dostatečný. Ale z pohledu vyhledávače, který prohledává všechny e-shopy, jsou strukturovaná data jednoho systému nestrukturovanou haldou v systému vyšším.

A teď gödelovský skok: problém není v nekázni výrobců schémat. I kdyby existovalo jedno globální schéma pro ponožky — a ono fakticky existuje, schema.org definuje typ Product s atributy color, size, material— stejně nelze předem definovat schéma pro vše, co kdy bude na internetu.

Zítra někdo vynalezne produkt, který neodpovídá žádné existující kategorii. Pozítří někdo napíše báseň o ponožkách — a ta má jiné relevantní atributy než barva a velikost. Za rok někdo vytvoří medicínský dataset o vlivu kompresních ponožek na varixy — a relevantní atributy jsou tlak v mmHg, materiálové složení, klinická studie.

Každé rozšíření schématu je legitimní a bezrozporné — ale žádné konečné schéma nepokryje všechna budoucí rozšíření. A to je přesně to, co Gödelova věta říká: formální systém nemůže být současně bezrozporný a úplný.

Tři nezávislé cesty ke stejnému závěru

Gödelův argument není jediný. Neúplnost konečného modelu reality lze podpořit třemi nezávislými cestami, každou z jiné matematické tradice.

Gödelovský argument (logika).Databázové schéma je formální systém dostatečně bohatý pro aritmetiku. Gödelova první věta platí přímo: existují pravdivá tvrzení o datech, která systém nemůže odvodit. Síla: formálně nejsilnější. Omezení: vyžaduje přijetí mapování schéma–formální systém.

Kardinalitní argument (teorie množin). Množina všech možných relací v realitě je nespočetná — každý reálný parametr (teplota, poloha, čas) generuje kontinuum možných hodnot a vztahů. Jakékoli konečné schéma zachycuje spočetně mnoho typů relací. Spočetná podmnožina nespočetné množiny je vždy vlastní podmnožina. Schéma je nutně neúplné. Síla: nevyžaduje Gödela, stačí Cantor. Omezení: předpokládá, že relevantní relace tvoří nespočetnou množinu — fyzika to ale empiricky podporuje, spojité veličiny generují kontinuum stavů.

Kolmogorovský argument (teorie informace). Kolmogorovova složitost objektu je délka nejkratšího programu, který ho generuje. Schéma databáze je kompresní algoritmus — zachycuje pravidelnosti v datech. Ale věta o nekomprimovatelnosti říká, že téměř všechny řetězce jsou nekomprimovatelné — nemají strukturu kratší než ony samy. Aplikováno na realitu: téměř všechny konfigurace reality jsou schématicky nekomprimovatelné — nelze je zachytit schématem kratším než samotná data. Síla: informačně-teoreticky elegantní. Omezení: předpokládá, že realita obsahuje nekomprimovatelné konfigurace — šum, chaos a kvantová náhodnost to ale empiricky podporují.

Tři argumenty ze tří tradic, a přesto konvergují: konečný strukturovaný model nemůže být úplným popisem reality.

Proč to není chyba

Model je užitečný ne proto, že realitu vyčerpává, ale proto, že ji aproximuje bezrozporně. A kdykoli zjistíme, že aproximace nestačí, můžeme ji rozšířit bez destrukce existujícího. To je přesně ta nekonečná rozšiřitelnost — není to slib kompletnosti, je to slib bezpečného růstu.

Mapa města je užitečná, i když nezachycuje každou prasklinu na chodníku. Její hodnota je v tom, že to, co zachycuje, zachycuje správně — a lze ji doplnit o vrstvu prasklin, aniž by se rozbila vrstva ulic.

Od dedukce k indukci: proč v realitě nelze vyhledávat pravidly

Relační databáze operuje v režimu uzavřeného světa (closed-world assumption): vše, co není v databázi, je nepravdivé. Účetní systém — vím, co je faktura, odběratel, sazba DPH. Schéma je konečné, kompletní pro danou doménu. Dotazuji se strukturovaně, definuji třídu, relaci, atribut, a systém dedukuje odpověď. Funguje to právě proto, že doména je konečná a předem známá.

Realita je otevřený svět. Nevím předem, jaké entity existují. Nevím, jaké atributy jsou relevantní. Nevím, jaké relace mezi nimi platí. A hlavně — nevím, co nevím. V otevřeném světě nelze z absence záznamu odvodit nepravdivost tvrzení. Lze jen říct: v mém modelu to není.

Z toho plyne zásadní důsledek pro vyhledávání. Vyhledávání v uzavřeném světě je deduktivní — od pravidel k datům. „Najdi entitu typu X s atributem Y ve vztahu Z.“ Systém aplikuje pravidla na uložená fakta a dedukuje odpověď. Výsledek je deterministický a kompletní v rámci modelu.

Vyhledávání v otevřeném světě musí být induktivní — od dat ke vzorcům. „Najdi cokoliv, co je sémanticky blízké tomuto dotazu.“ Systém nehledá podle předem definovaných tříd a relací — odhaduje relevanci z povrchových signálů. Výsledek je pravděpodobnostní a vždy neúplný.

A tohle není volba při návrhu systému — vyplývá z povahy poznání samotného. Nelze deduktivně prohledávat něco, čeho strukturu neznáš. Bylo by to jako ptát se SQL dotazem na tabulku, jejíž schéma neexistuje.

Každý vyhledávač je induktivní stroj

Tento vhled osvětluje celou historii webového vyhledávání.

PageRank (Google, 1998) — indukce z linkového grafu. Neříká „tato stránka je o X.“ Říká: na tuto stránku odkazuje mnoho jiných stránek, pravděpodobně je důležitá. Heuristika nad nestrukturovanou realitou.

BM25 (Robertson & Walker, 1994) — indukce z frekvenčních statistik. Neříká „tento dokument obsahuje entitu typu Y.“ Říká: termín z dotazu se v dokumentu vyskytuje častěji, než by odpovídalo náhodě, pravděpodobně je relevantní.

Vektorová podobnost (BERT a následovníci, 2018/2019+) — indukce z distribučních vzorců. Neříká „tento text je v relaci R s dotazem.“ Říká: distribuce kontextů obou textů je podobná, pravděpodobně mluví o tomtéž.

Velké jazykové modely (GPT, Claude, 2022+) — indukce z celého trénovacího korpusu. Neodvozují z pravidel — generují odpověď na základě naučených vzorců. Když „vědí“ odpověď, je to proto, že viděly dostatek induktivních signálů — ne proto, že by dedukovaly z axiomu. Drobná nuance: chain-of-thought reasoning připomíná dedukci — model řetězí kroky, aplikuje pravidla, odvozuje závěry. Ale premisy, ze kterých vychází, jsou samy indukovány z trénovacích dat. Jde o dedukci nad indukovanými premisami — hybrid, kde induktivní základ determinuje kvalitu deduktivní nadstavby.

Žádná z těchto metod nemůže být kompletní — a to není selhání při vývoji. Je to důsledek gödelovského limitu.

Logický řetězec v sedmi krocích

Celý argument se uzavírá do jednoho řetězce:

Realita je relační (Codd; ontický strukturální realismus — Ladyman, French; Whitehead; Kaipayil).
Relační model reality je bezrozporný a rozšiřitelný (původní článek).
Ale realita je nekonečně hluboká → konečné schéma ji nepopíše (Gödel, Cantor, Kolmogorov).
Co je strukturované lokálně, je nestrukturované globálně (příklad e-shopů).
Vyhledávání v nestrukturovaném = otevřený svět → deduktivní přístup selhává.
Musíme přejít na indukci: fulltext, vektory, jazykové modely.
Indukce je vždy neúplná — ale je intelektuálně poctivá.

Vektorový embedding a znalostní grafy: přístupy a jejich meze

Vektorový embedding (BERT, jazykové modely) je pokus o implicitní relační model. Když model zakóduje text do vektoru, zachycuje sémantické vztahy — ale ne explicitně jako entity a vazby, nýbrž jako vzdálenosti v latentním prostoru. Je to aproximace nekonečně složité relační struktury konečněrozměrným vektorem.

Z toho plyne: embedding je vždy ztrátový. Redukuje nekonečně hlubokou relační strukturu na konečný počet dimenzí. Kvalita embeddingu je míra toho, jak dobře tato redukce zachovává relevantní relace pro danou úlohu — ne všechny relace obecně.

Znalost domény determinuje vhodný přístup k modelování — a typ inference. Na jednom konci spektra stojí systémy s úplnou znalostí konečné domény — účetní systém, matrika — kde funguje čistý relační model s SQL a čistou dedukcí. O krok dál jsou systémy s částečnou znalostí, jako e-shop nebo zpravodajský portál, které kombinují strukturované schéma s fulltextem — dedukci s indukcí. Obecný webový vyhledávač má minimální a priori znalost struktury a spoléhá na fulltext a vektory — téměř čistou indukci. A na opačném konci spektra stojí čistě vektorové systémy a jazykové modely, které operují bez předem dané struktury a provádějí čistou indukci — sémantickou podobnost, exploraci neznámého prostoru.

Tato škála není stupnicí od horšího k lepšímu. Je to stupnice epistemické upřímnosti — každý přístup přiznává jiný rozsah předchozí znalosti a volí odpovídající typ inference.

RAG a hybridní vyhledávání (Vespa, Elasticsearch s vektory) jsou pokusem o kompromis: co umíš strukturovat, řešíš relačním modelem, filtry, metadaty, facety — dedukcí. Co neumíš strukturovat, řešíš fulltextem a vektory — indukcí. Okamžik dotazu rozhoduje, která vrstva dominuje.

Znalostní grafy (Wikidata, Google Knowledge Graph) představují pokus o explicitní relační extrakci z nestrukturovaných dat — převod otevřeného světa na uzavřený. Fungují — ale vždy jsou neúplné. Wikidata má přes 100 milionů položek a přibližně 1,65 miliardy tvrzení. Web má stovky miliard stránek. Poměr zachycených relací k existujícím je mizivý — a vždy bude, bez ohledu na investované zdroje. Znalostní graf je užitečná částečná dedukce nad jinak induktivním systémem — ne náhrada indukce.

Protiargumenty

„Relační model zvládne i nestrukturovaná data“

Technicky lze uložit libovolný text do relační databáze — CLOB nebo TEXT sloupec. Ale tím se vzdáváme toho, co relační model nabízí: strukturovaných dotazů. Uložený text bez extrahovaných relací je nestrukturovaná data v relačním obalu — funkčně ekvivalentní fulltextovému indexu.

„Jazykové modely mohou relace extrahovat automaticky“

Mohou — a dělají to (rozpoznávání pojmenovaných entit, extrakce relací, strukturovaný výstup). Ale extrakce je vždy neúplná (model zachytí jen relace, na které byl trénován), chybová (halucinace, špatná disambiguace) a vyžaduje schéma definované předem, čímž se vracíme k problému a priori znalosti.

Jazykové modely posouvají hranici toho, co lze strukturovat — ale neodstraňují fundamentální limit.

„Gödelova věta se na databáze nevztahuje“

Námitka má dvě verze. Slabší: databázové schéma není formální systém. Tuto verzi vyvrací mapování popsané výše — relační model je konstruován na predikátové logice prvního řádu, tabulky odpovídají predikátům, integritní omezení axiomům.

Silnější verze: Gödelova věta se týká odvozovacích schopností systému, ne popisných. Databáze neodvozuje teorémy, ukládá fakta. Toto je legitimní námitka. Odpověď: SQL dotaz je odvození — kombinuje uložená fakta s pravidly (schéma, JOINy, WHERE klauzule) a produkuje nová tvrzení. Pohled (VIEW) je odvozené tvrzení par excellence. A integritní omezení jsou axiomy, které systém vynucuje.

Zbývá otevřená otázka: gödelovská neúplnost se týká rekurzivně axiomatizovatelných systémů. Databázové schéma je konečné (tedy triviálně rekurzivně axiomatizovatelné), ale je otázka, zda jeho vyjadřovací síla vždy dosahuje úrovně potřebné pro Gödelovu větu. Proto výše stojí dva nezávislé argumenty — kardinalitní a kolmogorovský — které neúplnost dokazují i bez Gödela.

Co z toho plyne

Pro teorii modelování. Relační model je nejlepší známý nástroj pro modelování známéstruktury reality. Jeho bezrozpornost a rozšiřitelnost jsou skutečné a prakticky cenné. Ale jeho doména aplikace je ohraničená mírou a priori znalosti struktury — a s ní i typ inference, který nad modelem provádíme.

Pro architekturu informačních systémů. Správná architektura není volba mezi relačním a nestrukturovaným přístupem. Je to rozhodnutí o tom, kde leží hranice tvého poznání domény — a přiřazení správného nástroje a správné inference každé zóně. Známá struktura → relační model, dedukce. Částečně známá → hybrid. Neznámá → fulltext, embedding, jazykový model, indukce.

Pro poznávání světa obecně.Každý model reality je mapa, ne území. Mapa může být bezrozporná — a měla by být. Ale nikdy nebude kompletní. A snaha o kompletnost za cenu bezrozpornosti — cpání nestrukturovaných dat do rigidního schématu, deduktivní dotazování na induktivní problém — je horší než přiznání neúplnosti.

Přechod od dedukce k indukci není ústupek — je to intelektuální poctivost. Tam, kde znáš pravidla, dedukuj. Tam, kde je neznáš, indukuj. A nikdy nepředstírej, že indukuješ, když ve skutečnosti hádáš — ani že dedukuješ, když ve skutečnosti nemáš axiomy.

Otevřené otázky

Formalizace izomorfismu. Lze pojmem izomorfismu z teorie kategorií formalizovat vztah mezi relačním modelem a odpovídající částí reality? Pokud ano, argument o bezrozpornosti a neúplnosti by se stal formálním teorémem.
Kvantová relační ontologie. Je entanglement modelovatelný jako 1:N vazba přes skrytou entitu (sdílený kvantový stav), nebo vyžaduje zcela nový typ relace?
Embedding jako aproximace. Existuje teoretický limit kvality embeddingu jako funkce dimenzionality a složitosti relační struktury, kterou aproximuje? Johnsonova-Lindenstraussova věta naznačuje, že ano — ukazuje, že n bodů ve vysokorozměrném prostoru lze promítnout do O(log n / ε²) dimenzí se zachováním vzájemných vzdáleností s chybou ε.
Praktický test. Lze empiricky ověřit, že systémy navržené podle této hierarchie (dedukce kde víš, indukce kde nevíš) vykazují nižší technický dluh a vyšší rozšiřitelnost než systémy s jednotným přístupem?
Hranice indukce. Existuje teoretický limit toho, jak dobře může induktivní systém (BM25, embedding, jazykový model) aproximovat deduktivní přesnost? A je tento limit konstantní, nebo se posouvá s rostoucí dimenzionalitou modelů?

Závěr

Původní teze — co je relační, je nekonečně rozšiřitelné, pokud není v rozporu s realitou — obstojí. Ale její plný význam se ukazuje teprve s doplněním: model je rozšiřitelný právě proto, že je neúplný. Neúplnost není defekt, je to cena za bezrozpornost.

A tato cena má přímé architektonické důsledky. Vyhledávání v realitě nelze provádět jen pravidly — třídami, relacemi, atributy — protože realita je nekonečně složitější než jakékoli konečné schéma. Deduktivní přístup funguje v uzavřeném světě konečných domén. Pro otevřený svět — internet, zpravodajství, mapy, obecné lidské poznání — je jedinou možností indukce: fulltext, vektory, jazykové modely.

Fulltextové prohledávání nestrukturovaných dat není primitivní alternativa k elegantnímu relačnímu dotazu. Je to přiznání, že svět je hlubší, než jaké schéma mu dokážeme dát. A to přiznání je přesnější než iluze struktury tam, kde žádná předem daná struktura neexistuje.

Zdroje a reference

Relační model a databázová teorie

Codd, E. F. (1970). A Relational Model of Data for Large Shared Data Banks. Communications of the ACM, 13(6), 377–387. — Zakládající text relačního modelu. Codd relační algebru konstruoval na základech teorie množin a predikátové logiky prvního řádu. Dostupné: doi:10.1145/362384.362685

Matematické základy argumentů o neúplnosti

Gödel, K. (1931). Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I. Monatshefte für Mathematik und Physik, 38, 173–198. — První věta o neúplnosti: v každém dostatečně bohatém bezrozporném formálním systému existují pravdivá tvrzení, která systém nemůže dokázat.
Cantor, G. (1891). Ueber eine elementare Frage der Mannigfaltigkeitslehre. Jahresbericht der Deutschen Mathematiker-Vereinigung, 1, 75–78. — Diagonální argument dokazující, že reálných čísel je více než přirozených (nespočetnost kontinua). Základ kardinalitního argumentu.
Kolmogorov, A. N. (1965). Three Approaches to the Quantitative Definition of Information. Problems of Information Transmission, 1(1), 1–7. — Definice algoritmické (Kolmogorovovy) složitosti. Věta o nekomprimovatelnosti: téměř všechny řetězce nemají strukturu kratší než ony samy.

Ontický strukturální realismus

Ladyman, J. (1998). What is Structural Realism? Studies in History and Philosophy of Science, 29(3), 409–424. — Rozlišení epistemického a ontického strukturálního realismu. Teze, že relace jsou ontologicky primárnější než reláta.
French, S. & Ladyman, J. (2003). Remodelling Structural Realism: Quantum Physics and the Metaphysics of Structure. Synthese, 136, 31–56. doi:10.1023/A:1024156116636 — Obhajoba ontického strukturálního realismu v kontextu kvantové mechaniky.
French, S. & Ladyman, J. (2011). In Defence of Ontic Structural Realism. In: Bokulich, A. & Bokulich, P. (eds.), Scientific Structuralism. Boston Studies in the Philosophy and History of Science, vol. 281. Springer. doi:10.1007/978-90-481-9597-8_2
Ladyman, J. & Ross, D. (2007). Every Thing Must Go: Metaphysics Naturalized. Oxford University Press. — Komplexní obhajoba ontického strukturálního realismu s argumentem pro „škálovou relativitu ontologie”.
Ladyman, J. (2020). Structural Realism. In: Zalta, E. (ed.), Stanford Encyclopedia of Philosophy. plato.stanford.edu — Přehledový článek shrnující hlavní pozice a argumenty strukturálního realismu.

Relační ontologie

Whitehead, A. N. (1929). Process and Reality: An Essay in Cosmology. Macmillan. — Procesní filosofie. Realita jako síť vzájemně propojených procesů (events), nikoli nezávislých substancí.
Kaipayil, J. (2009). Relationalism: A Theory of Being. Bangalore: JIP Publications. — Ontický relacionalismus: bytí je relační, entity jsou konstituovány svými vztahy. PhilArchive
Kaipayil, J. (2003). Human as Relational: A Study in Critical Ontology. Bangalore: Jeevalaya Institute of Philosophy. — Aplikace relační ontologie na lidskou osobu.

Vyhledávání a information retrieval

Robertson, S. E. & Walker, S. (1994). Some Simple Effective Approximations to the 2-Poisson Model for Probabilistic Weighted Retrieval. In: Proceedings of the 17th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 232–241. ACM/Springer. — Klíčový článek představující BM25, dodnes nejpoužívanější hodnoticí funkci ve fulltextovém vyhledávání.
Robertson, S. E. & Zaragoza, H. (2009). The Probabilistic Relevance Framework: BM25 and Beyond. Foundations and Trends in Information Retrieval, 3(4), 333–389. doi:10.1561/1500000019 — Přehled pravděpodobnostního rámce pro IR, zahrnující BM25 a BM25F.
Brin, S. & Page, L. (1998). The Anatomy of a Large-Scale Hypertextual Web Search Engine. Computer Networks and ISDN Systems, 30(1–7), 107–117. — Původní článek popisující PageRank a architekturu Google.
Devlin, J. et al. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019. (Preprint: arXiv:1810.04805, říjen 2018.) — Model pro kontextovou reprezentaci textu, který položil základ sémantického vyhledávání pomocí vektorových embeddingů.

Teorie dimenzionální redukce

Johnson, W. B. & Lindenstrauss, J. (1984). Extensions of Lipschitz Mappings into a Hilbert Space. Contemporary Mathematics, 26, 189–206. — Johnsonova-Lindenstraussova věta: n bodů ve vysokorozměrném prostoru lze promítnout do O(log n / ε²) dimenzí se zachováním vzájemných vzdáleností s chybou ε — kde n je počet bodů, nikoli původní dimenze prostoru.

Transparentnost tvorby:

Koncepce, struktura a redakční linie článku jsou dílem autora, který vypracoval obsahovou skicu, stanovil klíčové teze a řídil celý proces tvorby. Generativní AI (Claude, Anthropic) byla využita jako nástroj pro rešerši, ověřování faktů a rozepsání autorovy předlohy.

Autor výstupy průběžně redigoval, ověřil klíčová zjištění a schválil finální znění. Žádná část textu nebyla publikována bez lidské kontroly. Všechny faktické údaje byly ověřeny proti veřejně dostupným zdrojům uvedeným v textu.

Postup je v souladu s požadavky Čl. 50 Nařízení EU 2024/1689 (AI Act) na transparentnost AI-generovaného obsahu. #poweredByAI

Hlavní obsah