AI a věda: dostaveníčko na konci cesty
AI může vědcům pomoci. Ale jinak než si myslíme.
Ve vědě, jako v mnohých dalších oblastech lidského snažení, jsou s AI spojována velká očekávání. Jenže i zde je, obávám se, ve hře obrovský kognitivní klam: představa lineárního pokroku.
Ve vědě, jako v mnohých dalších oblastech lidského snažení, jsou s AI spojována velká očekávání. Nedávno rozčeřila vody zpráva, že AI (konkrétně Googlí nástroj co-scientist) rozlouskla během pár dní problém bakterií rezistentních vůči antibiotikům, na jehož řešení tým výzkumníků pracoval skoro dekádu. Výsledky bádání výzkumného týmu nebyly nikde publikovány, takže se AI neměla moc od čeho odpíchnout — o to víc ohromující ta zpráva byla. AI samostatně dospěla k hypotéze, že superbakterie získávají svoji odolnost tak, že si tvoří jakýsi ocásek z virů, které umožňují bakteriální DNA cestovat mezi různými živočišnými druhy. Krom toho AI vygenerovala čtyři další plausibilní hypotézy, z nichž jedna výzkumný tým vůbec nenapadla.
O pár měsíců dříve pomohla AI objevit zcela nový lék. A nebyl první, takových léků je v klinických testech už asi 75. AI při vyvíjení nových léků pomáhá hned dvěma způsoby. Zaprvé ve velkých datových souborech dohledá protein nebo gen, který ta která nemoc poškozuje, a na nějž by měl lék cílit. Zadruhé a častěji, přímo navrhne novou léčebnou látku.
Tyto a podobné zprávy vzbuzují naděje, že AI může rapidně urychlit vědecký pokrok a ušetřit výzkumníkům hromadu času. Ne, že by to nebylo potřeba. Počet vědeckých patentů posledních několik dekád klesá, aniž by se příliš vědělo proč. Naopak roste počet článků stažených z publikace, kvůli zfalšovaným výsledkům nebo cinknutým recenzním řízením. Seriózní výzkum je stále více a více kontaminován pochybnými organizacemi, nazývanými „chrliče článků“ (research paper mills), na které jsou navázáni (nejen…) mladí vědci ze zemí typu Turecko, Irán nebo Bangladéš, a které bez skrupulí publikují pochybné nebo přímo vylhané výsledky.
Jenže stejně jako u jiných nadějí spojovaných s AI, i zde je, obávám se, ve hře obrovský kognitivní klam: představa lineárního pokroku.
Skutečný pokrok ve vědě je linearitě na hony vzdálen. Už Thomas Kuhn ve své přelomové knize Struktura vědeckých revolucí ukázal, že věda se vyvíjí v evolučních skocích. O lineárním pokroku může být řeč pouze v období tzv. normální vědy, kdy je ustálené vědecké paradigma. Toto období je charakterizováno mravenčí prací mnoha vědců, kteří zaplňují mezery v poznání, aniž by ale jakkoliv zpochybňovali základní východiska svého oboru. Ohledně těchto východisek panuje obecně přijímaný konsensus, který se promítá i do toho, co je vůbec považováno za vědecké a co nikoliv. Do povolených témat tečou peníze, vypisují se na ně granty, není problém v nich publikovat a jsou hromadně popularizována v médiích. V kontrastu s těmito tématy existují témata okrajová až zakázaná, kterým se věnuje maximálně pár vysmívaných podivínů, která vědecký mainstream považuje za pavědu, a na která nejsou peníze.
Ve fázi normální vědy převažuje optimismus a pokrok se ubírá kupředu mílovými kroky. Výjimkou nejsou ani odvážná tvrzení, že vše důležité už bylo vyzkoumáno, jen je potřeba vědecké poznatky technologicky vytěžit.
Ke konci fáze normální vědy pokrok zpomaluje. Začínají se hromadit anomálie, tj. pozorování, která v rámci stávajícího paradigmatu nelze vysvětlit. Věda se dostává do krize. Nemalá část vědců ztrácí důvěru v etablované paradigma a hlasy z okrajových oblastí výzkumu nabývají na důležitosti. Přichází tvůrčí chaos, kdy se výzkum rozbíhá mnoha různými směry, investoři jsou nervózní a hranice mezi vědou a pavědou ztrácí ostrost. Vynořují se alternativní, navzájem soupeřící paradigmata.
Fáze krize může trvat mnoho desetiletí a typicky končí revolucí. Většina vědců se přikloní k jednomu paradigmatu, které se rozšíří. Opět nastupuje fáze normální vědy. Celý cyklus se opakuje.
Osobně si myslím, že v mnoha vědních oborech se stávající paradigma začíná vyčerpávat. Ukazuje na to nejen výše zmíněný klesající trend nových patentů, ale i rostoucí počet anomálií. Např. v biologii se očividně vyčerpala zjednodušená představa organismu jako stroje, který je naprogramován geny (viz epigenetika; viz dech beroucí pokusy biologa Michaela Levina, který dokáže regenerovat končetiny dospělých žab a vytvořit oko mlokům na ocase). Taktéž Dawkinsova představa přirozeného výběru jako slepého hodináře se ve světle výzkumů o emergentním řádu, samo-organizujících schopnostech hmoty, nebo organismů coby aktivních agentů (Denis Walsh, Kevin Lala) jeví jako neudržitelná. V teoretické fyzice se zase zvedá čím dál tím více hlasů (Peter Woit, Lee Smolin, Sabine Hossenfelder), které považují teorii superstrun — jež opanovala celé odvětví na několik dekád — za slepou uličku.
Mnoho novinářů si též všímá, že Nobelovy ceny se stále více udělují specializovaným týmům spíše než výjimečným jednotlivcům, a to za práci která je spíše inkrementálním vylepšením již známého než skutečně průlomovým objevem.
Nepřímým poukazem na to, že se věda nachází v krizi, jsou i další současné krize, jako je krize společenská (liberální demokracie se v rozporu s očekáváními Fukuyamy nerozšířila do celého světa a v USA je aktuálně Trumpem demontována), krize hospodářská (neregulovaný mezinárodní obchod a finanční spekulace zbídačily globální Jih, ovšem přílišné regulace ve stylu EU také nejsou žádné terno) nebo ekologická (mnoho planetárních limitů už je překročeno a čelíme bezprecedentnímu úbytku biologických druhů).
Pokud mám s krizí ve vědě pravdu, jakou roli tedy může sehrát AI? Snad i důležitou, ale každopádně omezenou.
Největším přínosem AI může paradoxně být, že krizi vědy prohloubí, neboť urychlí vyčerpání stávajícího paradigmatu. Velké jazykové modely (LLM) jsou úžasný nástroj na zaplňování mezer ve stávajícím vědeckém poznání. Nejen, že jsou schopny syntetizovat takřka neomezený objem odborných článků v rámci konkrétního oboru, ale měly by být, aspoň teoreticky, schopny nacházet analogie a podobné vzory i v oborech značně vzdálených. To by mohlo pomoci přenášet poznání z jednoho oboru do druhého, což je jinak—vzhledem k současné rozsáhlé specializaci—velmi obtížné. Historie vědy je plná toho, jak vědci znovu a znovu objevovali již objevené, protože neměli tušení, že problém, nad kterým si lámali hlavu, rozlouskl před lety jejich kolega ze zcela jiného oboru (nebo jiné zemi). LLM by tento problém mohly pomoci odstranit. Jestli se to podaří nebo ne, bude do velké míry záviset na tom, jestli zvládnou abstrahovat od velmi rozdílných kontextů (což jim docela jde) a jestli překlenou zásadní problém dramaticky odlišné terminologie v různých oborech (což se povést nemusí, pokud termíny označující shodné entity v různých oborech povedou na velmi vzdálené slovní embeddingy, nebo pokud půjde o neologismy, které se do slovních embeddingů převádějí obtížně).
LLM by tak mohly sehrát roli podobnou východoevropským trhům, které v 90. letech poskytly skomírajícímu západnímu kapitalismu nová odbytiště pro jeho výrobky, a tím oddálily jeho krizi plynoucí z nutnosti růst, aniž by bylo růst kam. LLM mohou pomoci objevit bílá místa na mapě současného poznání, na která lze ještě pořád aplikovat stávající teorie. Požadavek neustále publikovat, aniž by zároveň cokoliv podstatně nového bylo objeveno, může být díky nim ještě pár let naplňován. Pak se ovšem o to tvrději narazí na zeď.
Důležitější je ale otázka, jestli může AI napomoci ke změně paradigmatu, a tedy revoluci ve vědě. Zde jsem poměrně skeptický. Čistě teoreticky by mohla inspirace z jednoho oboru vést ke změně paradigmatu v oboru jiném. Jenže se zdá, že současná krize postihuje vědu jako celek. Možná je to proto, že základní předpoklady (zejména materialismus, objektivita, determinismus a metafora stroje) i metodické postupy (zejména statistika) jsou dnes vlastní většině vědeckých oborů. Nelze samozřejmě vyloučit, že LLM čirou náhodou vygenerují inspirativní text, který povede k naprosto průlomovému objevu (nakonec Newtona takto inspirovalo obyčejné jablko, že…). Osobně ale tuhle možnost považuji za poměrně nepravděpodobnou. LLM pořád jen kombinují existující vědecké studie, včetně studií zfalšovaných, později retrahovaných nebo zatížených chybami. Většina toho, co vygenerují, tedy bude buď triviální, nebo nesmyslné. Zajisté je možné rekombinací již stokrát přemletého vygenerovat něco zásadně nového; ale to lze i taháním slov z klobouku, jako to dělali před dvěma stoletími dadaističtí básníci.
Ani optimistické zprávy o roli AI z úvodu článku na mé skepsi nic nemění. Multiagentní AI systémy, jako je Google AI co-scientist, prokazatelně posilují syntetické a dedukční schopnosti LLM, ovšem jen a pouze v rámci stávajícího paradigmatu. Nelze vytáhnout sám sebe za tkaničky od bot z močálu, bez ohledu na to, jak silné robotické paže budeme mít. To, že bakteriální rezistence vůči antibiotikům souvisí s „virovým ocáskem“ je zajisté zajímavé, ovšem za průlomové to ve světle rostoucích pochybností, jak to s viry vlastně je (viz Stefan Lanka, Andrew Kaufman, a další) považovat nelze. Ke změně paradigmatu budeme potřebovat mnohem víc, než co AI může, sama o sobě, nabídnout. Například reformovat celý systém financování vědy a snížit nelidský tlak na publikování (viz materiály organizace Archa21).