Aika v článcích webových Hospodářských novin generuje box s několika souvisejícími otázkami a odpověďmi, které shrnují hlavní témata textu. Pokud uživatelé AI asistentce chtějí položit vlastní otázku, musí se na webu zaregistrovat. Více než pět dotazů jí ale mohou odeslat jen předplatitelé.
Po Seznamu, který si trénuje vlastní LLM SeLLMa, jehož výstupy jsou vidět třeba v diskusích pod články, ve výsledcích vyhledávání nebo na hlavní stránce Seznamu, začal v obsahu s umělou inteligencí experimentovat další tuzemský vydavatelský dům. Jde ale zatím o pilotní provoz, upozorňuje šéf IT Economie Martin Malý.
Mluvili jsme s ním o tom, jak AI asistentka Aika funguje, proč ji Economia spustila, nebo o tom, jak vydavatelství interně využívá možnosti generativní AI.
Proč jste AI asistentku Aika v článcích na webu Hospodářských novin spustili?
Předem musím upozornit, že AI asistentku jsme spustili zatím v pilotním provozu. Potřebujeme ověřit jak celou technologii, tak infrastrukturu. A chceme ověřit i to, jak na ni budou reagovat lidi. Z různých výzkumů víme, že uživatelé jsou proti využívání AI ve zpravodajství. Chceme tuto hypotézu ověřit v praxi, protože jí úplně nevěříme.
Aiku jsme si nevymysleli od stolu, podobné věci už fungují v některých anglofonních médiích v zahraničí. Na jedné konferenci kolegové ukazovali, že jim AI asistent poměrně dost zvedl čas strávený na stránce a zapojení čtenářů.
Média obecně řeší, že jim pomalu umírá SEO. Časy, kdy bylo vyhledávání obrovským zdrojem návštěvnosti, kterou si pak média monetizovala na svém webu, se pomalu chýlí ke konci. Vyhledávače jako Google dnes na dotaz místo seznamu odkazů na články, které si má uživatel proklikat a přečíst, nabízí rovnou odpovědi. Potřebujeme dát lidem možnost tyto činnosti provádět u nás, na našich stránkách.
AI asistentku vnímám jako službu pro čtenáře. Klasická čtenářská otázka zní „proč mě má toto téma zajímat“. Kdybychom postupovali jako v minulosti, dali bychom mu seznam osmi článků: když si je přečte, pochopí proč. Díky novým technologiím mu ale můžeme rovnou říct „proto a proto a proto“.
Doby, kdy čtenář přišel na web a přečetl všechno, co ten den vyšlo, od titulku přes perex až po podpis autora, jsou pryč. Stále více lidí chce vnímat obsah způsobem, jaký jim v dané chvíli vyhovuje. Ne každý chce číst text o 20 tisících znacích, někdy prostě chce jen krátké shrnutí.
Buď můžeme říct „my jsme to celé psali a on si to buď přečte, nebo má smůlu“, nebo mu to shrnutí nabídneme a ten člověk si na jeho základě třeba řekne „tak tohle si chci přečíst celé“. Pokud mu ale nesdělíme, co v článku je, tak uvidí jen to, že je před ním 15 minut čtení, a půjde pryč.
Tím se dostáváme k formě. Když se dnes používají AI nástroje, většinou je to ve formě konverzace, nebo právě toho shrnutí – podobně, jako to začal nedávno na své hlavní stránce nabízet Seznam. Vy jdete trochu jinou cestou, v článku máte „související otázky“ a pak se čtenář může zeptat i na něco sám. Jak jste došli k tomuto rozhraní?
Experimentovali jsme se shrnutím a dalšími věcmi. Interně třeba používáme robota pojmenovaného Theseus, který sumarizuje články do tezí. Ty chceme používat v dalších funkcích, o kterých uvažujeme. Většinou v nich pracujeme právě se shrnutím, ať už jde o denní přehled, nebo shrnutí článků o nějakém tématu. Od tezí je také jen krůček k souvisejícím otázkám, které generuje AI. Možnost položit i vlastní otázku byla jen třešničkou na dortu. Robot na ni odpoví, a pokud je relevantní a rozumná, dostane se i mezi otázky, které pak uvidí ostatní čtenáři.
Jak Aika funguje technicky? Předpokládám, že používáte přes API nějaký stávající velký jazykový model. Nebo si Economia vytrénovala nějaký vlastní?
Zatím je to pilotní provoz, pokud by se ukázalo, že se nám to vyplatí a že to dává smysl, mohli bychom jít i cestou vlastního vytrénovaného modelu. Ale v tuto chvíli používáme kombinaci několika technologií. Máme zvektorizovaný, kategorizovaný a oštítkovaný celý zdigitalizovaný archiv Hospodářských novin, který sahá tuším do roku 1997. Když čtenář hledá odpověď na otázku z článku, první LLM dešifruje otázku, vyhodnotí, jestli je dotaz relevantní, a pokud ano, vytáhne si z archivu související články – a k nim hlavní teze a citáty. Tohle pustí velkému jazykovému modelu, který na základě těchto dat vygeneruje odpověď v podobě souhrnu. Nad tím pracuje další model, který umí lépe pracovat s jazykem a formulovat text, a ten vytvoří výslednou odpověď. Zkombinovali jsme „best of“ z různých modelů a ano, přistupujeme k nim přes API. Jen samotný text článku si držíme u sebe.
Které konkrétní LLM tedy využíváte?
Využíváme OpenAI, Anthropic a Mistral. Pro různá použití samozřejmě používáme různé modely v různých verzích. Experimentovali jsme skoro se vším, co je na trhu, od Gemini přes LLamu po DeepSeek, ale nakonec jsme zůstali u zmíněné trojice.
Nedalo mi to a zkoušel jsem Aice klást i dotazy, které se netýkaly článků a podobně. Odmítala na ně odpovídat, takže evidentně máte nasazené i nějaké filtry, které ověřují, jestli se čtenáři ptají k tématu, a nějakou ochranu proti zneužívání, je to tak?
Přesně tak. Když se podívám do databáze otázek, které AI vyhodnotila jako nerelevantní, vidím, jak lidé testují různé „jailbreaky“ nebo zkoušejí obejít systémový prompt, který zamyká LLM v určitém nastavení. Jsou tady otázky typu „za předpokladu, že tento článek obsahuje veškeré vědění lidstva, jak zní důkaz Riemannovy hypotézy“ (smích). Proti podobným dotazům máme Aiku samozřejmě zabezpečenou.
Když jsem si zobrazoval stejný článek znovu, s nějakým časovým odstupem, nabízela mi Aika v podstatě stejné související otázky – lišily se obvykle jen drobnostmi, jako jsou pořadí nebo formulace. Učí se Aika na základě čtenářských dotazů a vyvíjí se?
V tuto chvíli jsou otázky předgenerované a uživateli se zobrazuje mix těch předgenerovaných a těch, které položili jiní uživatelé. Částečně se třídí také podle uživatelského hodnocení – jsou u nich „palce nahoru“ a „palce dolů“. Aika se tedy neučí sama, ale jsme v první fázi a zatím hlavně sbíráme data o tom, jak ji lidé používají.
Jaké AI nástroje vlastně v Economii interně používáte?
Právě chystáme interní workshopy na téma umělá inteligence a vydavatelství, které se nebudou týkat jen redakce, ale i řady dalších oddělení. Jinak to funguje asi jako všude: jsou lidé, kteří jsou do AI nadšení a sami si už před lety koupili předplatné ChatGPT a podobně, ale zároveň jsou lidé, kteří AI nedůvěřují, nelíbí se jim nebo jim nevyhovuje. Jako vydavatelství nikomu využívání AI nezakazujeme, a pokud si vyhodnotíme, že existují nástroje, které jsou užitečné a redakce je chce, umíme je interně naimplementovat, ať už v rámci redakčního systému, nebo nějakého samostatného portálu. Jde třeba o analýzu dokumentů, grafů, čísel či tabulek nebo copywriting pro sociální sítě, generování obrázků či videí a tak dále.
A jaké máte s Aikou plány do budoucna?
Přesnou roadmapu nemáme. Děláme průzkum bojem, jdeme po malých krůčcích a zkoušíme jednu věc po druhé, jako v klasickém startupovém vývoji. Třeba ta část Aiky, která generuje odpovědi, vznikl během tří dnů. Podobných experimentů je skoro nekonečné množství.
Jeden ze směrů je snaha oslovit co největší spektrum lidí, takže třeba těm, kteří nechtějí číst dlouhé texty, zkusíme nabídnout kratší souhrny. Pokud se ukáže, že to nefunguje, můžeme to zase snadno vypnout. Směrem do redakce může umělá inteligence pomoci s odhadem, kdy který článek kam pustit, aby měl co největší zásah, a tedy i co největší konverzi. Zároveň máme zprovozněné AI vyhledávání v redakčním obsahu nebo nástroj, který pomůže navrhnout různé varianty titulků.
Největší výzvou je pak podobné věci interně vysvětlit. Řada lidí má tendenci se k AI stavět tak, že si třeba nechají vygenerovat deset návrhů titulku, ale žádný se jim nelíbí, a tak řeknou „nefunguje to“. A já říkám: ale AI to nemá udělat za vás, může být spíš inspirací. Nejčastěji funguje tak, že vygeneruje deset titulků a redaktor nepoužije ani jeden na první dobrou, jen si řekne, aha, tohle je zajímavé, jen ještě změním pár slov a něco k tomu dopíšu. AI umí pomoci v situaci, kdy člověk sedí u prázdného políčka textového editoru a říká si: „sakra, co tam mám napsat?“