Přejít k hlavnímu obsahu

FinAcumen: Nový výzkum dává AI finanční paměť. Malý model s pamětí překonává specialisty

Ilustrační obrázek
Představte si finančního analytika, který se z každé chyby poučí a příště ji neopakuje. Většina dnešních AI modelů to neumí — každý nový úkol řeší od nuly, jako by předchozí zkušenosti nikdy neexistovaly. Výzkumníci z Pekingu a Londýna teď představili FinAcumen — framework, který dává AI agentům finanční paměť. A výsledky ukazují, že i relativně malý osmimiliardový model s dobrou pamětí může překonat specializované finanční modely a přiblížit se těm největším komerčním systémům.

Proč dnešní AI ve financích zapomíná

Finanční analýza pomocí umělé inteligence není jen o čtení čísel. Vyžaduje současně počítání, vyhledávání informací, interpretaci grafů a tabulek a časové ukotvení — a to vše napříč různými typy dokumentů. Výroční zprávy, burzovní grafy, účetní tabulky, tiskové zprávy — každý zdroj mluví jiným jazykem a AI ho musí správně propojit.

Problém je, že současné modely — včetně těch zabudovaných do nástrojů jako ChatGPT, Claude nebo Gemini — fungují bez paměti napříč úlohami. Každá nová otázka znamená začít znovu od nuly. Opakovaně objevují stejné strategie uvažování a padají do stejných pastí. Ve světě financí, kde chyba může znamenat špatné investiční rozhodnutí, je to zásadní slabina.

FinAcumen: Paměť jako klíč k přesnosti

Framework FinAcumen, vytvořený týmem z Beijing University of Posts and Telecommunications a Queen Mary University of London, řeší tento problém zásadně novým způsobem. Jeho jádrem je modul nazvaný Financial Memory (FM) — perzistentní paměťová banka, která si ukládá zkušenosti z předchozích úloh.

Nejde ale o obyčejné ukládání všeho, co model kdy udělal. FinAcumen důsledně odděluje úspěšné strategie od varovných ponaučení z chyb. Když model čelí nové otázce, prohledá svou paměť a najde relevantní zkušenosti pouze tehdy, pokud jejich sémantická podobnost s aktuálním úkolem překročí kalibrovaný práh. Pokud relevantní zkušenost neexistuje, model se explicitně vrátí ke svému základnímu uvažování — zabrání se tak tomu, aby irelevantní „vzpomínky" zhoršily kvalitu odpovědi.

Tento mechanismus selektivní aktivace paměti je pro finance klíčový. Jak uvádějí autoři v publikované studii: „V prostředí s vysokými sázkami, jako jsou finance, může irelevantní vyhledávání přímo zhoršit kvalitu uvažování a halucinované důkazy mohou vést k nesprávným analytickým závěrům."

Čtyři nástroje, které drží model při zemi

FinAcumen kromě paměti nasazuje i sadu deterministických finančních nástrojů (Financial Tools, FT):

  • Numerical Reasoning Engine — specializovaný výpočetní modul pro finanční matematiku, který eliminuje aritmetické chyby běžné u jazykových modelů
  • Grounded Data Retrieval — cílené vyhledávání ve finančních dokumentech s důrazem na ověřitelné zdroje
  • Visual Structure Decoder — čtení grafů, tabulek a diagramů, které jsou pro finanční reporting typické
  • Answer Consolidation Gate — finální ověření odpovědi, které kontroluje konzistenci napříč všemi použitými zdroji

Díky této kombinaci nástrojů a paměti FinAcumen nespoléhá pouze na „inteligenci" modelu, ale poskytuje mu pevnou půdu pod nohama v podobě ověřených výpočtů a ověřitelných dat.

Výsledky: Malý model s pamětí poráží specialisty

Výzkumníci testovali FinAcumen na čtyřech specializovaných finančních benchmarcích: SEC-NUM (kvantitativní uvažování z výročních zpráv), FinMMR (numerické uvažování z grafů), FinTMMBench (časové multimodální vyhledávání) a FinMME (obecné finanční multimodální hodnocení).

Výsledky jsou pozoruhodné. FinAcumen, postavený na zmrazeném 8B vision-language modelu (tedy modelu, který nebyl nijak dotrénováván na finanční data), konzistentně překonává specializované finanční modely jako Fin-R1, Open-FinLLMs a LLM Pro Finance Suite. V mnoha testech se přibližuje výkonu špičkových proprietárních modelů — a to při zlomku jejich velikosti.

Klíčový poznatek z analýzy citlivosti: čím více relevantních zkušeností model nasbírá, tím stabilnější je jeho výkon — zejména v podmínkách, kdy je vyhledávání nepřesné nebo když dokumenty obsahují šum. Jinými slovy: paměť funguje jako ochrana proti selhání.

Co to znamená pro české firmy a investory

Pro český finanční sektor — ať už jde o banky, investiční fondy nebo fintech startupy — přináší FinAcumen zajímavou perspektivu. Ukazuje, že k budování spolehlivé finanční AI není nutné trénovat obří modely od nuly. Mnohem efektivnější cestou může být vybavit existující model dobrou pamětí a spolehlivými nástroji.

To je důležité zejména v evropském kontextu, kde AI Act klade důraz na transparentnost a ověřitelnost rozhodování AI systémů. Framework, který explicitně odděluje úspěšné strategie od chyb a umožňuje dohledat, proč dospěl k danému závěru, je přesně tím směrem, kterým by se finanční AI měla ubírat.

Open-source povaha FinAcumen (kód je dostupný na anonymous.4open.science) navíc znamená, že čeští vývojáři a firmy mohou framework volně testovat a upravovat pro své potřeby — například pro analýzu výročních zpráv českých firem nebo pro automatizované zpracování finančních dokumentů v češtině.

Limity a co bude dál

Autoři sami přiznávají, že současná verze má své limity. Paměťová banka zatím nepracuje s konceptem „zapomínání" — časem by mohla být přehlcená. Chybí také podpora pro vícejazyčné finanční dokumenty, což je pro evropský trh s mnoha jazyky podstatné. A model pracuje se statickými dokumenty, nikoli s real-time tržními daty.

Přesto je směr, který FinAcumen vytyčuje, jasný: další generace AI pro finance nebude postavena na větších modelech, ale na chytřejší správě zkušeností. Stejně jako lidský analytik roste s každým odvedeným úkolem, i AI agenti se musí učit ze své vlastní historie.

Je FinAcumen dostupný i pro české uživatele?

FinAcumen je výzkumný framework s otevřeným zdrojovým kódem. To znamená, že si ho může kdokoli — včetně českých vývojářů a firem — stáhnout, otestovat a upravit pro vlastní potřeby. Není to komerční produkt s uživatelským rozhraním, ale spíše stavebnice pro tvorbu finančních AI agentů.

Jak se FinAcumen liší od finančních funkcí v ChatGPT nebo Claude?

Zásadní rozdíl je v paměti. ChatGPT i Claude řeší každou otázku izolovaně — nepamatují si, co se naučili z předchozích finančních analýz. FinAcumen naproti tomu buduje perzistentní paměťovou banku, kde si ukládá osvědčené postupy i varování před chybami. Díky tomu se s každou další úlohou zlepšuje.

Dá se FinAcumen použít pro analýzu českých akcií nebo výročních zpráv?

Technicky ano, ale s omezeními. Framework pracuje s dokumenty v angličtině a byl testován na amerických finančních datech (SEC filings). Pro české dokumenty by bylo potřeba přidat jazykovou podporu a upravit nástroje pro lokální finanční formáty. Díky otevřenému kódu je to však proveditelné.

X

Nezmeškejte novinky!

Přihlaste se k odběru novinek a aktualit.