Přejít k hlavnímu obsahu

DAAF: Open-source framework, který z Claude Code dělá pečlivého výzkumníka. A je zdarma

Ilustrační obrázek pro jarvis-ai.cz
Brian Heseung Kim, doktorand z University of Virginia, vytvořil bezplatný open-source framework DAAF, který z Claude Code od Anthropicu dělá rigorózního výzkumného asistenta pro datovou analýzu. Nástroj za pár měsíců získal přes 1 300 uživatelů, 197 hvězd na GitHubu a používá se na Stanfordu i Northwestern University. Co umí a proč by měl zajímat i české výzkumníky?

Co je DAAF a proč vznikl

Data Analyst Augmentation Framework (DAAF) je bezplatný open-source nástroj, který funguje jako "inteligentní laboratorní manažer" pro Claude Code od Anthropicu. Jeho autor Brian Heseung Kim ho postavil na jednoduché premise: velké jazykové modely sice umí psát analytický kód a zpracovávat data, ale zároveň halucinují, zkracují si práci a působí přehnaně sebevědomě. DAAF tyto nedostatky systematicky potlačuje tím, že nutí Claude chovat se jako pečlivý a zodpovědný výzkumník.

Kim na frameworku pracuje od roku 2018 — ještě před vydáním ChatGPT — a celou svou dizertační práci věnoval právě tomu, jak učit ostatní používat AI nástroje zodpovědně. DAAF je výsledkem těchto let výzkumu a stojí na pěti principech: transparentnost, škálovatelnost, rigoróznost, reprodukovatelnost a odpovědnost.

Jak DAAF funguje v praxi

DAAF se instaluje jedním příkazem přes terminál (macOS/Linux) nebo PowerShell (Windows) a běží v Docker kontejneru, který izoluje Claude od zbytku vašeho souborového systému. Tím chrání citlivá data před nechtěným přístupem. Po spuštění komunikujete s Claude Code přirozeným jazykem — stačí popsat, co chcete analyzovat, a DAAF sám určí, jaký typ workflow je nejvhodnější.

Framework nabízí devět režimů práce, od rychlé konzultace přes vyhledávání v datasetech až po kompletní výzkumný pipeline:

  • Ad Hoc Collaboration — neformální brainstorming, pomoc s kódem nebo metodologií
  • Data Lookup — rychlé dotazy na datasety (např. "Jaké socioekonomické proměnné máme v College Scorecard?")
  • Data Onboarding — naučí Claude rozumět vašim vlastním datům a dokumentaci
  • Data Discovery — propojuje informace napříč různými datovými zdroji
  • Full Pipeline — od výzkumné otázky až po hotovou analýzu s reportem
  • Revision & Extension — vylepšuje a rozšiřuje existující analýzy
  • Reproducibility Verification — ověřuje, že je analýza plně reprodukovatelná
  • Framework Development — rozšiřuje samotný DAAF o nové metody a knihovny
  • User Support — pomáhá s instalací, nastavením Dockeru a technickými otázkami

Co DAAF odlišuje od běžného použití AI

Klíčovou inovací DAAF je agentní orchestrace (agentic orchestration). Při Full Pipeline analýze DAAF nespustí jen jedno vlákno — automaticky rozděluje práci mezi specializované asistenty: jeden napíše kód, druhý jej adversarálně zkontroluje (hledá chyby, metodologické nedostatky, logické přešlapy), třetí ověří reprodukovatelnost. Člověk zůstává vždy u řízení — v každé fázi vás DAAF požádá o schválení, než pokročí dál.

Další pojistkou proti halucinacím je rozsáhlá knihovna ověřených referenčních příruček (agent skills), které DAAF dynamicky načítá podle kontextu. Místo aby Claude spoléhal na svou "obecnou znalost", pracuje s konkrétními citacemi a metodologickými postupy — od kauzální inference přes geospaciální analýzu až po strojové učení.

Metodologický záběr: od regresní diskontinuity po geospaciální analýzu

DAAF přichází s předpřipravenou podporou pro více než dvacet statistických metod včetně difference-in-differences, instrumentálních proměnných, regresní diskontinuity, propensity score matching, analýzy časových řad, shlukové analýzy nebo algoritmického posuzování férovosti (fairness). K tomu nabízí expertní znalost knihoven jako polars, pyfixest, statsmodels, scikit-learn, geopandas, plotly, SHAP a mnoha dalších.

Zajímavostí je podpora překladu kódu mezi R/tidyverse a Statou do Pythonu — výzkumníci zvyklí na tyto nástroje tak mohou plynule přejít do ekosystému DAAF, aniž by se museli učit Python od nuly.

Kdo DAAF používá a co stojí

DAAF je zcela zdarma a open-source pod licencí LGPL-3.0. Brian Kim výslovně odmítá jakékoliv premium tiers nebo "bait-and-switch" modely — framework má sloužit jako veřejný statek pro výzkumnou komunitu. Jediným nákladem je předplatné Anthropic Max za 100–200 USD měsíčně (přibližně 2 200–4 400 Kč), případně lze použít API klíč s platbou za token.

Za necelý rok od spuštění DAAF získal přes 1 300 unikátních uživatelů a 197 hvězd na GitHubu. Workshopy proběhly na institucích jako Northwestern University, University of Virginia, Stanford University, Bowdoin College nebo Urban Institute. Komunita se schází na Discordu a framework čítá 328 commitů od přispěvatelů.

Co to znamená pro české výzkumníky

Pro českou akademickou scénu — od sociologů přes ekonomy až po datové analytiky ve veřejné správě — představuje DAAF zajímavou příležitost. Framework je zdarma, běží na standardním počítači s Dockerem a jeho metodologický záběr pokrývá většinu technik používaných v sociálních vědách. Není potřeba žádné speciální hardwarové vybavení — výpočty běží lokálně v Pythonu, Claude zajišťuje pouze "myšlení".

Jazyková bariéra je samozřejmě téma — DAAF komunikuje anglicky a Claude Code češtinu oficiálně nepodporuje. Pro výzkumníky s alespoň základní angličtinou by to však neměla být překážka, zejména proto, že analytický kód a dokumentace jsou v angličtině standardem i na českých univerzitách.

Zajímavý je také GUIDE-LLM reporting standard, který DAAF automaticky vyplňuje — jde o mezinárodně uznávaný checklist pro transparentní deklaraci použití AI při výzkumu. Pokud publikujete v zahraničních časopisech, může to zjednodušit splnění jejich požadavků na AI disclosure.

Bezpečnost a reprodukovatelnost na prvním místě

DAAF běží v Docker kontejneru, což znamená, že Claude nemá přístup k vašim osobním souborům mimo vyhrazený pracovní adresář. Framework také obsahuje ochranu proti destruktivním příkazům (např. rm -rf) a skenování tajných klíčů (credentials scanning). Každá analytická relace je automaticky verzována přes Git a kompletní transkript včetně všech "myšlenek" Claude je archivován pro pozdější kontrolu.

Pro výzkumníky pracující s citlivými daty (např. zdravotnická data, osobní údaje respondentů) je to zásadní — DAAF umožňuje využívat sílu AI, aniž byste museli data nahrávat do cloudu třetích stran.

Dostupnost a jak začít

Instalace vyžaduje Docker Desktop (zdarma) a Anthropic účet s Max předplatným. Po spuštění instalačního skriptu jste připraveni během pár minut:

  • macOS/Linux: curl -fsSL https://raw.githubusercontent.com/DAAF-Contribution-Community/daaf/main/scripts/host/install.sh | bash
  • Windows: irm https://raw.githubusercontent.com/DAAF-Contribution-Community/daaf/main/scripts/host/install.ps1 | iex

Kompletní dokumentace je k dispozici na daaf.openaugments.org, včetně videonávodů a interaktivního průvodce anatomií kompletní analýzy. Komunita je aktivní na Discordu a blog DAAF Field Guide vychází na Substacku.

Potřebuji k používání DAAF umět Python?

Ne nutně. DAAF s vámi komunikuje přirozenou angličtinou a veškerý kód generuje a kontroluje sám. Pro základní analýzy stačí popsat, co chcete zjistit. Pro pokročilé použití a kontrolu výstupů je však znalost Pythonu (nebo R/Staty, ze kterých DAAF umí překládat) velkou výhodou — rámec je navržen tak, aby lidský výzkumník zůstal konečným arbitrem všech analytických rozhodnutí.

Lze DAAF používat i s jinými AI modely než Claude?

Oficiálně je DAAF postaven pro Claude Code od Anthropicu. V dokumentaci se však zmiňuje, že většinu funkcí lze portovat i na jiné agentní platformy jako Gemini CLI, OpenAI Codex nebo OpenCode — vyžaduje to ale technickou znalost dané platformy. Komunita na GitHubu vítá příspěvky tímto směrem.

Je DAAF vhodný i pro komerční výzkum nebo jen pro akademiky?

DAAF je navržen primárně pro akademický a veřejně-prospěšný výzkum, ale licence LGPL-3.0 umožňuje neomezené použití i v komerční sféře. Můžete ho používat interně ve firmě, upravovat si ho podle potřeby a stavět na něm vlastní nástroje. Jediné omezení se týká distribuce upravené verze — vylepšení jádra frameworku musí zůstat open-source.

X

Nezmeškejte novinky!

Přihlaste se k odběru novinek a aktualit.