Co je DAAF a proč vznikl
Data Analyst Augmentation Framework (DAAF) je bezplatný open-source nástroj, který funguje jako "inteligentní laboratorní manažer" pro Claude Code od Anthropicu. Jeho autor Brian Heseung Kim ho postavil na jednoduché premise: velké jazykové modely sice umí psát analytický kód a zpracovávat data, ale zároveň halucinují, zkracují si práci a působí přehnaně sebevědomě. DAAF tyto nedostatky systematicky potlačuje tím, že nutí Claude chovat se jako pečlivý a zodpovědný výzkumník.
Kim na frameworku pracuje od roku 2018 — ještě před vydáním ChatGPT — a celou svou dizertační práci věnoval právě tomu, jak učit ostatní používat AI nástroje zodpovědně. DAAF je výsledkem těchto let výzkumu a stojí na pěti principech: transparentnost, škálovatelnost, rigoróznost, reprodukovatelnost a odpovědnost.
Jak DAAF funguje v praxi
DAAF se instaluje jedním příkazem přes terminál (macOS/Linux) nebo PowerShell (Windows) a běží v Docker kontejneru, který izoluje Claude od zbytku vašeho souborového systému. Tím chrání citlivá data před nechtěným přístupem. Po spuštění komunikujete s Claude Code přirozeným jazykem — stačí popsat, co chcete analyzovat, a DAAF sám určí, jaký typ workflow je nejvhodnější.
Framework nabízí devět režimů práce, od rychlé konzultace přes vyhledávání v datasetech až po kompletní výzkumný pipeline:
- Ad Hoc Collaboration — neformální brainstorming, pomoc s kódem nebo metodologií
- Data Lookup — rychlé dotazy na datasety (např. "Jaké socioekonomické proměnné máme v College Scorecard?")
- Data Onboarding — naučí Claude rozumět vašim vlastním datům a dokumentaci
- Data Discovery — propojuje informace napříč různými datovými zdroji
- Full Pipeline — od výzkumné otázky až po hotovou analýzu s reportem
- Revision & Extension — vylepšuje a rozšiřuje existující analýzy
- Reproducibility Verification — ověřuje, že je analýza plně reprodukovatelná
- Framework Development — rozšiřuje samotný DAAF o nové metody a knihovny
- User Support — pomáhá s instalací, nastavením Dockeru a technickými otázkami
Co DAAF odlišuje od běžného použití AI
Klíčovou inovací DAAF je agentní orchestrace (agentic orchestration). Při Full Pipeline analýze DAAF nespustí jen jedno vlákno — automaticky rozděluje práci mezi specializované asistenty: jeden napíše kód, druhý jej adversarálně zkontroluje (hledá chyby, metodologické nedostatky, logické přešlapy), třetí ověří reprodukovatelnost. Člověk zůstává vždy u řízení — v každé fázi vás DAAF požádá o schválení, než pokročí dál.
Další pojistkou proti halucinacím je rozsáhlá knihovna ověřených referenčních příruček (agent skills), které DAAF dynamicky načítá podle kontextu. Místo aby Claude spoléhal na svou "obecnou znalost", pracuje s konkrétními citacemi a metodologickými postupy — od kauzální inference přes geospaciální analýzu až po strojové učení.
Metodologický záběr: od regresní diskontinuity po geospaciální analýzu
DAAF přichází s předpřipravenou podporou pro více než dvacet statistických metod včetně difference-in-differences, instrumentálních proměnných, regresní diskontinuity, propensity score matching, analýzy časových řad, shlukové analýzy nebo algoritmického posuzování férovosti (fairness). K tomu nabízí expertní znalost knihoven jako polars, pyfixest, statsmodels, scikit-learn, geopandas, plotly, SHAP a mnoha dalších.
Zajímavostí je podpora překladu kódu mezi R/tidyverse a Statou do Pythonu — výzkumníci zvyklí na tyto nástroje tak mohou plynule přejít do ekosystému DAAF, aniž by se museli učit Python od nuly.
Kdo DAAF používá a co stojí
DAAF je zcela zdarma a open-source pod licencí LGPL-3.0. Brian Kim výslovně odmítá jakékoliv premium tiers nebo "bait-and-switch" modely — framework má sloužit jako veřejný statek pro výzkumnou komunitu. Jediným nákladem je předplatné Anthropic Max za 100–200 USD měsíčně (přibližně 2 200–4 400 Kč), případně lze použít API klíč s platbou za token.
Za necelý rok od spuštění DAAF získal přes 1 300 unikátních uživatelů a 197 hvězd na GitHubu. Workshopy proběhly na institucích jako Northwestern University, University of Virginia, Stanford University, Bowdoin College nebo Urban Institute. Komunita se schází na Discordu a framework čítá 328 commitů od přispěvatelů.
Co to znamená pro české výzkumníky
Pro českou akademickou scénu — od sociologů přes ekonomy až po datové analytiky ve veřejné správě — představuje DAAF zajímavou příležitost. Framework je zdarma, běží na standardním počítači s Dockerem a jeho metodologický záběr pokrývá většinu technik používaných v sociálních vědách. Není potřeba žádné speciální hardwarové vybavení — výpočty běží lokálně v Pythonu, Claude zajišťuje pouze "myšlení".
Jazyková bariéra je samozřejmě téma — DAAF komunikuje anglicky a Claude Code češtinu oficiálně nepodporuje. Pro výzkumníky s alespoň základní angličtinou by to však neměla být překážka, zejména proto, že analytický kód a dokumentace jsou v angličtině standardem i na českých univerzitách.
Zajímavý je také GUIDE-LLM reporting standard, který DAAF automaticky vyplňuje — jde o mezinárodně uznávaný checklist pro transparentní deklaraci použití AI při výzkumu. Pokud publikujete v zahraničních časopisech, může to zjednodušit splnění jejich požadavků na AI disclosure.
Bezpečnost a reprodukovatelnost na prvním místě
DAAF běží v Docker kontejneru, což znamená, že Claude nemá přístup k vašim osobním souborům mimo vyhrazený pracovní adresář. Framework také obsahuje ochranu proti destruktivním příkazům (např. rm -rf) a skenování tajných klíčů (credentials scanning). Každá analytická relace je automaticky verzována přes Git a kompletní transkript včetně všech "myšlenek" Claude je archivován pro pozdější kontrolu.
Pro výzkumníky pracující s citlivými daty (např. zdravotnická data, osobní údaje respondentů) je to zásadní — DAAF umožňuje využívat sílu AI, aniž byste museli data nahrávat do cloudu třetích stran.
Dostupnost a jak začít
Instalace vyžaduje Docker Desktop (zdarma) a Anthropic účet s Max předplatným. Po spuštění instalačního skriptu jste připraveni během pár minut:
- macOS/Linux:
curl -fsSL https://raw.githubusercontent.com/DAAF-Contribution-Community/daaf/main/scripts/host/install.sh | bash - Windows:
irm https://raw.githubusercontent.com/DAAF-Contribution-Community/daaf/main/scripts/host/install.ps1 | iex
Kompletní dokumentace je k dispozici na daaf.openaugments.org, včetně videonávodů a interaktivního průvodce anatomií kompletní analýzy. Komunita je aktivní na Discordu a blog DAAF Field Guide vychází na Substacku.
Potřebuji k používání DAAF umět Python?
Ne nutně. DAAF s vámi komunikuje přirozenou angličtinou a veškerý kód generuje a kontroluje sám. Pro základní analýzy stačí popsat, co chcete zjistit. Pro pokročilé použití a kontrolu výstupů je však znalost Pythonu (nebo R/Staty, ze kterých DAAF umí překládat) velkou výhodou — rámec je navržen tak, aby lidský výzkumník zůstal konečným arbitrem všech analytických rozhodnutí.
Lze DAAF používat i s jinými AI modely než Claude?
Oficiálně je DAAF postaven pro Claude Code od Anthropicu. V dokumentaci se však zmiňuje, že většinu funkcí lze portovat i na jiné agentní platformy jako Gemini CLI, OpenAI Codex nebo OpenCode — vyžaduje to ale technickou znalost dané platformy. Komunita na GitHubu vítá příspěvky tímto směrem.
Je DAAF vhodný i pro komerční výzkum nebo jen pro akademiky?
DAAF je navržen primárně pro akademický a veřejně-prospěšný výzkum, ale licence LGPL-3.0 umožňuje neomezené použití i v komerční sféře. Můžete ho používat interně ve firmě, upravovat si ho podle potřeby a stavět na něm vlastní nástroje. Jediné omezení se týká distribuce upravené verze — vylepšení jádra frameworku musí zůstat open-source.