Co jsou real-time voice agenti a proč jsou jiní než běžné chatboty
Real-time voice agenti v Microsoft Copilot Studio představují výrazný posun od klasických interaktivních hlasových odpovědí (IVR), se kterými se setkáváme v bankovních linkách nebo call centrech. Místo vybírání možností z menu pomocí čísel na telefonu může zákazník prostě mluvit — a AI mu okamžitě odpovídá vlastním hlasem.
Zatímco tradiční chatboti často pracují s textem nebo předem definovanými frázemi, real-time voice agenti využívají velké jazykové modely (LLM) a pokročilé zpracování řeči. Díky tomu porozumějí přirozené mluvě s přízvukem, dialekty i neúplnými větami. Dokážou udržet kontext celého rozhovoru, připomenout si dříve zmíněné údaje a plynule přejít mezi tématy. To z nich dělá nástroj vhodný pro složitější zákaznické scénáře, kde klasické stromové menu selhává.
Hlavní schopnosti, které Microsoft klade na stůl
Podle oficiální dokumentace Microsoftu přinášejí real-time voice agenti sedm klíčových funkcí:
- Natural language understanding — porozumění záměru volajícího bez nutnosti naučit se přesné fráze nebo procházet nabídky.
- Voice-first design — celý zážitek je stavěný primárně pro mluvenou interakci s přirozeným tempem dialogu.
- Real-time responsiveness — minimální prodleva mezi otázkou a odpovědí, včetně přirozených pauz a přerušení.
- Context awareness — agent si pamatuje průběh konverzace a dokáže se odkazovat na předchozí interakce.
- Multilingual support — podpora více jazyků, včetně češtiny. Podle oficiálního seznamu Microsoft Copilot Studio podporuje češtinu mezi více než dvaceti jazyky.
- Flexible integration — napojení na CRM systémy, znalostní báze, API a automatizační toky Power Automate.
- Deterministic control — kombinace generativní AI se strukturovanými tématy zajišťuje konzistenci a dodržování předpisů.
Co potřebujete k nasazení
Real-time voice agenti nejsou samostatná aplikace, kterou si stáhnete z internetu. Vyžadují sadu podnikových licencí a rolí od Microsoftu. Konkrétně jde o:
- Dynamics 365 Contact Center s aktivním hlasovým kanálem (Voice channel) a směrováním hovorů (call routing).
- Roli Omnichannel administrator, která umožňuje konfigurovat hlasový kanál a pracovní streamy.
- Copilot Studio pro tvorbu a správu agentů.
- Roli Copilot Studio maker s oprávněním vytvářet a konfigurovat agenty.
Pro menší firmy nebo jednotlivce, kteří chtějí experimentovat s hlasovou AI, to znamená vstupní investici do ekosystému Dynamics 365. Platforma je tedy primárně určena pro střední a velké podniky s existující infrastrukturou Microsoftu.
Ceny: pay-as-you-go, ale pozor na skryté náklady
Microsoft Copilot Studio funguje na principu Pay-As-You-Go. Zákazníci neplatí fixní měsíční poplatek, ale tzv. Copilot Credits podle skutečné spotřeby. Množství kreditů závisí na složitosti agenta, zdrojích znalostí a náročnosti vygenerované odpovědi nebo akce. Konkrétní ceník za kredit Microsoft nezveřejňuje přímo na webu — pro přesnou kalkulaci je nutné použít Azure Pricing Calculator nebo kontaktovat obchodní zástupce.
Kromě samotných kreditů je třeba započítat náklady na Dynamics 365 Contact Center, které se liší podle velikosti organizace a objemu hovorů. Firmy by měly počítat s tím, že hlasová interakce v reálném čase patří k náročnějším úkonům a spotřebuje více kreditů než textový chatbot.
Pro české firmy zásadní problém: data končí v USA
Zde přichází nejdůležitější omezení pro evropské uživatele. Podle aktuální dokumentace Microsoftu platí od dubna 2026 následující pravidla:
- Real-time voice AI model je hostován výhradně v Severní Americe.
- Zákazníci mimo Severní Ameriku musí povolit cross-geo processing — jejich hlasová data se tedy přenášejí a zpracovávají na serverech v USA.
- Zákazníci v rámci EU Data Boundary (tedy firmy, které požadují, aby jejich data zůstala v EU) nemohou real-time voice agenty vůbec používat.
Pro české firmy to znamená zásadní komplikaci. Zatímco standardní textoví agenti v Copilot Studio mohou běžet v evropských datových centrech, real-time hlasová varianta vyžaduje výjimku z evropských pravidel pro přenos dat. To může být pro společnosti podléhající přísným compliance požadavkům — například v bankovnictví, zdravotnictví nebo veřejné správě — zcela nepřijatelné. Microsoft doporučuje sledovat budoucí aktualizace, kdy by se mohla dostupnost rozšířit i do evropských regionů.
Bezpečnost a odpovědné používání AI
Microsoft ve své dokumentaci otevřeně upozorňuje, že bezpečnostní a etické evaluace odhalily omezení v chování real-time voice agentů, která mohou vést k vyššímu riziku generování potenciálně škodlivého obsahu. Zákazníci jsou proto vyzýváni, aby přijali odpovídající mitigační opatření, například nastavení strukturovaných témat a deterministických kontrol.
Každý provozovatel je navíc plně odpovědný za dodržování platných zákonů a podmínek Microsoftu, včetně Microsoft Enterprise AI Services Code of Conduct. V kontextu českého a evropského prostředí to znamená respektování GDPR, zákona o ochraně osobních údajů a případných sektorových regulací.
Jak si stojí vůči konkurenci?
Trh s konverzační AI se rychle vyvíjí. Podobné schopnosti nabízí například Google Dialogflow CX s integrací Google Cloud Speech-to-Text a Text-to-Speech, nebo Amazon Lex s real-time hlasovými boty pro AWS. Oba konkurenti však čelí podobným regionálním a cenovým výzvám. Výhodou Microsoftu je hluboká integrace s Office 365, Dynamics 365 a Power Platform, což může být pro firmy již zakořeněné v ekosystému Microsoftu rozhodující argument.
Zároveň ale platí, že Google a Amazon nabízejí své hlasové modely v širší škále regionů, což může být pro evropské firmy v tuto chvíli praktičtější volba. Microsoft bude muset rychle dohnat geografickou dostupnost, aby real-time voice agenti v Copilot Studio byli pro evropské zákazníky skutečnou alternativou.
Mohu real-time voice agenty v Copilot Studio používat v češtině?
Ano, Copilot Studio oficiálně podporuje češtinu mezi více než dvaceti jazyky. Zatímco textoví agenti mohou běžet v evropských datových centrech, real-time hlasoví agenti aktuálně vyžadují zpracování v Severní Americe, což může být pro některé české firmy regulatorní překážkou.
Jaké licence potřebuji pro spuštění real-time voice agenta?
Potřebujete Dynamics 365 Contact Center s hlasovým kanálem, Copilot Studio a příslušné administrátorské role. Copilot Studio se účtuje přes model Pay-As-You-Go pomocí tzv. Copilot Credits, jejichž cena závisí na složitosti interakce.
Proč nemohou firmy v EU Data Boundary používat real-time voice agenty?
Od dubna 2026 je real-time voice AI model hostován pouze v Severní Americe. Zákazníci v rámci EU Data Boundary mají zakázán přenos osobních dat mimo EU, což znemožňuje používání této funkce, protože hlasová data by musela být zpracována v USA.