Obrázek
Gemma 4 zrychluje až trojnásobně: Google představil multi-token prediction pro své open-source modely
Nová technika speculative decoding umožňuje modelům Gemma 4 generovat text až třikrát rychleji bez jakékoliv ztráty přesnosti. Díky open-source licenci Apache 2.0 si ji mohou vývojáři vyzkoušet okamžitě v Ollamě, vLLM nebo přímo na mobilu.