Konec monolitu: Co je sakra Mellum2 a proč MoE?

Konec cloudového diktátu: Proč JetBrains s Mellum2 vypálili rybník velkým hráčům a co to znamená pro váš hardware

Sledovat start (nebo spíš pád) rakety New Glenn od Blue Origin byla pro fanoušky vesmíru bolestivá zkušenost. Miliony dolarů v prachu, roky vývoje v troskách a pocit, že když selže monolitický obr, vezme s sebou úplně všechno. V technologii se tomu říká "single point of failure". A přesně to je důvod, proč je svět AI aktuálně v bodě zlomu. Zatímco Microsoft a Google dál nafukují své obří modely, které žerou elektřinu jako menší město, JetBrains na to šli opačně. Představili Mellum2. Je to 12B model typu Mixture-of-Experts (MoE), který neaspiruje na to, aby vám napsal básničku o lásce v renesančním stylu. On chce prostě "jen" sakra dobře kódovat. A to je přesně to, co v roce 2026 potřebujeme.

Konec monolitu: Co je sakra Mellum2 a proč MoE?

Doba, kdy jsme se klaněli před GPT-4 jako před jediným bohem, je pryč. Ukázalo se, že mít jeden model na všechno – od receptů na bábovku po ladění linuxového jádra – je neefektivní nesmysl. JetBrains, firma, kterou každý vývojář zná díky IntelliJ nebo PyCharmu, to pochopila jako první. Jejich Mellum2 není jen další "tupé" LLM. Je to chirurgický nástroj.

Zkratka MoE (Mixture-of-Experts) je v podstatě organizační schéma pro neurony. Představte si to jako firmu. V klasickém modelu (jako je Llama 3 v plné palbě) musí při každém dotazu pracovat úplně všichni zaměstnanci, od uklízečky po ředitele. V MoE modelu sedí v kanceláři skupina specialistů – "expertů". Když se zeptáte na SQL dotaz, aktivují se jen ti, co rozumí databázím. Zbytek modelu "spí" a nežere výpočetní výkon. Mellum2 má sice 12 miliard parametrů, ale při každém tokenu jich používá jen zlomek. Výsledek? Je to rychlé. Je to levné. A hlavně se to dá rozumně provozovat.

Pro české firmy, které řeší bezpečnost, je tohle dar z nebe. Už nemusíte posílat svůj zdrojový kód na servery do Kalifornie, kde ho někdo (možná) čte nebo na něm trénuje další verzi. S modely jako Mellum2 se vracíme k lokální suverenitě. Pokud vás zajímá, jak se dá ušetřit na infrastruktuře nejen v IT, ale i v energetice, podívejte se na Share-Electric.cz, kde se řeší podobná efektivita u fotovoltaik.

Architektura expertů: Když 12 miliard neznamená 12 miliard

Pojďme do hloubky, protože čísla nelžou. Mellum2 využívá takzvaný "gating network". To je v podstatě vysoce inteligentní vrátný. Když mu hodíte řádek kódu v Pythonu, on se podívá a řekne: "Tohle pošlete expertům 3 a 7." Tím, že se neaktivuje celých 12 miliard parametrů, klesá latence na úroveň, kdy vám kód pod rukama vzniká v reálném čase. Žádné čekání na "přemýšlení" cloudu.

JetBrains tento model trénovali na obrovském množství veřejně dostupného kódu s důrazem na logiku a syntaktickou správnost. Na rozdíl od obecných modelů, které mají tendenci "halucinovat" (vymýšlet si neexistující knihovny), Mellum2 v benchmarku HumanEval exceluje. Proč? Protože ho nikdo nenutil učit se historii českých králů nebo recept na svíčkovou. Je to úzce profilovaný specialista.

Tenhle trend "zmenšování a specializace" vidíme všude. I v energetice se už nečeká na obří jaderné bloky, ale staví se agilní systémy. Smart Energy Share například využívá podobnou logiku pro obchodování s elektřinou – místo jednoho obřího nákupu řeší stovky malých, chytrých transakcí v reálném čase. A přesně tak funguje Mellum2. Je to o efektivitě, ne o hrubé síle.

Proč JetBrains vykopli OpenAI z baráku?

Dlouho to vypadalo, že JetBrains budou jen "překupníci" API klíčů od OpenAI. Jejich AI Assistant v začátcích přesně takhle fungoval. Jenže závislost na cizím API je pro firmu typu JetBrains nebezpečná. Když OpenAI zvýší ceny nebo změní pravidla, jste v koncích. Mellum2 je jejich cesta k nezávislosti.

Vlastní model jim umožňuje hlubší integraci do IDE. Mellum2 vidí celou strukturu vašeho projektu, rozumí souvislostem mezi soubory a ví, jakou verzi frameworku používáte. To je něco, co se přes generické API dělá hrozně těžko a draze. Navíc, díky MoE architektuře, mohou JetBrains tento model nabízet v rámci předplatného, aniž by na každém vašem dotazu prodělávali kalhoty.

Pokud chcete vidět, jak se dají efektivně propojovat různé technologie, prostudujte si návody na SdileniEnergie.info. Tam uvidíte, že i v energetice je klíčem k úspěchu integrace a vlastní kontrola nad daty, nikoliv slepé spoléhání na velké dodavatele. JetBrains s Mellum2 udělali přesně tento krok – vzali si kontrolu zpět.

Lokální AI: Jak si Mellum2 (nebo jeho bráchy) pustit v obýváku

Tady začíná ta pravá sranda. Díky tomu, že Mellum2 je relativně malý (a efektivní díky MoE), nemusíte mít v serverovně superpočítač od NASA. Pokud máte doma nebo v práci grafickou kartu řady RTX 3000 nebo 4000 s alespoň 12 GB VRAM, jste ve hře.

Nástroje jako Ollama nebo LM Studio už dnes umožňují tyto modely spouštět jedním příkazem. Stačí napsat `ollama run mellum2` (až bude oficiálně v repozitáři) a máte na stole inteligenci, která strčí do kapsy většinu juniorních programátorů. A co je nejlepší? Je to zadarmo (pokud nepočítáte elektřinu). Pro fajnšmekry jsou tu pak techniky jako LoRA (Low-Rank Adaptation), díky kterým si můžete Mellum2 "dotrénovat" na vašem vlastním firemním kódovém stylu.

Hardware pro lokální AI dnes stojí zlomek toho, co dříve. Kvalitní grafiku koupíte za 10-15 tisíc korun. To je investice, která se vám vrátí v ušetřeném čase za jeden měsíc. Navíc, provozování lokálního modelu je skvělý způsob, jak využít přebytky z vaší fotovoltaiky. Místo abyste elektřinu posílali do sítě za pár haléřů, můžete ji "pálit" při trénování vlastních agentů. To je ta pravá technologická svoboda. Všechny modely najdete samozřejmě na HuggingFace, což je v podstatě GitHub pro umělou inteligenci.

Od kecálků k agentům: Proč kódování i energetika potřebují logiku

Mellum2 je důkazem, že éra "chatování" končí. Nikdo se nechce ptát AI: "Jak mám napsat tohle?" Všichni chceme agenta, kterému řekneme: "Tady je bug v autentizaci, oprav ho a napiš k tomu testy." A k tomu potřebujete agentní logiku. Model musí umět používat nástroje – terminál, debugger, git.

Agentní logika je o autonomii. Zatímco staré LLM jen doplňovaly text, Mellum2 v rámci ekosystému JetBrains funguje jako pozorovatel. Vidí, co děláte, a proaktivně navrhuje řešení. Tohle je přesně to, co odlišuje hračku od profesionálního nástroje. A neplatí to jen pro kód.

Vezměte si takový Smart Energy Share. Tam už taky nikdo nekouká na grafy a neříká si "teď bych mohl zapnout baterku". Dělá to za ně agent. AI sleduje spotové ceny na OTE, předpověď počasí, stav nabití BESS (Battery Energy Storage System) a autonomně obchoduje. Rozhoduje se v milisekundách, zda elektřinu prodat jako regulační energii, nebo ji uložit pro vlastní potřebu. To je ta samá logika, kterou Mellum2 přináší do světa kódu – schopnost analyzovat komplexní systém a udělat v něm autonomní, smysluplnou akci.

Budoucnost patří malým, chytrým a lokálním systémům. Ať už jde o 12B model ve vašem IDE, nebo o 100 kW baterii ve vašem sklepě, cíl je stejný: efektivita, soukromí a nezávislost na gigantech, kteří se sypou k zemi jako raketa New Glenn. Mellum2 není jen nový model. Je to manifest nové éry vývoje softwaru.

Zdroje

- JetBrains AI Lab: Introducing Mellum2 - HuggingFace: Mixture of Experts Explained - oEnergetice.cz: Trendy v automatizaci a AI - ShareElectric.cz: Praktické návody pro energetickou nezávislost - OTE: Denní trh s elektřinou

Obchodujete s batteriovými úložišti nebo hledáte partnera pro flexibilitu a day trading elektřiny? SmartEnergyShare nabízí kompletní řešení pro BESS projekty od 50 do 250 kW - obchodování odchylek, regulační elektřiny a intraday trading. Zjistěte víc na SmartEnergyShare.

Další články na toto téma najdete na: ElectricShare.cz - inovace a kybernetická bezpečnost SmartEnergyShare.cz - baterie, VPP a balkónové elektrárny