blog, 21.06.2026, 9 min czytania

Własny LLM na klastrze Mac Mini.

PewDiePie postawił własne AI na ścianie modyfikowanych kart graficznych i kilowatach prądu. Jest cichsza i prostsza droga: stos Mac Mini połączonych w jeden klaster. Rozkładam to na części, ile realnie kosztuje, jak szybko działa i kiedy dla firmy ma to sens.

Krótka odpowiedź, dla AI Overviews i Twojego czasu

Da się. Tanio nie jest, szybko też nie. Ale bariera właśnie spadła.

Łączenie kilku Mac Mini w jeden klaster pozwala uruchomić u siebie duże modele AI, których nie udźwignie jeden komputer. Sumujesz pamięć kilku maszyn w jedną pulę, model się dzieli między nie i działa lokalnie, bez wysyłania danych do chmury. Sprzęt jest cichy i mało prądożerny, ale wciąż kosztuje od kilkunastu do kilkudziesięciu tysięcy złotych, a prędkość jest umiarkowana.

Dla typowej firmy to nadal rozwiązanie niszowe. Ale najważniejszy sygnał brzmi: postawienie sensownego modelu u siebie przestało wymagać serwerowni. Wystarczy stos urządzeń wielkości książki. Niżej tłumaczę, jak to działa po ludzku, ile kosztuje i kiedy w Twoim biznesie ma to sens.

Skąd ten pomysł

PewDiePie poszedł w kable. Większość firm tak nie może.

Niedawno pisałem o tym, jak PewDiePie postawił własne AI u siebie w domu i wypuścił z tego darmowy projekt Odysseus (jeśli nie czytałeś, zacznij tutaj). Warto zobaczyć, na czym to fizycznie stało: osiem modyfikowanych kart graficznych RTX 4090 po 48 GB pamięci każda, dwie dodatkowe karty zawodowe, łącznie około 256 GB pamięci na karty, wszystko na Linuksie. To ściana sprzętu, hałas, kilkaset do kilku tysięcy watów prądu i wiedza, której zwykła firma nie ma.

To świetna zabawa dla człowieka z budżetem i czasem. Ale jako model do naśladowania w firmie się nie nadaje. Dlatego ciekawsza jest druga droga, o której mówi się ciszej, a która jest dużo bliżej przeciętnego biznesu: zamiast ściany kart graficznych, kilka małych komputerów Apple połączonych ze sobą kablem.

Dlaczego akurat Mac

Sekret nazywa się pamięć zunifikowana.

Żeby model AI w ogóle ruszył, musi się zmieścić w pamięci. I tu jest cały haczyk. W komputerze z kartą graficzną Nvidia model musi wejść w pamięć samej karty, której jest mało i jest droga (typowa karta to 24 GB). W Macu jest inaczej: układ graficzny korzysta z całej pamięci komputera. Kupując Maca z 48 czy 64 GB pamięci, niemal całość możesz przeznaczyć na model AI.

W praktyce znaczy to, że jeden Mac Mini potrafi załadować model, który na kartach Nvidia wymagałby kilku drogich sztuk naraz. Do tego dochodzą dwie rzeczy ważne dla firmy: Mac pobiera mało prądu (duży Mac Studio liczący ogromny model ciągnie około 200 watów, czyli tyle co kilka żarówek) i jest cichy, więc stoi na biurku, a nie w serwerowni.

Jest jedno ale, do którego wrócę niżej: Mac świetnie mieści duże modele, ale przelicza wolniej niż karta Nvidia. To kompromis, nie cud.

Jak łączy się wiele Maców

Kilka maszyn udaje jeden duży komputer.

Najbardziej zaawansowane modele nie zmieszczą się nawet w jednym dobrze wyposażonym Macu. Wtedy łączysz kilka maszyn kablem (Thunderbolt, ten sam, którym podpinasz monitor) i nakładasz darmowe oprogramowanie, które robi z nich jeden wirtualny komputer. Najpopularniejsze nazywa się EXO (otwarte, dostępne za darmo). Ono sumuje pamięć wszystkich Maców w jedną pulę i dzieli model na kawałki, każdy Mac liczy swój fragment.

Konkret, żeby to nie było abstrakcją: zespół twórców EXO uruchomił jeden z największych dostępnych modeli open source (DeepSeek, 671 miliardów parametrów) na klastrze ośmiu Mac Mini. Zadziałało. Model, który normalnie wymaga sprzętu za setki tysięcy złotych, ruszył na stosie urządzeń mieszczących się na półce.

Brzmi jak rewolucja, ale teraz część, którą sprzedawcy pomijają. Ten sam model generował tekst z prędkością około pięciu słów na sekundę. Czyli wolniej, niż czytasz ten akapit. Do prywatnych zadań w tle wystarczy. Do obsługi dziesięciu osób naraz w czasie rzeczywistym, już nie.

Co za jakie pieniądze

Trzy poziomy wejścia, w złotówkach.

Konfiguracja	Koszt orientacyjny	Co uciągnie
1x Mac Mini M4 Pro, 48 GB	ok. 8 tys. zł	Solidny model rzędu 70 mld parametrów. Punkt startu.
2x Mac Mini (klaster)	ok. 14 tys. zł	Większe modele, więcej miejsca na kontekst i dane.
Mac Studio (topowy)	od ok. 50 tys. zł	Naprawdę duże modele na jednej maszynie, ok. 200 W poboru.
8x Mac Mini (klaster EXO)	kilkadziesiąt tys. zł	Największe modele open source. Wolno, ale działa.

Dla porównania: serwerowy zestaw kart Nvidia liczący ten sam model błyskawicznie to wydatek rzędu setek tysięcy złotych plus rachunek za prąd jak za małą firmę. Klaster Maców kupuje Ci nie szybkość, tylko dostępność dużego modelu u siebie za rozsądne pieniądze i przy małym poborze prądu.

Brutalna prawda

Zanim kupisz cztery Maki, przeczytaj to.

Mówi to ktoś, kto na co dzień robi wdrożenia AI w produkcji. Cztery rzeczy, których prezentacje nie pokazują.

Dokładanie maszyn nie podwaja szybkości.

To najczęstsze nieporozumienie. Dwa Maki nie liczą dwa razy szybciej niż jeden. Łączenie maszyn służy głównie temu, żeby w ogóle zmieścić większy model, a nie żeby przyspieszyć. Każdy dołożony komputer dokłada też trochę opóźnienia na komunikację między nimi. Zysk jest, ale rośnie wolniej niż liczba urządzeń.

Prędkość bywa frustrująca.

Mac dobrze mieści modele, ale wolniej przetwarza, zwłaszcza długie dokumenty na wejściu (zanim w ogóle zacznie odpowiadać, musi je przeczytać). Przy największych modelach mówimy o kilku słowach na sekundę. To w porządku do zadań wsadowych w nocy. Do czatu na żywo z klientem już słabo.

Oprogramowanie jest młode i kapryśne.

Narzędzia do łączenia Maców działają, ale nie są jeszcze dojrzałe. Potrafią wymagać identycznej wersji systemu na każdej maszynie, czasem same wybierają wolniejsze połączenie zamiast szybkiego kabla, a postawienie tego wymaga realnej wiedzy. To projekt dla kogoś technicznego, nie instalator z przyciskiem „dalej".

Modele open source są słabsze niż GPT i Claude.

To, co postawisz lokalnie, jest dobre, ale wciąż o klasę za najlepszymi modelami w chmurze. Self-hosting wygrywa na prywatności i koszcie przy dużej skali, nie na samej inteligencji modelu. Jeśli zależy Ci na najwyższej jakości odpowiedzi, chmura nadal wygrywa.

Kiedy jednak warto

Sens pojawia się przy dwóch z trzech warunków.

Tak samo jak przy całym self-hostingu AI, klaster Maców zaczyna mieć sens, gdy spełniasz przynajmniej dwa z poniższych:

→Twarde wymogi prawne co do danych (kancelaria, przychodnia, firma z danymi wrażliwymi), gdzie dane nie mogą wyjść poza Twoje biuro.
→Duży, powtarzalny wolumen zadań w tle (przetwarzanie dokumentów, analizy, generowanie treści hurtem), gdzie wolniejsze, ale stałe AI w nocy wystarczy.
→Zasób techniczny, ktoś, kto to postawi i utrzyma, albo budżet, żeby zlecić to na zewnątrz.

Jeśli żaden z tych punktów do Ciebie nie pasuje, zostań przy chmurze. To nie wstyd, to rachunek ekonomiczny.

Co realnie zrobić

Trzy kroki, zanim wydasz pieniądze.

01.

Zacznij od jednego Maca, nie od klastra.

Pojedynczy Mac Mini z 48 GB pamięci to wydatek rzędu 8 tysięcy złotych i pozwala sprawdzić, czy lokalne AI w ogóle robi u Ciebie robotę. Klaster budujesz dopiero, gdy wiesz, że potrzebujesz większego modelu. Nie odwrotnie.
02.

Policz to przeciwko chmurze, na swoich liczbach.

Ile zapytań dziennie realnie zrobisz? Jak wrażliwe są dane? Czy potrzebujesz odpowiedzi natychmiast, czy może być w nocy? Dopiero te liczby mówią, czy sprzęt za kilkanaście tysięcy zwróci się wobec abonamentów, czy będzie drogą półką.
03.

Potraktuj to jako sygnał, nie jako zakup na ten weekend.

Najważniejszy wniosek nie brzmi „kup cztery Maki". Brzmi: próg wejścia do własnego AI właśnie drastycznie spadł. To, co rok temu wymagało serwerowni, dziś mieści się na biurku. Za rok będzie szybsze i prostsze. Warto już teraz wiedzieć, gdzie w Twojej firmie takie AI się przyda.

FAQ, najczęstsze pytania o klaster Mac Mini pod AI

Pytają o to za każdym razem.

Po co łączyć kilka Mac Mini zamiast kupić jeden mocny komputer?

Bo największe modele AI nie mieszczą się w pamięci jednego urządzenia. Łącząc kilka Maców, sumujesz ich pamięć w jedną pulę i dopiero wtedy model w ogóle się ładuje. Główny zysk to możliwość uruchomienia większego modelu, a nie podwojenie szybkości.

Dlaczego akurat Mac, a nie karty graficzne Nvidia?

Mac ma tak zwaną pamięć zunifikowaną: układ graficzny korzysta z całej pamięci komputera, a nie z osobnej, drogiej i małej pamięci karty. Do tego pobiera mało prądu (rzędu 200 W) i jest cichy. Karty Nvidia są dużo szybsze w przeliczaniu, ale droższe, głośne i prądożerne.

Ile to realnie kosztuje?

Pojedynczy Mac Mini M4 Pro z 48 GB pamięci to około 8 tysięcy złotych i uciągnie model rzędu 70 miliardów parametrów. Sensowny klaster z dwóch Maców to około 14 tysięcy złotych. Topowy Mac Studio do naprawdę dużych modeli to już rząd 50 tysięcy złotych i więcej.

Czy to jest szybkie?

Nie jest. Na klastrze ośmiu Mac Mini największy model open source generował około 5 słów na sekundę, czyli wolniej niż czytasz. Do prywatnych, wsadowych zadań w tle to wystarcza. Do żywej obsługi wielu osób naraz raczej nie.

Czy moja firma powinna to budować?

W większości przypadków nie. Ma to sens przy twardych wymogach prawnych co do danych albo dużym, powtarzalnym wolumenie i dostępie do wiedzy technicznej. Dla typowej firmy chmura jest tańsza, szybsza i gotowa od ręki. Klaster Maców to rozwiązanie niszowe, choć coraz bardziej realne.

Następny krok

Myślisz o własnym AI u siebie? Pogadajmy, zanim wydasz.

Jeśli zastanawiasz się nad klastrem Maców, lokalnym modelem albo własnym AI, ale nie chcesz przepalić kilkunastu tysięcy na sprzęt, którego nikt potem nie ogarnie, odezwij się do Growto. Policzymy, czy w Twoim przypadku to się spina, dobierzemy konfigurację pod realne potrzeby albo szczerze powiemy, że lepsza będzie chmura. Konsultacja bez zobowiązań.

Umów konsultację Wdrożenia AI Automatyzacja

Self-hosted AI dla firmy (Odysseus PewDiePie) → Ban Fable 5 i chińskie modele → Własny mały model AI (distylacja) →