ChatGPT zdetronizowany. Elon Musk zaprezentował model Grok 3

Technologie Dołącz do dyskusji
ChatGPT zdetronizowany. Elon Musk zaprezentował model Grok 3

Pierwszy kwartał 2025 roku przejdzie do historii jako jeden z najbardziej obfitych dla branży AI. Zainteresowanie tym tematem sięgnęło zenitu – każdy chce zaznaczyć swoją obecność na rynku. Obojętnie nie mógł przejść także Elon Musk, który zaledwie 2 lata temu założył xAI. Model Grok już od pewnego czasu jest dostępny w ramach X (ex-Twitter). W nocy z poniedziałku na wtorek zaprezentowano jego najnowszą wersję – Grok 3.

Postęp w 2 lata

Wielu ludzi nie wie, ale Elon Musk był w 2015 roku jednym z założycieli OpenAI, czyli dzisiejszych twórców ChatGPT. Wśród założycieli znajdował się także obecny CEO, czyli Sam Altman. Nie zabrakło polskiego akcentu – Wojciech Zaremba pracuje w OpenAI do dziś. Organizacja powstała jako non-profit i miała rozwijać sztuczną inteligencję w sposób otwarty, jak sama nazwa wskazuje. Chciano uniezależnić się od największych korporacji – tak, aby badania nad AI służyły przede wszystkim zwykłym ludziom.

W 2018 roku drogi Muska i OpenAI się rozeszły. Wśród przyczyn wymienia się m.in. konflikt interesów – równolegle Tesla rozwijała już swoje konkurencyjne rozwiązania w zakresie AI. Bardzo często Musk zarzuca OpenAI odejście od modelu non-profit. To jednak nie było ostatnie zdanie Muska w branży AI.

W 2023 roku, kiedy niepodzielnie rządził ChatGPT, Elon Musk założył firmę xAI, która skupiła się wyłącznie na rozwoju sztucznej inteligencji. W listopadzie 2023 roku światło dzienne ujrzął Grok. Od początku jest w pełni zintegrowany z platformą X. Do grudnia 2024 roku był dostępny wyłącznie dla użytkowników premium. Na początku stycznia na iOS ukazała się osobna aplikacja – Grok stał się czymś więcej niż tylko dodatkiem do X. Najnowszy model jest jednak dostępny tylko dla

Google DeepMind powstał w 2010 roku, Meta AI w 2013, OpenAI w 2015, Anthropic w 2021, a xAI w 2023. Jak się okazuje, pomimo że najmłodszy, zaraz może namieszać najwięcej z nich wszystkich. Kilkanaście godzin po premierze Grok-3 jest testowany przez entuzjastów technologii. Są już pierwsze wnioski – w benchmarkach wypada najlepiej na rynku.

W czym Grok 3 jest wyjątkowy?

Mając Elona Muska za szefa, nie musimy raczej obawiać się o ograniczenia w finansowaniu technologii do wytrenowania takiego modelu. Tym bardziej, że najbogatszy człowiek świata po prostu lubi być najlepszy i zadziwiać innych. Przełom technologiczny jest, to nie ulega wątpliwości – do wytrenowania Grok 3 użyto 10 razy większej mocy obliczeniowej niż do jego poprzednika. Twórcy chwalą się, że najnowszy model został wytrenowany za pomocą 100 tysięcy kart Nvidia H100. Koszt jednej karty to ok. 30-40 tysięcy dolarów. Zatem na sam sprzęt do trenowania modelu wydano ok. 3-4 miliardy dolarów. Pamiętajmy jeszcze o wydatkach na infrastrukturę, energię i pensje. Najnowszy model xAI jest zatem jednym z najdroższych modeli AI w historii.

Pieniądze to jednak nie wszystko, bo liczą się osiągi. Te Grok 3 ma jednak imponujące. Czy to wystarczy, aby być „the world’s smartest AI”, jak nazywają go twórcy? Całkiem możliwe, w końcu Grok 3 jest uznawany za „reasoning model”, gdzie szczególny nacisk jest kładziony na zdolności rozumowania. Modele te charakteryzują się wyjątkowymi zdolnościami w zakresie nauk ścisłych.

Okazuje się, że rzeczywiście Grok 3 ma się czym pochwalić. W renomowanym teście matematycznym AIME 2025, wersja Reasoning Beta osiągnęła wynik 93%. Dla porównania – wydany niedawno przez OpenAI o3-mini na najwyższych ustawieniach uzyskał 87%. Prześcignął także chińskiego DeepSeek-R1 (75%).

W ogólnym teście modeli językowych LMArena, Grok 3 jako pierwszy przebił barierę 1400 punktów. Na niższych miejscach Gemini 2.0 Flash Thinking Experimental od Google czy ChatGPT-4o.

https://twitter.com/lmarena_ai/status/1891706269003600187/

W programowaniu również radzi sobie bardzo dobrze i pozostawia konkurencję w tyle. W teście LCB, który obejmuje pisanie kodu od podstaw, debugowanie i optymalizację, Grok 3 zdobył 57%. Przepaść? Można tak powiedzieć, bo ChatGPT-4o może pochwalić się wynikiem zaledwie 34%.

Czekamy na odpowiedź

Jeśli myślicie, że to wszystko, co przygotowała dla nas branża AI w najbliższych tygodniach i miesiącach, to grubo się mylicie. Niedawno OpenAI zapowiedziało, że wielkimi krokami zbliża się premiera ChatGPT-4.5, a na horyzoncie widać już także ChatGPT-5.

OpenAI ma jeszcze rozumujący model o3, który może okazać się lepszy od samego Grok 3. Główną jego wadą mają być jednak olbrzymie koszty eksploatacji, które sięgają nawet kilku tysięcy dolarów za jedno zadanie w benchmarku. Na dłuższą metę to jednak ludzi nie obchodzi – po co nam wyniki testów czegoś, z czego nie można i tak skorzystać?

Grok 3 ma być na bieżąco aktualizowany, zatem zachwyci nas jeszcze niejednokrotnie. Z pewnością poznamy oryginalne sposoby na wykorzystanie drzemiących w nich umiejętności. Społeczność AI słynie z ponadprzeciętnej kreatywności.