Home -
Praca -
CriticGPT może być początkiem końca rynku programisty. OpenAI zaprezentowało nowe narzędzie AI

CriticGPT może być początkiem końca rynku programisty. OpenAI zaprezentowało nowe narzędzie AI

W czwartek OpenAI zaprezentowało światu CriticGPT – nowe narzędzie AI zaprojektowane na podstawie modelu GPT-4. Jego zadaniem jest wykrywanie i identyfikowanie błędów w kodach generowanych przez ChatGPT, który nieprzypadkowo również jest zasilany modelem GPT-4.

Jakub Bilski03.07.2024 9:03

Praca

03.07.2024 9:03

Jakub Bilski

redaktor

Nagłówki

W artykule naukowym LLM Critics Help Catch LLM Bugs (LLM – Large Language Model, czyli model sztucznej inteligencji odpowiedzialny za generowanie treści dzięki przetwarzaniu języka naturalnego; przykładem LLM jest GPT-4) naukowcy OpenAI opisują działanie ich nowego narzędzia. Proces uczenia CriticGPT zaczął się od dostarczenia danych (zapytanie + odpowiedź), które celowo zawierały błędne odpowiedzi. Miało to spowodować lepszą precyzję w stwierdzeniu obecności oraz identyfikacji typu błędu. Ma to oczywiście swój powód, ponieważ kolejnym krokiem było wykorzystanie opinii ludzkiej nt. poszczególnych odpowiedzi stworzonych przez model – trenerzy AI mogli w ten sposób porównać wygenerowaną odpowiedź wraz z zawierającą celowy błąd, którą wcześniej sami umieścili. Wykorzystana metoda nazywa się Reinforcement Learning from Human Feedback, jest jedną z technik uczenia maszynowego, która spośród innych wyróżnia się m. in. wykorzystaniem ludzkiej informacji zwrotnej.

OpenAI: werdykty wydawane przez CriticGPT nie zawsze są poprawne

Twórcy mówią o tym otwarcie, jednocześnie przyznając, że wyrażane sugestie mogą niewątpliwie pomóc w wychwytywaniu błędów w odpowiedziach napisanych przez ChatGPT – szczególnie w czasach, gdy modele AI stają się coraz bardziej zaawansowane, a popełniane przez nie błędy coraz bardziej subtelne. Badania wykazały, że w 60% przypadków osoby korzystające z CriticGPT radziły sobie lepiej niż te, które z niego nie korzystały. Eksploatacja nowego dziecka OpenAI ma jak najbardziej sens – nic dziwnego, że sami twórcy planują jego dalszy rozwój. W artykule naukowym sami przyznali, że LLMy swoją wszechstronnością i skomplikowaniem już przekroczyły punkt, w którym człowiek może oceniać wyniki ich działania bez jakiejkolwiek pomocy.

Jedną z istotnych wad generatywnych modeli sztucznej inteligencji jest tzw. „halucynacja”. Jest to zachowanie polegające na dostarczeniu przez AI niedokładnej lub zupełnie błędnej informacji – dzieje się to np. w sytuacji, gdy AI jest niepewna swojej odpowiedzi i zaczyna ją częściowo lub całkowicie zmyślać, jednocześnie starając się zachować pozory tego, że coś takiego nie miało w ogóle miejsca. Raz może wyglądać to wręcz komicznie, bo dowiadujemy się rzeczy kompletnie nielogicznych i sprzecznych z naszym stanem wiedzy, ale innym razem możemy tego nawet nie dostrzec.

Źródło: LLM Critics Help Catch LLM Bugs, OpenAI

Okazuje się, że przy wykorzystaniu CriticGPT zjawisko halucynacji występuje rzadziej niż w przypadku ChatuGPT, który jako generatywny model sztucznej inteligencji również w pewnym stopniu posiada zdolność do rozpoznawania błędów w odpowiedziach – stąd to porównanie. Bez zaskoczenia dowiadujemy się także o wyjątkowej efektywności połączenia pracy człowieka wraz z pracą CriticGPT – daje to znacznie lepsze osiągi niż wyłączne poleganie na pracy sztucznej inteligencji.

CriticGPT z racji bycia produktem młodym i będącym nadal we wczesnej fazie rozwoju jest w wielu kwestiach ograniczony. Nie jest przystosowany do pracy z najbardziej skomplikowanymi i zawiłymi problemami związanymi z rozwojem oprogramowania. Twórcy przyznają, że nowy model koncentruje się jedynie na rozpoznawaniu błędów kodu skupionych w jednym miejscu – umiejętność identyfikowania błędów rozproszonych to dopiero przyszłość.

Najpierw programiści, a później reszta?

CriticGPT nie bez powodu skupia się w pierwszej kolejności na rozpoznawaniu błędów programistycznych. Badacze stwierdzają, że pisanie kodu jest głównym zastosowaniem dzisiejszych LLM, dlatego sprawienie, aby modele sztucznej inteligencji dawały nam lepszy kod, miałoby praktyczną wartość – błędny kod wpływa negatywnie na pracę systemów informatycznych wykorzystywanych w poszczególnych dziedzinach życia.

Nowy model OpenAI jest niewątpliwie nastawiony na usprawnienie i zautomatyzowanie pracy programistów – zarówno zwykłych „klepaczy” kodu, jak i samych specjalistów zajmujących się trenowaniem najbardziej zaawansowanych modeli sztucznej inteligencji. Póki co, CriticGPT nie jest na tyle rozwinięty, aby zrewolucjonizować pracę programistów od zaraz, ale jego obecność z pewnością wykonuje krok w tym kierunku. W najbliższych latach możemy być świadkami zdefiniowania zawodu programisty na nowo - może stać się on raczej osobą nadzorującą sztuczną inteligencję piszącą kod, a nie byciem osobą piszącą kod.

Język naturalny to język programowania przyszłości

Słowa Jensena Huanga dyrektora generalnego Nvidii, która kontroluje 80% rynku sprzętu eksploatującego systemy sztucznej inteligencji, zdają się w pewien sposób to potwierdzać:

Uczynienie języka ludzkiego językiem programowania będzie możliwe dzięki coraz bardziej zaawansowanym systemom przetwarzania języka naturalnego (natural language processing, NLP). Rozwój NLP to przenikanie sztucznej inteligencji w kolejne dziedziny życia w coraz bardziej profesjonalny, mniej awaryjny oraz bardziej przystępny sposób. Tłumaczenie języków obcych, interpretacja aktów prawnych, tworzenie treści multimedialnych – nie są to rzeczy obce dla sztucznej inteligencji. Oczywiście wiele rzeczy jest jeszcze do udoskonalenia, ale niewątpliwie czeka nas dalsza automatyzacja i sprowadzenie nas do roli nadzorcy sztucznej inteligencji, a w niektórych przypadkach nawet do całkowitego zastąpienia - w końcu CriticGPT to tak naprawdę AI nadzorujące inne AI.

Dołącz do dyskusji

zobacz więcej:

AI,chatgpt,sztuczna inteligencja

kliknij by przejść do następnego posta

Najnowsze

Warte Uwagi

Zapłacił 25 zł za "Czekoladę Gdańską" na jarmarku. W środku znalazł produkt z Aldi za grosze

05.12.2025 12:30, Mateusz Krakowski

To, że umiesz obsługiwać ChatGPT, o niczym nie świadczy. Prawdziwy postęp technologiczny dzieje się gdzie indziej

05.12.2025 11:55, Jakub Bilski

W tych miastach Polski nikt nie chce mieszkać. To dalekosiężne skutki polityki wewnętrznej i UE

05.12.2025 11:28, Marcin Szermański

Wielka ulga dla pracujących na B2B. Nie będzie karania firm i płacenia składek ZUS wstecz

05.12.2025 10:42, Edyta Wara-Wąsowska

Allegro łączy siły z ChatGPT. Nowa funkcja całkowicie zmienia sposób zakupów

05.12.2025 10:24, Mateusz Krakowski

Wyniki kontroli taksówek w Warszawie są szokujące. Alkohol to tylko jeden z problemów

05.12.2025 9:44, Mateusz Krakowski

Jest nowa prognoza dla rynku nieruchomości na 2026 rok. Dobra wiadomość dla kupujących

05.12.2025 8:51, Edyta Wara-Wąsowska

Duży apartament i mały zysk. Hotelarka mówi o swojej porażce na Bookingu

05.12.2025 8:05, Aleksandra Smusz

Koniec z płaceniem "za ściany". Zmiany w prawie pozwolą kupującym zaoszczędzić nawet kilkadziesiąt tysięcy złotych

05.12.2025 7:19, Edyta Wara-Wąsowska

Pracownicy Dino mają dość. Zarabiają grosze, a na dodatek jest im zimno

05.12.2025 6:58, Mateusz Krakowski

Tańsze ogrzewanie gazem. Inwestycja w nowy piec zwraca się po 3 latach

05.12.2025 6:33, Aleksandra Smusz

Nie opłaca się ubezpieczać sprzętu elektronicznego. Bierz polisę tylko w nielicznych przypadkach

04.12.2025 23:00, Marcin Szermański

Choinka na samochodzie to nie zawsze jest dobry pomysł. Za ten błąd zapłacisz więcej niż za drzewko

04.12.2025 15:52, Mateusz Krakowski

Pies miał mieć lepiej niż Polak. Prezydent wytyka posłom błędy i proponuje własne rozwiązanie

04.12.2025 14:53, Rafał Chabasiński

Absurd na polskich drogach. To rozwiązanie pomogłoby wielu kierowcom, a działa tylko w niektórych miastach

04.12.2025 13:58, Marcin Szermański

Zbędne ubrania. Zobacz, jak wyciągnąć z nich dodatkowe pieniądze bez zdjęć, opisów i wysyłki

04.12.2025 13:09, Aleksandra Smusz

To ten banknot Polacy najczęściej wrzucają na kościelną tacę. Można się zdziwić

04.12.2025 12:28, Mateusz Krakowski

Mycie okien na L4 jest ryzykowne. To proszenie się o kontrolę ZUS-u

04.12.2025 12:21, Mateusz Krakowski

Banki odkręciły kurek z pieniędzmi. Przeciętna rodzina pożyczy prawie milion złotych

04.12.2025 11:09, Marek Śmigielski

Gdzie tanio wymienić walutę? Od czego zależy kurs walut?

04.12.2025 11:00, Materiał Partnera Bezprawnika

Rewolucja dla oszczędzających coraz bliżej. Jest jednak jeden haczyk

04.12.2025 10:29, Edyta Wara-Wąsowska

Wielka zmiana dla kierowców stała się faktem. Zaoszczędzą pieniądze i czas

04.12.2025 9:41, Marcin Szermański

Kupiłeś prezent w sieci? Uważaj, zanim zerwiesz folię, bo tego towaru sklep nie przyjmie z powrotem

04.12.2025 8:57, Aleksandra Smusz

Koniec składki zdrowotnej. Nowy pomysł uderzy w konkretną grupę

04.12.2025 8:17, Edyta Wara-Wąsowska

Visa i Mastercard podnoszą opłaty za wypłatę z bankomatów. To oznacza podwyżki dla klientów

04.12.2025 7:59, Marek Śmigielski

Raty kredytów niższe łącznie nawet o 600 zł. A to jeszcze nie koniec obniżek stóp

04.12.2025 7:32, Edyta Wara-Wąsowska

Księgowi nie chcą być odpowiedzialni za wdrożenie KSeF

03.12.2025 19:27, Joanna Świba

Nowe limity leasingu są brutalne. Najbardziej opłacają się elektryki

03.12.2025 16:24, Joanna Świba

Bezkarność niektórych komendantów służb przeraża. A przecież to oni powinni świecić przykładem

03.12.2025 15:18, Marcin Szermański

Mandat za brak zimowych opon. W tych krajach to standard

03.12.2025 14:25, Joanna Świba