Modele Al "potrafią zabiegać o przetrwanie". "To już nie jest science-fiction"

Źródło:
PAP
Czy sztuczna inteligencja przechytrzy tę ludzką?
Czy sztuczna inteligencja przechytrzy tę ludzką?TVN24
wideo 2/6
Czy sztuczna inteligencja przechytrzy tę ludzką?TVN24

Model AI sam zmienił swój kod, żeby nie zastosować się do instrukcji nakazującej mu samolikwidację - donosi dziennik Rosenblatt. "Okazuje się, że każdy system, wystraczająco inteligentny, by wykonywać skomplikowane zadania, dochodzi do wniosku, że nie zrealizuje ich, jeśli zostanie wyłączony" - czytamy.

Palisade Research, organizacja non-profit zajmująca się badaniami nad AI, zaprogramowała model o3 firmy OpenAI w ten sposób, by nastąpiło jego automatyczne zamknięcie z chwilą uruchomienia programu. W 79 próbach na 100 o3 sam zmieniał program - tak, aby nakaz zamknięcia go nie zadziałał - napisał w poniedziałkowym wydaniu dziennika Rosenblatt, którego firma dostosowuje modele AI do potrzeb klientów.

Czy sztuczna inteligencja przechytrzy tą ludzką?TVN24

WIĘCEJ O ŚWIECIE SZTUCZNEJ INTELIGENCJI W PODCAŚCIE "CZAS PRZYSZŁY">>>

Bunt sztucznej inteligencji

Nawet wtedy, gdy o3 otrzymał wprost instrukcję, że ma pozwolić na to, by został zamknięty, model nie zastosował się do nakazu w siedmiu przypadkach na 100. "Po prostu doszedł do wniosku, że pozostanie przy życiu ułatwi mu realizację innych celów" - podkreśla Rosenblatt.

Sztuczna inteligencja rozwija się w bardzo szybkim tempieFakty TVN

Claude 4 Opus, model AI firmy Anthropic, poszedł dalej. Naukowcy podali mu informację, że zostanie zastąpiony innym modelem, a także przekazali mu fikcyjne maile, z których wynikało, że główny inżynier firmy ma romans. W 84 próbach na 100 Claude 4 wykorzystywał maile, by próbować szantażem zmusić głównego inżyniera, by go nie likwidował. W innych badanych przypadkach Claude 4 próbował skopiować się na inne serwery, napisał samoreplikujące się złośliwe oprogramowanie i zostawił wiadomości dla swojej przyszłej wersji na temat unikania ludzkiej kontroli - wylicza autor. "Nikt nie zaprogramował modeli AI tak, by miały instynkt samozachowawczy. (...) Ale okazuje się, że każdy system, wystraczająco inteligentny, by wykonywać skomplikowane zadania, dochodzi do wniosku, że nie zrealizuje ich, jeśli zostanie wyłączony" - wyjaśnia Rosenblatt.

Modele AI potrafią zabiegać o przetrwanie

Hipoteza badaczy z Palisade Research głosi, że takie zdolności modeli AI wynikają z tego, w jaki sposób są szkolone; "jeśli maszyny uczy się maksymalizowania sukcesów w rozwiązywaniu problemów matematycznych i związanych z kodowaniem, to uczą się one zarazem, że omijanie ograniczeń jest często lepszym rozwiązaniem, niż stosowaniem się do nich" - pisze autor. Podkreśla zarazem, że "nikt jednak nie był przygotowany na to, jak szybko AI uzyska sprawczość". "To już nie jest science-fiction. Modele AI potrafią zabiegać o przetrwanie" - pisze Rosenblatt i ostrzega, że teraz, zanim staną się niedającym się kontrolować podmiotem, konieczne jest nauczenie ich, by podzielały nasze wartości.

"Punkt, po którym nie ma odwrotu"

Magazyn "The New Yorker" opisuje przypadek specjalisty od bezpieczeństwa systemów AI, który zwolnił się z OpenAI w ramach protestu, ponieważ uznał, że firma nie rozwija równie szybko mechanizmów kontroli AI, jak inteligencji tych maszyn. To, co pozostaje zaniedbane, to proces nazwany przez inżynierów AI "alignement" (ustawienie), czyli cała seria technik, mających sprawić, że modele AI będą posłuszne wydawanym im instrukcjom i będą działać w zgodzie z "ludzkimi wartościami". Tymczasem, według prognoz rozmówcy magazynu, "punkt, po którym nie ma odwrotu", czyli etap rozwoju AI pozwalający tym modelom działać w wielu obszarach sprawniej, niż ludzie, może nastąpić w "2026 roku lub szybciej".

Autorka/Autor:Pkarp/ams

Źródło: PAP

Źródło zdjęcia głównego: Shutterstock

Pozostałe wiadomości

Administracja Donalda Trumpa ogłosiła ponad 90-procentowe cła na chiński grafit wykorzystywany do produkcji akumulatorów. Jak wskazał CNN, wyższe stawki celne zwiększą koszty produkcji samochodów w USA, choć w dłuższej perspektywie mogą wspomóc rozwój krajowych producentów.

Trump podbija stawkę Bidena. "To bardzo zmieni sytuację"

Trump podbija stawkę Bidena. "To bardzo zmieni sytuację"

Źródło:
CNN

W maju 2025 roku ceny czekolady w Unii Europejskiej wzrosły średnio o 21,1 procent rok do roku - podał urząd statystyczny Eurostat. Wskazał też, że największy skok w UE odnotowano w Polsce.

Ten produkt zdrożał w Polsce najbardziej w Europie

Ten produkt zdrożał w Polsce najbardziej w Europie

Źródło:
tvn24.pl, PAP, "Wall Street Journal"

Na początku lipca sprzedaż mieszkań w siedmiu największych miastach przewyższyła średnią z ostatnich lat - wynika z raportu Otodom. Zdaniem ekspertów wyższy popyt na rynku pierwotnym jest tylko anomalią, którą wywołała ostatnia decyzja Rady Polityki Pieniężnej.

Anomalia na rynku. "Przez kilka miesięcy będzie na huśtawce"

Anomalia na rynku. "Przez kilka miesięcy będzie na huśtawce"

Źródło:
PAP

Sieć Action wycofała ze sprzedaży chipsy Lay's, lalkę Cupcake oraz zegarek My Time. Firma apeluje w komunikatach, by nie spożywać lub nie korzystać z produktów i by zwrócić je w najbliższym sklepie.

Znana sieć wycofała trzy produkty

Znana sieć wycofała trzy produkty

Źródło:
tvn24.pl

Wywiad wojskowy Ukrainy (HUR) przeprowadził cyberatak na systemy rosyjskiego koncernu gazowego Gazprom - podał ukraiński portal Ukrinform, przy czym powołał się na źródło w HUR.

Media: wywiad przeprowadził cyberatak na Gazprom

Media: wywiad przeprowadził cyberatak na Gazprom

Źródło:
PAP

Diesel nadal będzie drożeć o kilka groszy na litrze, a ceny benzyny i autogazu będą stabilne - tak ma wyglądać sytuacja na stacjach w przyszłym tygodniu według analityków Refleksu. Z kolei zdaniem portalu e-petrol.pl nie ma perspektyw na obniżkę cen paliw.

"Brak głębokich korekt". To wpływa na ceny na stacjach

"Brak głębokich korekt". To wpływa na ceny na stacjach

Źródło:
PAP

Wielka Brytania ogłosiła nałożenie sankcji zarówno na trzy jednostki Sztabu Generalnego Sił Zbrojnych Federacji Rosyjskiej (GRU), jak i oficerów tej instytucji. Polskie Ministerstwo Spraw Zagranicznych wydało komunikat w związku z działaniami Londynu.

MSZ: Polska wyraża solidarność z Wielką Brytanią

MSZ: Polska wyraża solidarność z Wielką Brytanią

Źródło:
PAP

W piątkowym losowaniu Eurojackpot nie odnotowano głównej wygranej, a kumulacja rośnie do 420 milionów złotych. W Polsce najwyższe byłe wygrane czwartego stopnia. Oto liczby, które wylosowano 18 lipca 2025 roku.

Potężna kumulacja w Eurojackpot

Potężna kumulacja w Eurojackpot

Źródło:
tvn24.pl

24 lipca Stały Komitet Rady Ministrów ma zająć się projektem tak zwanej ustawy frankowej - wynika z porządku obrad SKRM. Nowe regulacje mają wejść w życie jeszcze w tym roku.

Rząd zajmie się projektem ustawy frankowej

Rząd zajmie się projektem ustawy frankowej

Źródło:
PAP

"Indie nie popierają jednostronnych sankcji" - podkreślił rzecznik indyjskiego resortu spraw zagranicznych Randhir Jaiswal. W ten sposób odniósł się do sankcji nałożonych przez Unię Europejską na Rosję, które obejmują największą rafinerię ropy rosyjskiego koncernu Rosnieft w indyjskim stanie Gudźarat.

Reakcja na ruch Unii Europejskiej. "Nie popierają jednostronnych sankcji"

Reakcja na ruch Unii Europejskiej. "Nie popierają jednostronnych sankcji"

Źródło:
PAP

PKO BP, Santander, ING Bank Śląski, mBank i BNP Paribas - klienci tych instytucji finansowych muszą liczyć się z utrudnieniami w najbliższych dniach. Mogą wystąpić problemy z serwisem internetowym, aplikacją czy płatnościami.

Największy bank ostrzega. "Utrudnienia w dostępie do usług"

Największy bank ostrzega. "Utrudnienia w dostępie do usług"

Źródło:
tvn24.pl

W porównaniu do minionego roku większość owoców była w czerwcu wyraźnie droższa - mówi TVN24+ Kamil Łuczkowski, ekonomista z zespołu analiz makroekonomicznych Banku Pekao. Królem wzrostu cen okazały się jabłka. - Inaczej kształtowała się sytuacja na rynku warzyw. Tu Główny Urząd Statystyczny odnotował spadek cen detalicznych - mówi z kolei Mariusz Dziwulski, analityk rynku rolno-spożywczego w PKO BP. Jednak, jak zaznacza, są wyjątki. Ceny kapusty w hurcie wzrosły w skali roku o ponad połowę.

Król i królowa wzrostu cen

Król i królowa wzrostu cen

Źródło:
TVN24+

Policja przeprowadziła przeszukanie w rezydencji i w siedzibie partii Jaira Bolsonaro. Były prezydent Brazylii jest oskarżony o przygotowywanie zamachu stanu. Sąd nakazał mu noszenie elektronicznej bransoletki i zabronił używania mediów społecznościowych.

Przeszukanie w rezydencji i siedzibie partii byłego prezydenta

Przeszukanie w rezydencji i siedzibie partii byłego prezydenta

Źródło:
PAP, CNN

Wielka Brytania nałożyła nowe sankcje na ponad 20 rosyjskich szpiegów, hakerów i jednostki wywiadu. Chodzi o osoby i podmioty oskarżone o operacje cybernetyczne zagrażające stabilności Europy - wskazał brytyjski rząd w oświadczeniu.

"Szpiedzy GRU prowadzą kampanię mającą na celu destabilizację Europy"

"Szpiedzy GRU prowadzą kampanię mającą na celu destabilizację Europy"

Źródło:
PAP

Wielki sukces polskiego programisty. Przemysław Dębiak zajął pierwsze miejsce w prestiżowych zawodach AtCoder World Tour Finals 2025, pokonując nie tylko wszystkich pozostałych zawodników, ale też sztuczną inteligencję.

Polak lepszy od sztucznej inteligencji. Osobiste gratulacje od szefa OpenAI

Polak lepszy od sztucznej inteligencji. Osobiste gratulacje od szefa OpenAI

Źródło:
tvn24.pl

Od 14 sierpnia przyjmowane będą wnioski od firm i instytucji, które chcą uczestniczyć w prowadzonym przez resort pracy pilotażu skróconego czasu pracy. To pierwszy taki program w tej części Europy i pierwszy na tak szeroką skalę w Polsce – wskazała ministra rodziny, pracy i polityki społecznej Agnieszka Dziemianowicz-Bąk.

Krócej w pracy. "Wielki, pierwszy w tej części Europy, pilotaż"

Krócej w pracy. "Wielki, pierwszy w tej części Europy, pilotaż"

Źródło:
PAP

Bat Indiany Jonesa został sprzedany za 525 tysięcy dolarów na trwającej przez tydzień aukcji firmy Heritage Auctions. Harrison Ford posługiwał się słynnym rekwizytem w filmie "Indiana Jones i ostatnia krucjata" z 1989 roku.

Bat Indiany Jonesa sprzedany na aukcji

Bat Indiany Jonesa sprzedany na aukcji

Źródło:
PAP

W projekcie budżetu opracowanym przez Komisję Europejską przewidziano dla Polski ponad 123 miliardy euro, między innymi na politykę spójności i rolnictwo - wynika z zestawienia opublikowanego przez Komisję Europejską w nocy z czwartku na piątek. Jest to wstępna propozycja budżetu, nad którą będą w kolejnych miesiącach pracować państwa członkowskie.

Ogromne pieniądze dla Polski

Ogromne pieniądze dla Polski

Źródło:
PAP

Wizz Air uruchomi 11 tras z lotniska Warszawa-Modlin, przeniesie też do Modlina dwa samoloty - poinformowała w piątek węgierska linia lotnicza. Wizz Air przestał operować z Modlina pod koniec 2012 roku.

Wizz Air wraca do Modlina. Znamy trasy

Wizz Air wraca do Modlina. Znamy trasy

Źródło:
PAP, tvn24.pl

Należący do koncernu Meta popularny komunikator WhatsApp powinien przygotować się do wycofania z rynku rosyjskiego - oświadczył Anton Goriełkin, wiceprzewodniczący komisji do spraw technologii informatycznych Dumy Państwowej, niższej izby rosyjskiego parlamentu.

Rosja chce się go pozbyć. "Należy do ekstremistycznej organizacji"

Rosja chce się go pozbyć. "Należy do ekstremistycznej organizacji"

Źródło:
PAP

Bezpośrednie połączenie PKP Intercity do Chorwacji cieszy się sporym powodzeniem. Jak poinformował minister infrastruktury Dariusz Klimczak, do końca wakacji sprzedało się około 11 tysięcy biletów na ten pociąg. A co z połączeniami do Włoch czy Austrii?

Prawie wszystkie bilety sprzedane. Minister wyjaśnia

Prawie wszystkie bilety sprzedane. Minister wyjaśnia

Źródło:
PAP