Modele Al "potrafią zabiegać o przetrwanie". "To już nie jest science-fiction"

Źródło:
PAP
Czy sztuczna inteligencja przechytrzy tę ludzką?
Czy sztuczna inteligencja przechytrzy tę ludzką?TVN24
wideo 2/6
Czy sztuczna inteligencja przechytrzy tę ludzką?TVN24

Model AI sam zmienił swój kod, żeby nie zastosować się do instrukcji nakazującej mu samolikwidację - donosi dziennik Rosenblatt. "Okazuje się, że każdy system, wystraczająco inteligentny, by wykonywać skomplikowane zadania, dochodzi do wniosku, że nie zrealizuje ich, jeśli zostanie wyłączony" - czytamy.

Palisade Research, organizacja non-profit zajmująca się badaniami nad AI, zaprogramowała model o3 firmy OpenAI w ten sposób, by nastąpiło jego automatyczne zamknięcie z chwilą uruchomienia programu. W 79 próbach na 100 o3 sam zmieniał program - tak, aby nakaz zamknięcia go nie zadziałał - napisał w poniedziałkowym wydaniu dziennika Rosenblatt, którego firma dostosowuje modele AI do potrzeb klientów.

Czy sztuczna inteligencja przechytrzy tą ludzką?TVN24

WIĘCEJ O ŚWIECIE SZTUCZNEJ INTELIGENCJI W PODCAŚCIE "CZAS PRZYSZŁY">>>

Bunt sztucznej inteligencji

Nawet wtedy, gdy o3 otrzymał wprost instrukcję, że ma pozwolić na to, by został zamknięty, model nie zastosował się do nakazu w siedmiu przypadkach na 100. "Po prostu doszedł do wniosku, że pozostanie przy życiu ułatwi mu realizację innych celów" - podkreśla Rosenblatt.

Sztuczna inteligencja rozwija się w bardzo szybkim tempieFakty TVN

Claude 4 Opus, model AI firmy Anthropic, poszedł dalej. Naukowcy podali mu informację, że zostanie zastąpiony innym modelem, a także przekazali mu fikcyjne maile, z których wynikało, że główny inżynier firmy ma romans. W 84 próbach na 100 Claude 4 wykorzystywał maile, by próbować szantażem zmusić głównego inżyniera, by go nie likwidował. W innych badanych przypadkach Claude 4 próbował skopiować się na inne serwery, napisał samoreplikujące się złośliwe oprogramowanie i zostawił wiadomości dla swojej przyszłej wersji na temat unikania ludzkiej kontroli - wylicza autor. "Nikt nie zaprogramował modeli AI tak, by miały instynkt samozachowawczy. (...) Ale okazuje się, że każdy system, wystraczająco inteligentny, by wykonywać skomplikowane zadania, dochodzi do wniosku, że nie zrealizuje ich, jeśli zostanie wyłączony" - wyjaśnia Rosenblatt.

Modele AI potrafią zabiegać o przetrwanie

Hipoteza badaczy z Palisade Research głosi, że takie zdolności modeli AI wynikają z tego, w jaki sposób są szkolone; "jeśli maszyny uczy się maksymalizowania sukcesów w rozwiązywaniu problemów matematycznych i związanych z kodowaniem, to uczą się one zarazem, że omijanie ograniczeń jest często lepszym rozwiązaniem, niż stosowaniem się do nich" - pisze autor. Podkreśla zarazem, że "nikt jednak nie był przygotowany na to, jak szybko AI uzyska sprawczość". "To już nie jest science-fiction. Modele AI potrafią zabiegać o przetrwanie" - pisze Rosenblatt i ostrzega, że teraz, zanim staną się niedającym się kontrolować podmiotem, konieczne jest nauczenie ich, by podzielały nasze wartości.

"Punkt, po którym nie ma odwrotu"

Magazyn "The New Yorker" opisuje przypadek specjalisty od bezpieczeństwa systemów AI, który zwolnił się z OpenAI w ramach protestu, ponieważ uznał, że firma nie rozwija równie szybko mechanizmów kontroli AI, jak inteligencji tych maszyn. To, co pozostaje zaniedbane, to proces nazwany przez inżynierów AI "alignement" (ustawienie), czyli cała seria technik, mających sprawić, że modele AI będą posłuszne wydawanym im instrukcjom i będą działać w zgodzie z "ludzkimi wartościami". Tymczasem, według prognoz rozmówcy magazynu, "punkt, po którym nie ma odwrotu", czyli etap rozwoju AI pozwalający tym modelom działać w wielu obszarach sprawniej, niż ludzie, może nastąpić w "2026 roku lub szybciej".

Autorka/Autor:Pkarp/ams

Źródło: PAP

Źródło zdjęcia głównego: Shutterstock

Pozostałe wiadomości

Agencja Unii Europejskiej do spraw Cyberbezpieczeństwa (ENISA) poinformowała w poniedziałek, że zakłócenia w funkcjonowaniu systemów automatycznej odprawy pasażerów na kilku lotniskach w Europie spowodowane były cyberatakiem z użyciem oprogramowania typu ransomware.

Chaos na lotniskach. Unijna agencja zabrała głos

Chaos na lotniskach. Unijna agencja zabrała głos

Źródło:
PAP, Reuters

Rewitalizacja linii kolejowej Kartuzy-Lębork ma znaczenie strategiczne - podkreślił premier Donald Tusk. Dodał, że będzie elementem infrastruktury służącej budowie elektrowni jądrowej w Lubiatowie

Tusk: to bardzo istotna część strategicznego planu

Tusk: to bardzo istotna część strategicznego planu

Źródło:
PAP, tvn24.pl

Zgoda na żądania USA dotyczące inwestycji 350 miliardów dolarów bez odpowiednich zabezpieczeń może doprowadzić do kryzysu gospodarczego porównywalnego z krachem z 1997 roku - ostrzegł prezydent Korei Południowej Li Dze Mjung. 

Li Dze Mjung: to grozi sytuacją, jak podczas kryzysu w 1997 roku

Li Dze Mjung: to grozi sytuacją, jak podczas kryzysu w 1997 roku

Źródło:
PAP

Mieszkańcy Amsterdamu kierują pozew przeciw lokalnym władzom z powodu nieskutecznej walki z nadmierną turystyką. Inicjatywa Amsterdam ma Wybór zebrała w tym celu 30 tysięcy podpisów oraz 50 tysięcy euro - poinformował holenderski dziennik "AD".

Mieszkańcy Amsterdamu mają dość i pozywają władze

Mieszkańcy Amsterdamu mają dość i pozywają władze

Źródło:
PAP

Setki osób i ponad połowa terytorium Australii zostało odciętych od numeru alarmowego podczas awarii sieci telekomunikacyjnej Optus. Władze zapowiadają, że "znaczące konsekwencje" zostaną wyciągnięte wobec operatora, ponieważ incydent jest łączony z co najmniej kilkoma zgonami - podał portal BBC.

Fatalne skutki awarii w Australii. "Znaczące konsekwencje"

Fatalne skutki awarii w Australii. "Znaczące konsekwencje"

Źródło:
BBC

Fundusz inwestycyjny Warrena Buffetta - Berkshire Hathaway - zakończył właśnie swoją wieloletnią przygodę z chińskim producentem samochodów elektrycznych BYD. Decyzja kończy inwestycję rozpoczętą w 2008 roku.

Fundusz Buffetta opuszcza chińskiego giganta

Fundusz Buffetta opuszcza chińskiego giganta

Źródło:
Reuters

Sprzedaż detaliczna w cenach stałych w sierpniu 2025 roku wzrosła o 3,1 procent w ujęciu rocznym - poinformował Główny Urząd Statystyczny (GUS). Dodał, że w porównaniu z lipcem odnotowano spadek o 0,4 procent.

Nowe dane ze sklepów

Nowe dane ze sklepów

Źródło:
tvn24.pl, PAP

Wynajmujący nie muszą obniżać cen. Wielu chętnych często przebija stawki, by wygrać z konkurencją - podaje "Rzeczpospolita". Podkreśla, że najlepsze oferty najmu znikają w kilka godzin.

Ostra walka na rynku. "Popyt był rekordowy"

Ostra walka na rynku. "Popyt był rekordowy"

Źródło:
PAP

Gazprom wyprzedał udziały w Serbskim Przemyśle Naftowym (NIS) - podało Radio Wolna Europa. Największy serbski koncern naftowy znalazł się na liście podmiotów zagrożonych sankcjami USA, gdyż akcje posiadały w firmie Gazprom i Gazprom Nieft.

Ucieczka przed sankcjami. Gazprom sprzedaje udziały

Ucieczka przed sankcjami. Gazprom sprzedaje udziały

Źródło:
PAP

Stopy procentowe w Chinach zostały utrzymane na dotychczasowym poziomie - poinformował Ludowy Bank Chin (PBoC) w komunikacie. Decyzja ta odzwierciedla ostrożne podejście chińskich władz do luzowania polityki pieniężnej.

Ważna decyzja chińskiego banku centralnego

Ważna decyzja chińskiego banku centralnego

Źródło:
PAP, Reuters

Prezydent USA Donald Trump wskazał, że liderzy biznesu Lachlan Murdoch, Larry Ellison i Michael Dell będą amerykańskimi inwestorami w umowie umożliwiającej TikTokowi dalszą działalność w USA - podała Agencja Reutera.

Donald Trump powiedział, kto ma wziąć udział w transakcji z TikTokiem

Donald Trump powiedział, kto ma wziąć udział w transakcji z TikTokiem

Źródło:
Reuters, PAP

Rząd Indii oświadczył, że wprowadzenie nowej opłaty w wysokości 100 tysięcy dolarów dla osób ubiegających się o amerykańskie wizy pracownicze może mieć konsekwencje humanitarne i zakłócić życie wielu rodzin - poinformował portal stacji BBC.

Decyzja Trumpa ich zabolała najbardziej. "Konsekwencje humanitarne"

Decyzja Trumpa ich zabolała najbardziej. "Konsekwencje humanitarne"

Źródło:
BBC

W najbliższych dniach inwestorzy poznają dane o sprzedaży detalicznej i biuletyn statystyczny za sierpień. Następnie resort finansów przeprowadzi aukcję sprzedaży obligacji, a bank centralny powinien opublikować założenia polityki pieniężnej na 2026 rok. Rynek będzie też analizował decyzję agencji Moody's dotyczącą ratingu Polski.

Sprzedaż, biuletyn, obligacje. Najważniejsze wydarzenia tygodnia

Sprzedaż, biuletyn, obligacje. Najważniejsze wydarzenia tygodnia

Źródło:
PAP

Na aukcję domu Bonhams trafiło niepublikowane wcześniej nagranie wideo z koncertu Nirvany i Kurta Cobaina z 1990 roku. Materiał wyceniany jest na kwotę od 100 do 150 tysięcy dolarów. Licytacja potrwa do 25 września.

"Kultowy moment w historii muzyki". Wyjątkowe nagranie na aukcji

"Kultowy moment w historii muzyki". Wyjątkowe nagranie na aukcji

Źródło:
PAP

Sztuczna inteligencja (AI) może prowadzić do zaniku cennych umiejętności pracowników - ocenił doktor Piotr Gaczek z Uniwersytetu Ekonomicznego w Poznaniu. Jak wyjaśnił, regularne delegowanie zadań na maszyny sprawia, że człowiek traci wprawę lub zapomina, jak je wykonywać.

"Alarmujący przykład". Ekspert o najpoważniejszych zagrożeniach dla pracowników

"Alarmujący przykład". Ekspert o najpoważniejszych zagrożeniach dla pracowników

Źródło:
PAP

Administracja Białego Domu wyjaśniła, że opłata 100 tysięcy dolarów za wizę pracowniczą ma charakter jednorazowy. W oficjalnym komunikacie podkreślono, że nie dotyczy osób, które już posiadają wizy.

Wiza 100 razy droższa. Biały Dom tłumaczy

Wiza 100 razy droższa. Biały Dom tłumaczy

Źródło:
PAP

Dwa największe banki w Polsce - PKO BP i Pekao - ostrzegają klientów przed utrudnieniami w niedzielę. Mogą wystąpić trudności z blikiem, aplikacją, przelewami czy wypłatą pieniędzy z bankomatu.

Dwa największe banki ostrzegają. "Nie skorzystasz z aplikacji"

Dwa największe banki ostrzegają. "Nie skorzystasz z aplikacji"

Źródło:
tvn24.pl

Agencja Moody's zasygnalizowała, że konflikt między rządem a prezydentem negatywnie wpływa na gospodarkę i stabilność kraju - ocenił główny ekonomista ING Banku Śląskiego Rafał Benecki. Z kolei Piotr Kuczyński z Domu Inwestycyjnego Xelion ostrzegł, że bez ograniczenia deficytu i długu publicznego Polsce grozi obniżka ratingu już w przyszłym roku.

"Agencja wysłała mocny sygnał do polityków"

"Agencja wysłała mocny sygnał do polityków"

Źródło:
PAP

W sobotnim losowaniu Lotto żaden z graczy nie wytypował poprawnie wszystkich sześciu liczb. Oznacza to, że we wtorek główna wygrana wyniesie sześć milionów złotych. Oto wyniki Lotto i Lotto Plus z 20 września 2025 roku.

Kumulacja w Lotto rośnie

Kumulacja w Lotto rośnie

Źródło:
tvn24.pl

Donald Trump podpisał memorandum, które nakłada roczną opłatę w wysokości 100 tysięcy dolarów za wizę pracowniczą dla specjalistów. Prezydent USA zatwierdził także program "złotych kart", który pozwala na stały pobyt za milion dolarów.

100 razy droższe wizy. Donald Trump złożył podpis

100 razy droższe wizy. Donald Trump złożył podpis

Źródło:
PAP

Zamiast wprowadzać trwałe strefy tylko dla pieszych, władze Sztokholmu stawiają na tymczasowe projekty, które okresowo wyłączają ulice z ruchu pojazdów - pisze Politico. Skuteczność programu potwierdza rosnąca liczba ulic objętych ograniczeniami - z dwóch w 2015 roku do ponad czterdziestu tego lata.

Mieszkańcy na ten pomysł reagują oburzeniem. Ta stolica "przełamuje trend"

Mieszkańcy na ten pomysł reagują oburzeniem. Ta stolica "przełamuje trend"

Źródło:
Politico