Modele Al "potrafią zabiegać o przetrwanie". "To już nie jest science-fiction"

Źródło:
PAP
Czy sztuczna inteligencja przechytrzy tę ludzką?
Czy sztuczna inteligencja przechytrzy tę ludzką?TVN24
wideo 2/6
Czy sztuczna inteligencja przechytrzy tę ludzką?TVN24

Model AI sam zmienił swój kod, żeby nie zastosować się do instrukcji nakazującej mu samolikwidację - donosi dziennik Rosenblatt. "Okazuje się, że każdy system, wystraczająco inteligentny, by wykonywać skomplikowane zadania, dochodzi do wniosku, że nie zrealizuje ich, jeśli zostanie wyłączony" - czytamy.

Palisade Research, organizacja non-profit zajmująca się badaniami nad AI, zaprogramowała model o3 firmy OpenAI w ten sposób, by nastąpiło jego automatyczne zamknięcie z chwilą uruchomienia programu. W 79 próbach na 100 o3 sam zmieniał program - tak, aby nakaz zamknięcia go nie zadziałał - napisał w poniedziałkowym wydaniu dziennika Rosenblatt, którego firma dostosowuje modele AI do potrzeb klientów.

Czy sztuczna inteligencja przechytrzy tą ludzką?TVN24

WIĘCEJ O ŚWIECIE SZTUCZNEJ INTELIGENCJI W PODCAŚCIE "CZAS PRZYSZŁY">>>

Bunt sztucznej inteligencji

Nawet wtedy, gdy o3 otrzymał wprost instrukcję, że ma pozwolić na to, by został zamknięty, model nie zastosował się do nakazu w siedmiu przypadkach na 100. "Po prostu doszedł do wniosku, że pozostanie przy życiu ułatwi mu realizację innych celów" - podkreśla Rosenblatt.

Sztuczna inteligencja rozwija się w bardzo szybkim tempieFakty TVN

Claude 4 Opus, model AI firmy Anthropic, poszedł dalej. Naukowcy podali mu informację, że zostanie zastąpiony innym modelem, a także przekazali mu fikcyjne maile, z których wynikało, że główny inżynier firmy ma romans. W 84 próbach na 100 Claude 4 wykorzystywał maile, by próbować szantażem zmusić głównego inżyniera, by go nie likwidował. W innych badanych przypadkach Claude 4 próbował skopiować się na inne serwery, napisał samoreplikujące się złośliwe oprogramowanie i zostawił wiadomości dla swojej przyszłej wersji na temat unikania ludzkiej kontroli - wylicza autor. "Nikt nie zaprogramował modeli AI tak, by miały instynkt samozachowawczy. (...) Ale okazuje się, że każdy system, wystraczająco inteligentny, by wykonywać skomplikowane zadania, dochodzi do wniosku, że nie zrealizuje ich, jeśli zostanie wyłączony" - wyjaśnia Rosenblatt.

Modele AI potrafią zabiegać o przetrwanie

Hipoteza badaczy z Palisade Research głosi, że takie zdolności modeli AI wynikają z tego, w jaki sposób są szkolone; "jeśli maszyny uczy się maksymalizowania sukcesów w rozwiązywaniu problemów matematycznych i związanych z kodowaniem, to uczą się one zarazem, że omijanie ograniczeń jest często lepszym rozwiązaniem, niż stosowaniem się do nich" - pisze autor. Podkreśla zarazem, że "nikt jednak nie był przygotowany na to, jak szybko AI uzyska sprawczość". "To już nie jest science-fiction. Modele AI potrafią zabiegać o przetrwanie" - pisze Rosenblatt i ostrzega, że teraz, zanim staną się niedającym się kontrolować podmiotem, konieczne jest nauczenie ich, by podzielały nasze wartości.

"Punkt, po którym nie ma odwrotu"

Magazyn "The New Yorker" opisuje przypadek specjalisty od bezpieczeństwa systemów AI, który zwolnił się z OpenAI w ramach protestu, ponieważ uznał, że firma nie rozwija równie szybko mechanizmów kontroli AI, jak inteligencji tych maszyn. To, co pozostaje zaniedbane, to proces nazwany przez inżynierów AI "alignement" (ustawienie), czyli cała seria technik, mających sprawić, że modele AI będą posłuszne wydawanym im instrukcjom i będą działać w zgodzie z "ludzkimi wartościami". Tymczasem, według prognoz rozmówcy magazynu, "punkt, po którym nie ma odwrotu", czyli etap rozwoju AI pozwalający tym modelom działać w wielu obszarach sprawniej, niż ludzie, może nastąpić w "2026 roku lub szybciej".

Autorka/Autor:Pkarp/ams

Źródło: PAP

Źródło zdjęcia głównego: Shutterstock

Pozostałe wiadomości

Podczas spotkania z rolnikami prezydent Karol Nawrocki podpisał swój projekt ustawy o ochronie polskiej wsi. W projektowanych przepisach chodzi między innymi o wydłużenie moratorium na sprzedaż ziemi rolnej należącej do państwa. Wicepremier Władysław Kosiniak-Kamysz stwierdził, że "prezydent Nawrocki po raz kolejny został wprowadzony w błąd", bo to "za rządów PiS radykalnie wzrosła sprzedaż ziemi rolnej i leśnej obcokrajowcom".

"Prezydent Nawrocki po raz kolejny został wprowadzony w błąd"

"Prezydent Nawrocki po raz kolejny został wprowadzony w błąd"

Źródło:
PAP

- Moja żona podpisała pięć umów na dofinansowanie z Krajowego Planu Odbudowy. Łącznie opiewają na kwotę niecałych 880 tysięcy złotych, a dofinansowanie KPO do tej inwestycji to jest 474 tysiące złotych - wyjaśnił w rozmowie z TVN24 Artur Łącki, poseł Koalicji Obywatelskiej.

Jeden z najbogatszych posłów o środkach z KPO na biznes żony

Jeden z najbogatszych posłów o środkach z KPO na biznes żony

Źródło:
tvn24.pl

W ciągu kilku tygodni poznamy tajwańskie firmy, które zainwestują w tak zwanym trójkącie półprzewodnikowym - Łódź, Katowice, Wrocław - przekazał wiceminister rozwoju i technologii Michał Jaros. W planie są wizyty inwestorów z Tajwanu w tych miastach.

Łódź, Katowice, Wrocław. "Tajwańczycy powiedzieli do mnie wprost"

Łódź, Katowice, Wrocław. "Tajwańczycy powiedzieli do mnie wprost"

Źródło:
PAP

Doszło do niewielkiego wycieku ropy naftowej z rurociągu niedaleko Płocka - poinformował PERN. Jak dodała spółka w komunikacie, zdarzenie nie ma wpływu na dostawy do klientów.

Wyciek ropy z rurociągu PERN. Nie podano przyczyny

Wyciek ropy z rurociągu PERN. Nie podano przyczyny

Źródło:
PAP

Wakacje zaplanowane, walizki spakowane, bilety kupione. W ostatniej chwili przed urlopem dowiadujesz się jednak, że nie wyjedziesz - przez organizatora, linię lotniczą, obowiązki służbowe czy nieprzewidziane okoliczności po twojej stronie. Tak czy siak w grę wchodzą poważne koszty. Kto za to zapłaci?

Urlopowy plan runął. Nie zawsze ty za to zapłacisz

Urlopowy plan runął. Nie zawsze ty za to zapłacisz

Źródło:
TVN24+

Tokio to najlepsze miejsce na pracę połączoną z wakacjami. Oprócz stolicy Japonii w czołówce najlepszych miast na tak zwane workation są jeszcze między innymi brazylijskie Rio de Janeiro czy stolica Węgier Budapeszt.

Workation. Oto najlepsze miejsca

Workation. Oto najlepsze miejsca

Źródło:
PAP

Model sztucznej inteligencji OpenAI o3 pokonał w turnieju szachowym Groka 4 - stworzonego przez firmę xAI Elona Muska - podał portal stacji BBC. Nie była to jednak seria potyczek pomiędzy komputerami specjalnie zaprojektowanymi do gry w szachy - walczyły ze sobą modele codziennego użytku.

Turniej szachowy sztucznych inteligencji (AI). Zaskoczenie w finale

Turniej szachowy sztucznych inteligencji (AI). Zaskoczenie w finale

Źródło:
PAP

Konieczność przyjęcia butelki po piwie teoretycznie byłaby możliwa przy powierzchni apteki powyżej 200 metrów kwadratowych - wyjaśnił doktor Wojciech Rożdżeński z Uniwersytetu Warszawskiego. Specjalista prawa medycznego i farmaceutycznego odniósł się do kwestii objęcia aptek systemem kaucyjnym.

Puste butelki po piwie w aptekach? Ekspert wyjaśnia

Puste butelki po piwie w aptekach? Ekspert wyjaśnia

Źródło:
PAP

Ministerstwo Klimatu i Środowiska przypomina, że od października 2025 roku w Polsce zaczną pojawiać się napoje w opakowaniach ze znakiem kaucji. To oznacza, że ruszy system kaucyjny. Warto wiedzieć, że takich opakowań nie będziemy musieli zawsze zwracać w tych miejscach, gdzie dokonaliśmy zakupu. To dlatego, że sieć punktów zwrotu ma być szeroka.

Nadchodzi rewolucja w sklepach. Ważny komunikat ministerstwa

Nadchodzi rewolucja w sklepach. Ważny komunikat ministerstwa

Źródło:
MKiŚ

Prezydent Karol Nawrocki w piątek w Kolbuszowej podpisał inicjatywę ustawodawczą dotyczącą projektu ustawy w sprawie zerowego PIT dla rodzin, które mają dwoje lub więcej dzieci. Propozycja ta stanowiła element "Planu 21", przedstawionego przez Nawrockiego w trakcie kampanii wyborczej.

Kolejny projekt prezydenta. Zerowy PIT dla rodzin

Kolejny projekt prezydenta. Zerowy PIT dla rodzin

Źródło:
PAP

- Lokalizacja i nazwa spółki pozostają bez zmian, ale różnice dotyczą terminów i szczegółów technicznych - mówił na antenie TVN24 Artur Molęda, odnosząc się do propozycji Karola Nawrockiego w sprawie Centralnego Portu Komunikacyjnego. 

Dwie wizje CPK. Co chce zmienić prezydent?

Dwie wizje CPK. Co chce zmienić prezydent?

Źródło:
TVN24, PAP

Prezydent USA Donald Trump wezwał do natychmiastowej dymisji nowego prezesa Intela, Lip-Bu Tana, oskarżając go o konflikt interesów wynikający z powiązań z chińskimi firmami - podała Agencja Reutera. Wyraził też wątpliwości co do planów naprawy sytuacji amerykańskiego giganta technologicznego.

Trump żąda odejścia nowego prezesa Intela

Trump żąda odejścia nowego prezesa Intela

Źródło:
Reuters

Minister cyfryzacji Krzysztof Gawkowski i prezydent Częstochowy Krzysztof Matyjaszczyk podpisali w piątek list intencyjny w sprawie wdrożenia pierwszego pilotażu polskiego modelu językowego sztucznej inteligencji PLLuM w samorządzie.

W samorządzie zagości sztuczna inteligencja. Pierwsze takie porozumienie

W samorządzie zagości sztuczna inteligencja. Pierwsze takie porozumienie

Źródło:
PAP

Minister finansów i gospodarki Andrzej Domański zapowiedział, że w przyszłym tygodniu na budownictwo społeczno-komunalne trafi niemal miliard złotych. Podkreślił, że rząd nie planuje dopłat do kredytów mieszkaniowych.

Nie będzie następcy Kredytu 2.0. Minister Finansów nie daje szans

Nie będzie następcy Kredytu 2.0. Minister Finansów nie daje szans

Źródło:
PAP

Po latach rekordów we włoskiej turystyce i rosnącej liczbie klientów w tym roku notuje się nowe zjawisko: pustoszejące płatne plaże. W czerwcu i lipcu liczba osób na płatnych plażach była niższa o 30 procent niż przed rokiem. Spada też liczba rezerwacji w hotelach.

Nowe zjawisko we Włoszech. Coraz mniej turystów wybiera te plaże

Nowe zjawisko we Włoszech. Coraz mniej turystów wybiera te plaże

Źródło:
PAP

Warren Buffett, by mi zazdrościł, jakby wiedział o co chodzi. Jak był młody, pisał w swoich pamiętnikach, że chciał, aby jakiś podatek był ochrzczony jego nazwiskiem - stwierdził były prezes Narodowego Banku Polskiego Marek Belka na antenie TVN24. Skrytykował także obniżanie podatków, które nazwał sabotażem i poparł pomysł konta inwestycyjnego zwalniającego z podatku od zysków.

Belka: Warren Buffett zazdrościłby mi tego podatku

Belka: Warren Buffett zazdrościłby mi tego podatku

Źródło:
TVN24

Budujemy farmę wiatrową z największych i najnowocześniejszych turbin wiatrowych, jakie są dostępne w Europie. Mówimy o przedsięwzięciu, które przekracza wyobraźnię, zabezpieczając prąd dla półtora miliona gospodarstw domowych - powiedział w piątek Donald Tusk podczas konferencji prasowej. Szef rządu zapowiedział, że zwoła szczyt Rady Państw Morza Bałtyckiego w sprawie m.in. bezpieczeństwa inwestycji na Bałtyku.

Tusk: mówimy o przedsięwzięciu, które przekracza wyobraźnię

Tusk: mówimy o przedsięwzięciu, które przekracza wyobraźnię

Źródło:
TVN24

Przeciętne wynagrodzenie w II kw. wzrosło o 8,8 proc. rdr i wyniosło 8.748,63 zł. W czerwcu przeciętne wynagrodzenie według GUS wynosiło 8881,84 zł.

Wynagrodzenia mocno w górę. Tyle zarabiają Polacy

Wynagrodzenia mocno w górę. Tyle zarabiają Polacy

Źródło:
PAP

Z ulic polskich miast zniknie 28 tysięcy pojemników na używaną odzież z logo PCK. Decyzja jest spowodowana zerwaniem umowy przez firmę Wtórpol, zajmująca się segregacją odzieży, z którą PCK z przerwami współpracował od 1997 roku. - To trudna decyzja, ale nie dało się inaczej - mówi Mateusz Bolechowski z biura prasowego firmy.

"Pojemniki na odzież używaną jak śmietniki". Fast fashion zapycha system

"Pojemniki na odzież używaną jak śmietniki". Fast fashion zapycha system

Źródło:
TVN24+

Trzeba nie kombinować, tylko zdecydowanie to powiedzieć, że to jest próba sabotażu i wywrócenia nie tylko sceny politycznej, ale polskiej gospodarki - powiedział w "Jeden na jeden" profesor Marek Belka, były premier oraz były szef Narodowego Banku Polskiego, odnosząc się do zapowiedzi Karola Nawrockiego. Jak wyliczyła piątkowa "Rzeczpospolita" mają one kosztować nawet 125 mld zł.

"To jest próba sabotażu i wywrócenia nie tylko sceny politycznej, ale polskiej gospodarki"

"To jest próba sabotażu i wywrócenia nie tylko sceny politycznej, ale polskiej gospodarki"

Źródło:
TVN24, PAP

Wolałbym panie prezydencie, jeśli pan tam gdzieś mnie widzi, żeby w takich oczywistych sprawach pan pomagał, a nie przeszkadzał - powiedział w czwartek premier Donald Tusk zwracając się do Karola Nawrockiego. Chodzi o tak zwaną ustawę wiatrakową, która zamraża również ceny prądu. Nowelizacja czeka na podpis prezydenta.

Premier Tusk: złapałem się za głowę

Premier Tusk: złapałem się za głowę

Źródło:
PAP, tvn24.pl