Modele Al "potrafią zabiegać o przetrwanie". "To już nie jest science-fiction"

Źródło:
PAP
Czy sztuczna inteligencja przechytrzy tę ludzką?
Czy sztuczna inteligencja przechytrzy tę ludzką?TVN24
wideo 2/6
Czy sztuczna inteligencja przechytrzy tę ludzką?TVN24

Model AI sam zmienił swój kod, żeby nie zastosować się do instrukcji nakazującej mu samolikwidację - donosi dziennik Rosenblatt. "Okazuje się, że każdy system, wystraczająco inteligentny, by wykonywać skomplikowane zadania, dochodzi do wniosku, że nie zrealizuje ich, jeśli zostanie wyłączony" - czytamy.

Palisade Research, organizacja non-profit zajmująca się badaniami nad AI, zaprogramowała model o3 firmy OpenAI w ten sposób, by nastąpiło jego automatyczne zamknięcie z chwilą uruchomienia programu. W 79 próbach na 100 o3 sam zmieniał program - tak, aby nakaz zamknięcia go nie zadziałał - napisał w poniedziałkowym wydaniu dziennika Rosenblatt, którego firma dostosowuje modele AI do potrzeb klientów.

Czy sztuczna inteligencja przechytrzy tą ludzką?TVN24

WIĘCEJ O ŚWIECIE SZTUCZNEJ INTELIGENCJI W PODCAŚCIE "CZAS PRZYSZŁY">>>

Bunt sztucznej inteligencji

Nawet wtedy, gdy o3 otrzymał wprost instrukcję, że ma pozwolić na to, by został zamknięty, model nie zastosował się do nakazu w siedmiu przypadkach na 100. "Po prostu doszedł do wniosku, że pozostanie przy życiu ułatwi mu realizację innych celów" - podkreśla Rosenblatt.

Sztuczna inteligencja rozwija się w bardzo szybkim tempieFakty TVN

Claude 4 Opus, model AI firmy Anthropic, poszedł dalej. Naukowcy podali mu informację, że zostanie zastąpiony innym modelem, a także przekazali mu fikcyjne maile, z których wynikało, że główny inżynier firmy ma romans. W 84 próbach na 100 Claude 4 wykorzystywał maile, by próbować szantażem zmusić głównego inżyniera, by go nie likwidował. W innych badanych przypadkach Claude 4 próbował skopiować się na inne serwery, napisał samoreplikujące się złośliwe oprogramowanie i zostawił wiadomości dla swojej przyszłej wersji na temat unikania ludzkiej kontroli - wylicza autor. "Nikt nie zaprogramował modeli AI tak, by miały instynkt samozachowawczy. (...) Ale okazuje się, że każdy system, wystraczająco inteligentny, by wykonywać skomplikowane zadania, dochodzi do wniosku, że nie zrealizuje ich, jeśli zostanie wyłączony" - wyjaśnia Rosenblatt.

Modele AI potrafią zabiegać o przetrwanie

Hipoteza badaczy z Palisade Research głosi, że takie zdolności modeli AI wynikają z tego, w jaki sposób są szkolone; "jeśli maszyny uczy się maksymalizowania sukcesów w rozwiązywaniu problemów matematycznych i związanych z kodowaniem, to uczą się one zarazem, że omijanie ograniczeń jest często lepszym rozwiązaniem, niż stosowaniem się do nich" - pisze autor. Podkreśla zarazem, że "nikt jednak nie był przygotowany na to, jak szybko AI uzyska sprawczość". "To już nie jest science-fiction. Modele AI potrafią zabiegać o przetrwanie" - pisze Rosenblatt i ostrzega, że teraz, zanim staną się niedającym się kontrolować podmiotem, konieczne jest nauczenie ich, by podzielały nasze wartości.

"Punkt, po którym nie ma odwrotu"

Magazyn "The New Yorker" opisuje przypadek specjalisty od bezpieczeństwa systemów AI, który zwolnił się z OpenAI w ramach protestu, ponieważ uznał, że firma nie rozwija równie szybko mechanizmów kontroli AI, jak inteligencji tych maszyn. To, co pozostaje zaniedbane, to proces nazwany przez inżynierów AI "alignement" (ustawienie), czyli cała seria technik, mających sprawić, że modele AI będą posłuszne wydawanym im instrukcjom i będą działać w zgodzie z "ludzkimi wartościami". Tymczasem, według prognoz rozmówcy magazynu, "punkt, po którym nie ma odwrotu", czyli etap rozwoju AI pozwalający tym modelom działać w wielu obszarach sprawniej, niż ludzie, może nastąpić w "2026 roku lub szybciej".

Autorka/Autor:Pkarp/ams

Źródło: PAP

Źródło zdjęcia głównego: Shutterstock

Pozostałe wiadomości

W Cinque Terre we włoskiej Ligurii, który w ostatnich latach zmagał się ze zjawiskiem nadmiernej turystyki, odnotowano w tym roku znaczący spadek liczby odwiedzających. Branża hotelarska bije na alarm, określając tegoroczny sezon letni jako najgorszy od czasu zakończenia pandemii.

Od tłumów do pustek w hotelach. Włoski region liczy straty

Od tłumów do pustek w hotelach. Włoski region liczy straty

Źródło:
PAP

To ostatnie chwile na przygotowanie plecaków na nowy rok szkolny. Jak wyliczają eksperci koszty wyprawki szkolnej jest niewiele wyższy niż przed rokiem. Warto pamiętać, że rodzicom i opiekunom, bez względu na dochody i sytuację finansową, przysługuje jednorazowo 300 zł na zakup podręczników, zeszytów i sprzętów w ramach świadczenia Dobry Start. Jeśli chcemy dostać pieniądze jeszcze we wrześniu, trzeba się pospieszyć.

Ostatnie chwile na przygotowanie wyprawki. Tak zmieniły się szkolne wydatki

Ostatnie chwile na przygotowanie wyprawki. Tak zmieniły się szkolne wydatki

Źródło:
PAP

W tę niedzielę przypada piąta w tym roku niedziela handlowa, więc zakupy zrobimy także w większych sklepach i galeriach handlowych. Zgodnie z przepisami kolejne trzy takie wyjątki zaplanowano dopiero na grudzień 2025 roku.

Sklepy otwarte. Dziś jedna z niewielu takich niedziel

Sklepy otwarte. Dziś jedna z niewielu takich niedziel

Źródło:
PAP

Jedna z najpopularniejszych par polskiego internetu wzięła ślub i ogłosiła, że film z wydarzenia zostanie pokazany na ekranach kin. Ich decyzja stała się przyczynkiem do dyskusji o tym, co prywatne i publiczne. I o tym, co będzie dalej. - W przyszłości będziemy obserwować dalszy rozwój formuły "życia na żywo", gdzie granice prywatności będą jeszcze bardziej zatarte, a treści będą coraz bardziej kontrowersyjne - przewiduje Emilia Zakrzewska, medioznawczyni z Uniwersytetu Warszawskiego.

"Serio zmonetyzowałeś własne wesele?". Friz i Wersow na ekranach kin

"Serio zmonetyzowałeś własne wesele?". Friz i Wersow na ekranach kin

Źródło:
tvn24.pl

Rząd Hiszpanii anulował wart 10 milionów euro kontrakt na usługi światłowodowe dla instytucji publicznych z firmą Telefonica. Jak poinformowało tamtejsze ministerstwo transformacji cyfrowej powodem zerwania umowy jest chiński sprzęt firmy Huawei, z którego korzysta Telefonica. Hiszpania znalazła się w ostatnich miesiącach pod presją ze strony USA i UE ze względu na wykorzystywania sprzętu Huawei, który według Waszyngtonu i Brukseli stanowi zagrożenie w zakresie bezpieczeństwa.

Rząd w Hiszpanii uległ presji. Firma traci kontrakt, bo korzysta z chińskiego sprzętu

Rząd w Hiszpanii uległ presji. Firma traci kontrakt, bo korzysta z chińskiego sprzętu

Źródło:
PAP

Rząd nie jest od realizowania projektów pana prezydenta. Powinien był się zastanowić w kampanii wyborczej, czy jego obietnice są do spełnienia - powiedział w "Faktach po Faktach" w TVN24 Andrzej Domański, minister finansów i gospodarki. Jego zdaniem po ostatniej Radzie Gabinetowej kolejna "nie pojawi się szybko".

Ministrowie "w bardzo dobrym nastroju". Prezydent też? "Wątpię"

Ministrowie "w bardzo dobrym nastroju". Prezydent też? "Wątpię"

Źródło:
TVN24

Przedłużenie ochrony tymczasowej i jasne określenie statusu obywateli Ukrainy w Polsce to warunek sprawnego funkcjonowania państwa - stwierdziła Rada Przedsiębiorczości w stanowisku dotyczącym ustawy o pomocy obywatelom Ukrainy. Przedstawiciele biznesu zaapelowali o pilne uregulowanie zasad pobytu oraz dostępu do rynku pracy i świadczeń socjalnych.

"Nie możemy tego zaprzepaścić". Apel Rady Przedsiębiorczości po wecie prezydenta

"Nie możemy tego zaprzepaścić". Apel Rady Przedsiębiorczości po wecie prezydenta

Źródło:
tvn24.pl

Można się dobrze ubrać, zgarnąć szafkę czy komodę na książki, zdobyć ładne pierścionki, a nawet wziąć coś na handel. Grupy w mediach społecznościowych informujące o tym, co warto na śmietnikach upolować za darmo, biją rekordy popularności. Ale jest pułapka. Na co trzeba zwrócić szczególną uwagę? - Miejmy świadomość, że przecież nikt nie pozbywa się, ot tak, dobrych rzeczy - przestrzega Jarosław Ryms z profilu "Pogromca szkodników".

Sprawdź, zanim to weźmiesz do domu. "Będą po nas biegać i nas gryźć"

Sprawdź, zanim to weźmiesz do domu. "Będą po nas biegać i nas gryźć"

Źródło:
TVN24+

Premier Donald Tusk podpisał zarządzenia, które przedłużają do 30 listopada obowiązywanie stopni alarmowych BRAVO i BRAVO CRP na terenie całego kraju - poinformowało Rządowe Centrum Bezpieczeństwa.

Stopnie alarmowe w Polsce. Premier podjął decyzję

Stopnie alarmowe w Polsce. Premier podjął decyzję

Źródło:
tvn24.pl

Liczba rezerwacji noclegów w górach wzrosła o 7 procent rok do roku, natomiast nad morzem spadła o 5 procent - wynika z raportu Travelist. Jak wskazują autorzy, jednym z kluczowych powodów może być cena: za dobę nad Bałtykiem trzeba zapłacić średnio 720 złotych, natomiast w górach 630 złotych.

Góry tańsze niż morze. Ile kosztuje wypoczynek pod koniec wakacji?

Góry tańsze niż morze. Ile kosztuje wypoczynek pod koniec wakacji?

Źródło:
PAP

Donald Trump skrytykował decyzję sądu apelacyjnego w Waszyngtonie, który uznał większość ceł jego administracji za nielegalne. "Jeśli to orzeczenie zostanie utrzymane, dosłownie zniszczy ono Stany Zjednoczone Ameryki" - napisał na platformie Truth Social.

Sąd: większość ceł nałożonych przez administrację Trumpa jest nielegalna

Sąd: większość ceł nałożonych przez administrację Trumpa jest nielegalna

Źródło:
PAP

W sierpniu liczba bezrobotnych w Niemczech przekroczyła trzy miliony - podała Federalna Agencja Pracy w Norymberdze. Tak wysokiego bezrobocia nie odnotowano od 15 lat. Eksperci zauważają jednak pierwsze oznaki możliwej stabilizacji na rynku pracy.

Załamanie na rynku pracy. Nie było tak od 15 lat

Załamanie na rynku pracy. Nie było tak od 15 lat

Źródło:
PAP

Kolejny wakacyjny wyjazd może być jeszcze droższy - i nie chodzi tylko o inflację. Na całym świecie coraz więcej miejsc wprowadza nowe opłaty klimatyczne, doliczane do noclegów, biletów promowych czy wejściówek do parków narodowych i obszarów chronionych - zauważa BBC.

Nawet 20 euro dziennie. Kolejne wakacje mogą być jeszcze droższe

Nawet 20 euro dziennie. Kolejne wakacje mogą być jeszcze droższe

Źródło:
BBC

Kursy pociągów sezonowych do miejscowości turystycznych zostaną wydłużone do października - podała spółka PKP Intercity. Przewoźnik podkreślił, że od przyszłego miesiąca pociągi Pendolino na trasie Warszawa-Szczecin będą kursowały w rekordowym czasie 4 godzin i 12 minut

Pociągi sezonowe będą kursować dłużej

Pociągi sezonowe będą kursować dłużej

Źródło:
PAP

Na najbliższym posiedzeniu rząd zajmie się projektem zakładającym umożliwienie siedemnastolatkom ubiegania się o prawo jazdy kategorii B na okres próbny. Do projektu wpisano też obowiązek noszenia kasku podczas jazdy między innymi rowerem i hulajnogą elektryczną przez dzieci do lat 16.

Kaski i rewolucja w prawie jazdy. Rząd szykuje zmiany

Kaski i rewolucja w prawie jazdy. Rząd szykuje zmiany

Źródło:
PAP

Zamieszanie w jednym z największych australijskich banków. Pracownicy ANZ otrzymali automatyczne wiadomości z informacją o konieczności zwrotu służbowych laptopów, zanim ktokolwiek oficjalnie poinformował ich o zwolnieniu.

Zaskakujący mail w wielkim banku. "Panika"

Zaskakujący mail w wielkim banku. "Panika"

Źródło:
BBC

Sąd Apelacyjny w Warszawie zmienił wyrok pierwszej instancji i oddalił pozew grupowy blisko 200 klientów Amber Gold. W 2022 roku sąd pierwszej instancji zasądził byłym klientom firmy ponad 20 milionów złotych.

Pozew klientów Amber Gold. Jest decyzja sądu apelacyjnego

Pozew klientów Amber Gold. Jest decyzja sądu apelacyjnego

Źródło:
PAP

Prezydent Karol Nawrocki podpisał projekt ustawy o utworzeniu Funduszu Rozwoju Technologii Przełomowych, który ma dysponować budżetem w wysokości pięciu miliardów złotych rocznie. - Prezydent chętnie obiecuje duże pieniądze, nie wskazując, kosztem jakich aktywności naszego państwa ma się to odbyć - ocenił wiceminister nauki profesor Marek Gzik. - Diabeł tkwi w szczegółach - dodał prezes Polskiej Akademii Nauk profesor Marek Konarzewski.

Nowy projekt prezydenta. "Mamy wątpliwości"

Nowy projekt prezydenta. "Mamy wątpliwości"

Źródło:
PAP

Kilka banków zaplanowało na najbliższe dni prace serwisowe. Oznacza to utrudnienia dla klientów. Mogą pojawić się problemy z realizacją przelewów czy w korzystaniu z Blika.

Utrudnienia dla klientów. Banki ostrzegają

Utrudnienia dla klientów. Banki ostrzegają

Źródło:
tvn24.pl

Piątkowe losowanie Eurojackpot nie przyniosło głównej wygranej. Kumulacja rośnie do 260 milionów złotych. W Polsce padły dwie wygrane trzeciego stopnia o wartości 935 tysięcy złotych. Kolejne losowanie już we wtorek.

Duże wygrane w Eurojackpot w Polsce

Duże wygrane w Eurojackpot w Polsce

Źródło:
tvn24.pl

Litr benzyny Pb95 kosztuje obecnie 45 groszy mniej niż przed rokiem, olej napędowy w skali roku potaniał o 36 groszy, a autogazu o 18 groszy - poinformowali w piątek analitycy Refleksu. Ich zdaniem początek września powinien przynieść stabilizację cen paliw.

Paliwa tańsze niż przed rokiem

Paliwa tańsze niż przed rokiem

Źródło:
PAP

Gubernator Rezerwy Federalnej Lisa Cook pozwała prezydenta Donalda Trumpa za próbę usunięcia jej ze stanowiska. Jak zauważa BBC, może to doprowadzić do batalii prawnej z konsekwencjami dla amerykańskiego banku centralnego i jego autonomii.

Pozew przeciw Trumpowi. "Nielegalna próba usunięcia ze stanowiska"

Pozew przeciw Trumpowi. "Nielegalna próba usunięcia ze stanowiska"

Źródło:
BBC

Wydłużenie mechanizmu ceny maksymalnej za energię elektryczną na poziomie 500 złotych za megawatogodzinę dla gospodarstw domowych do końca tego roku - to zakłada projekt opublikowany na stronie Rządowego Centrum Legislacji. W planie jest też wprowadzenie bonu ciepłowniczego.

Jest projekt w sprawie cen prądu

Jest projekt w sprawie cen prądu

Źródło:
PAP

Sprzedaż Tesli w Europie ponownie spadła - w lipcu o ponad 40 procent - podał portal stacji CNN. Dodał też, że chińska marka BYD odnotowała wzrost sprzedaży o ponad 200 procent.

Elon Musk i Tesla mają problem. "Jedna z najgorzej sprzedających się marek"

Elon Musk i Tesla mają problem. "Jedna z najgorzej sprzedających się marek"

Źródło:
CNN