AI może odmienić kontakt ze światem osób niewidomych

Źródło:
Wired
"Do 2050 roku nawet połowa miejsc pracy zostanie zastąpiona sztuczną inteligencją"
"Do 2050 roku nawet połowa miejsc pracy zostanie zastąpiona sztuczną inteligencją"TVN24
wideo 2/8
"Do 2050 roku nawet połowa miejsc pracy zostanie zastąpiona sztuczną inteligencją"TVN24

Aplikacje asystujące przeznaczone dla osób niewidomych zaczynają wdrażać ChatGPT-4 firmy OpenAI i efekty mogą budzić zdumienie. Ich użytkownicy są zachwyceni, mówią o nowym poziomie informacji, który ułatwia codzienne życie. Jednocześnie pojawiają się obawy związane z niedokładnością ChatGPT, zwłaszcza gdy aplikacja nie jest w stanie znaleźć odpowiedzi.

"Wired" opisuje przypadek Cheli Robes, która straciła zdolność widzenia w lewym oku, gdy miała 28 lat, a w prawym rok później. Dziś kobieta ma 38 lat i od kwietnia testuje Ask Envision, asystenta AI korzystającego z ChatGPT-4 i Google Glass.

System ten może pobierać obrazy i tekst, a na podstawie uzyskanych informacji tworzyć odpowiedzi i wchodzić w konwersację z użytkownikiem. Gdy dotknie ekranu dotykowego umieszczonego na okularach i poprosi o opis świata na zewnątrz, to dostaje odpowiedź, na przykład że niebo jest pochmurne.

W rozmowie z "Wired" kobieta mówi, że niepełnosprawność odebrała jej te małe detale, które pomagają ludziom zrozumieć się nawzajem w codziennym życiu, jak na przykład wyrazy twarzy. Zauważa, że jej ojciec ma specyficzne poczucie humoru i nie widząc jego twarzy nie zawsze jest pewna, kiedy mówi poważnie. - Jeśli zdjęcie może przekazać tysiąc słów, to wyobraź sobie, ile słów może przekazać wyraz twarzy - mówi.

Aplikacje odczytują świat dla niewidomych

Ask Envision jest jednym z kilku produktów wspomagających osoby niedowidzące, które zaczęły stosować modele sztucznej inteligencji. Mogą dostarczyć użytkownikom znacznie więcej szczegółów na temat otaczającego ich świata. Co za tym zaś idzie dać im także większą niezależność.

Envision AI - co potrafi aplikacja

Envision zadebiutowała jako aplikacja na smartfony do odczytywania tekstu na zdjęciach w 2018 roku, a od początku 2021 roku dostępna była także na Google Glass (które w marcu 2023 r. zostały wycofane ze sprzedaży). Na początku tego roku rozpoczęła testowanie nowego modelu konwersacyjnego, który potrafił odpowiadać na najprostsze pytania. Następnie zaczęła korzystać z 4 wersji ChatGPT do opisu obrazów.

Jednak nie tylko oni. Be My Eyes to aplikacja dostępna na rynku od 12 lat. Do tej pory łączyła widzących, którzy chcą pomoc z osobom niedowidzącym. Od marca testowany jest wirtualny asystent, którzy korzysta z ChatGPT-4. Pomaga on identyfikować obiekty w otoczeniu, nawet bardzo szczegółowe.

Zaś Microsoft, główny inwestor w OpenAI, rozpoczął testy wdrożenia GPT-4 dla swojej usługi SeeingAI, która oferuje podobne rozwiązania, co wyżej wymienione aplikacje.

Jakie są różnice? Jak zauważa "Wired" we wcześniejszej wersji Envision po prostu odczytywał tekst na obrazie od początku do końca. Teraz może podsumować całość i odpowiedzieć na dodatkowe pytania. Np. odczytać menu w restauracji, nie wszystkie pozycje po kolei, ale np. tylko te bezmięsne czy odpowiedzieć na pytania użytkownika odnośnie cen albo ograniczeń dietetycznych.

W rozmowie z serwisem Richard Beardsley, inny tester aplikacji, mówi, że zazwyczaj korzysta z usługi, aby znaleźć informacje kontaktowe na rachunku lub przeczytać listę składników na pudełkach z jedzeniem. Posiadanie zestawu głośnomówiącego w okularach Google oznacza, że ​​może z niego korzystać cały czas trzymając psa przewodnika na smyczy i laskę.

- Wcześniej nie można było przejść do określonej części tekstu. Możliwość przeskoczenia do konkretnego momentu znacznie ułatwia życie, dostajesz dokładnie to, czego szukasz – opowiada.

Do niedawna to było tylko w laboratoriach

Sina Bahram, niewidomy informatyk i szef firmy konsultingowej, która doradza w zakresie dostępności i integracji m.in. muzeom, parkom rozrywki czy firmom technologicznym, uważa, że integracja sztucznej inteligencji z aplikacjami dla osób niewidzących i niedowidzących może mieć ogromny wpływ na jakość życia ich użytkowników.

Bahram korzysta z Be My Eyes, które zaimplementowało ChatGPT-4 i zauważa, że w porównaniu do poprzednich wersji ma do czynienia z niewyobrażalną różnicą. Nieodzowny jest też fakt, że technologie te mogą być używane bez wysiłku i nie wymagają umiejętności technicznych. Opisuje dla „Wired” sytuację ze swojego życia, która miała miejsce dwa tygodnie wcześniej, gdy szedł ulicą Nowego Jorku z partnerem biznesowym. Gdy jego towarzysz zatrzymał się, by przyjrzeć się czemuś z bliska Bahram nie musiał czekać bezczynnie, pytać go czy coś się stało. Po prostu użył Be My Eyes i dowiedział się, że przygląda się on jakimś naklejkom, graffiti i rysunkom na ścianie. Zauważa, że taki poziom informacji to „coś, co nie istniało rok temu poza laboratorium (…) to po prostu nie było możliwe”.

Obawy przed błędami

Danna Gurari, adiunkt informatyki na University of Colorado w Boulder, mówi, że ekscytujące jest to, że niewidomi ludzie są na pierwszym froncie adaptacji nowych technologii, a nie pozostają w tyle. Jednak w jej ocenie jest to też nieco przerażające, że tak wrażliwa grupa społeczna musi mierzyć się z bałaganem i niekompetencją ze strony ChatGPT-4.

Każdego roku Gurari organizuje warsztaty o nazwie Viz Wiz na konferencji Computer Vision and Pattern Recognition, aby zgromadzić firmy takie jak Envision z badaczami sztucznej inteligencji i niewidomymi użytkownikami technologii. Kiedy Viz Wiz wystartował w 2018 roku, w warsztatach uczestniczyły tylko cztery zespoły. W tym roku zgłosiło się ponad 50 drużyn.

We wczesnych testach niektórych modeli zamiany obrazu na tekst, Gurari odkryła, że mogą one zmyślać informacje lub „halucynować”.

- W większości możemy polegać tylko na rzeczach bardzo konkretnych, ogólnych jak „widzę samochód, widzę osobę, widzę drzewo” – mówi w rozmowie z „Wired”. Zauważa, że to nie jest błaga informacja, ale jednocześnie powinien mieć ograniczone zaufanie co do odpowiedzi na zapytanie o to, co znajduje się w jego kanapce.

– Z wcześniej przeprowadzonych wywiadów wiemy, że osoby niewidome wolą otrzymywać jakiekolwiek informacje niż nie wiedzieć nic, więc to jest fantastyczne, że je dostają. Problem pojawia się, gdy podejmują decyzje na podstawie informacji nieprawdziwych – zauważa Gurari.

Jeśli sztuczna inteligencja np. błędnie zidentyfikuje lek albo składnik pokarmu, który jest alergenem, to może mieć to poważne konsekwencje, w tym zagrażać życiu.

Upragnione rozwiązania pomimo błędów

Jest jeszcze problem tego, że modele sztucznej inteligencji mają tendencje do błędnego identyfikowania wieku, rasy czy płci ludzi. Jak podaje „Wired” zbiory danych, na podstawie których szkolono sztuczną inteligencję są "wypaczone i stronnicze”, a w związku z tym i takie potrafią być efekty, czy też informacje zwrotne, które podaje program.

Bahram przyznaje, że jest to pewne ryzyko, ale zauważa, że systemy te oferują użytkownikom ocenę pewności, dzięki czemu ci mogą podejmować bardziej świadome decyzje na temat tego, co AI myśli, że widzi. Przede wszystkim jednak podkreśla, że osoby niewidome mają prawo do takiej samej informacji, co osoby widzące.

- Niedźwiedzią przysługą dla osób niewidomych byłoby udawanie, że każda osoba widząca nie zauważa od razu koloru skóry czy płci, niezależnie od tego, czy daje temu wyraz czy nie. Więc czemu mielibyśmy ograniczać dostęp do tych informacji komuś, kto nie ma dostępu do informacji wizualnych? – pyta.

Autorka/Autor:JW

Źródło: Wired

Źródło zdjęcia głównego: Shutterstock

Pozostałe wiadomości

Fabryki w Chinach odnotowały największy spadek aktywności od 16 miesięcy - podała Agencja Reutera. Analitycy podkreślają, że choć pesymistyczne nastroje mogą wyolbrzymiać wpływ ceł Donalda Trumpa, to i tak Chiny znajdują się pod rosnącą presją gospodarczą.

Pierwsze oznaki tego, jak cła Trumpa uderzają w Chiny

Pierwsze oznaki tego, jak cła Trumpa uderzają w Chiny

Źródło:
Reuters, PAP

Większość potencjalnych nabywców uważa, że ceny mieszkań wzrosną, choć w ostatnich miesiącach odsetek ten spada - wynika z raportu Otodom. Podwyżek najczęściej spodziewają się osoby młode.

Rynek podzielił się na dwa obozy. Raport

Rynek podzielił się na dwa obozy. Raport

Źródło:
PAP

Ministerstwo Finansów poinformowało o złożeniu przez Polskę wniosku o unijną klauzulę wyjścia. Chodzi o wydatki na obronność. Klauzula pozwala na zwiększenie wydatków mimo obejmującej Polskę procedury nadmiernego deficytu.

Resort finansów: Polska złożyła wniosek o unijną klauzulę wyjścia

Resort finansów: Polska złożyła wniosek o unijną klauzulę wyjścia

Źródło:
PAP

Przed południem hakerzy zaatakowali System Rejestrów Państwowych, ale atak został odparty - podał RMF FM. Nadal mogą występować trudności z działaniem mObywatela, rozliczaniem podatków czy rejestracją samochodów. Resort cyfryzacji poinformował o "przejściowych trudnościach z dostępem do niektórych usług publicznych".

Atak hakerski na rządowy system. Jest oświadczenie resortu cyfryzacji

Atak hakerski na rządowy system. Jest oświadczenie resortu cyfryzacji

Źródło:
PAP, tvn24.pl

Akcje spółek Rafako i Rafamet kontynuują w środę gwałtowne wzrosty. Premier Donald Tusk zapowiedział we wtorek udzielenie firmom ponad 700 milionów złotych wsparcia poprzez Agencję Rozwoju Przemysłu (ARP).

Kursy akcji wystrzeliły po zapowiedzi Donalda Tuska

Kursy akcji wystrzeliły po zapowiedzi Donalda Tuska

Źródło:
PAP

Inflacja w kwietniu 2025 roku wyniosła 4,2 procent rok do roku - podał w szybkim szacunku Główny Urząd Statystyczny (GUS). W porównaniu z poprzednim miesiącem ceny wzrosły o 0,4 procent.

Nowe dane o inflacji

Nowe dane o inflacji

Źródło:
tvn24.pl, PAP

Kraje uznawane za drogie stały się bardziej atrakcyjne dla polskich turystów. Na preferencje i wybór kierunku na wakacje wpłynęło to jednak nieznacznie - wskazał "Puls Biznesu".

Dokąd na wakacje? "Królują trzy klasyki"

Dokąd na wakacje? "Królują trzy klasyki"

Źródło:
PAP

Trybunał Sprawiedliwości Unii Europejskiej orzekł, że Malta naruszyła unijne prawo, oferując obywatelstwo za inwestycje. Zdaniem TSUE nabycie obywatelstwa nie może być elementem transakcji handlowej.

Obywatelstwo za inwestycje. Decyzja TSUE

Obywatelstwo za inwestycje. Decyzja TSUE

Źródło:
PAP

We wtorkowym losowaniu Eurojackpot nie padła główna wygrana. Kumulacja rośnie do 480 milionów złotych. W Polsce odnotowano jedną wygraną drugiego stopnia wynoszącą około 2,5 miliona złotych. Oto liczby, które padły 29 kwietnia 2025 roku.

Duża wygrana w Eurojackpot w Polsce

Duża wygrana w Eurojackpot w Polsce

Źródło:
tvn24.pl

We wtorkowym losowaniu Lotto nie odnotowano głównej wygranej. Kumulacja rośnie do trzech milionów złotych. Oto wyniki losowania Lotto i Lotto Plus z 29 kwietnia 2025 roku.

Rośnie kumulacja w Lotto

Rośnie kumulacja w Lotto

Źródło:
tvn24.pl

Firma UPS poinformowała, że planuje zwolnić 20 tysięcy pracowników i zamknąć 70 oddziałów - przekazała w oświadczeniu dyrektorka generalna UPS Carol Tome. Powodem ma być ograniczenie liczby przesyłek, jakie dostarczała z firmy Amazon.

Gigant chce zwolnić 20 tysięcy pracowników

Gigant chce zwolnić 20 tysięcy pracowników

Źródło:
PAP, Reuters

W rok liczba osób w wieku produkcyjnym zmalała o 151 tysięcy - podał Główny Urząd Statystyczny (GSU). Przyczyną tego zjawiska jest starzenie się społeczeństwa oraz mniejsza liczba młodych zasilających wiek produkcyjny.

Niepokojący raport GUS

Niepokojący raport GUS

Źródło:
PAP

W 2024 roku prawie 42 tysiące ojców skorzystało z urlopu rodzicielskiego. To 11-krotnie więcej niż w 2022 roku - podał Zakład Ubezpieczeń Społecznych (ZUS).

11-krotny wzrost w dwa lata. Zaskakujące dane ZUS

11-krotny wzrost w dwa lata. Zaskakujące dane ZUS

Źródło:
PAP

Wang Yi, szef chińskiej dyplomacji skrytykował politykę handlową USA podczas spotkania ze swoimi odpowiednikami z państw BRICS. Zaapelował też o sprzeciw wobec "protekcjonizmu" Stanów Zjednoczonych.

"Jeśli będziemy ustępować, to dręczyciel stanie się bardziej agresywny"

"Jeśli będziemy ustępować, to dręczyciel stanie się bardziej agresywny"

Źródło:
PAP, China Daily

Ponad 700 milionów złotych zostanie przekazanych do Agencji Rozwoju Przemysłu (ARP), która wykorzysta te środki, by pomóc spółkom Rafako i Rafamet - przekazał premier Donald Tusk.

Rafako dostanie pomoc rządową. Donald Tusk podał kwotę

Rafako dostanie pomoc rządową. Donald Tusk podał kwotę

Źródło:
PAP

Partia Liberalna Kanady (LPC) wygrała wybory parlamentarne. Lider ugrupowania i urzędujący premier Mark Carney podkreślił, że Kanada musi ambitnie podejść do kryzysu i stawić czoło groźbom prezydenta USA Donalda Trumpa.

"Przetrwaliśmy szok związany ze zdradą USA"

"Przetrwaliśmy szok związany ze zdradą USA"

Źródło:
PAP

Prezydent Donald Trump zmienia zdanie w sprawie wprowadzonych przez siebie ceł. Teraz chce wycofać się z dodatkowych taryf na części sprowadzane z zagranicy i wykorzystywane w produkcji aut w USA - podał "Wall Street Journal".

Cła Donalda Trumpa. Prezydent USA zmienia zdanie

Cła Donalda Trumpa. Prezydent USA zmienia zdanie

Źródło:
PAP

Sekretarz skarbu USA Scott Bessent poinformował w poniedziałek, że wkrótce dojdzie do porozumienia handlowego z niektórymi państwami. Dodał, że chęć negocjacji w sprawie ceł wyrażają także Chiny, dlatego "nie martwi się o puste półki" w Stanach Zjednoczonych.

Sekretarz skarbu: nie martwię się o puste półki

Sekretarz skarbu: nie martwię się o puste półki

Źródło:
PAP

Prezydent Andrzej Duda podpisał nowelę opóźniającą do 1 października wejście w życie nowych taryf na prąd. Zdaniem resortu klimatu zmiany pozwolą na obniżkę cen energii po wygaśnięciu ceny maksymalnej.

Ceny prądu. Prezydent Andrzej Duda podpisał ustawę

Ceny prądu. Prezydent Andrzej Duda podpisał ustawę

Źródło:
PAP

Nową prezeską Polskiej Agencji Kosmicznej POLSA została Marta Ewa Wachowicz - przekazał resort rozwoju. Wachowicz ma wykształcenie w obszarze badań kosmicznych. Uzyskała stopień doktora nauk fizycznych w dziedzinie fizyki kosmicznej.

Nowa szefowa Polskiej Agencji Kosmicznej

Nowa szefowa Polskiej Agencji Kosmicznej

Źródło:
PAP

Od wtorku 6 maja w PKO BP zaczną obowiązywać domyślne limity dzienne na przelewy i płatności w serwisie iPKO - przekazał bank w komunikacie. Zmiany są wprowadzane, by dodatkowo zwiększyć bezpieczeństwo transakcji w internecie.

Duże zmiany dla klientów największego banku w Polsce

Duże zmiany dla klientów największego banku w Polsce

Źródło:
tvn24.pl

Finanse domowe w nieładzie, opóźnienia w płatnościach, dziwne zakupy. Kiedy odpowiedzialna wcześniej osoba zaczyna nieostrożnie podchodzić do kwestii finansowych, może to być oznaka niezdiagnozowanej demencji - ostrzega CNN. - Nigdy pojedynczy objaw nie może świadczyć o procesie chorobowym, ale może być sygnałem alarmującym - podkreśliła Karolina Jurga, autorka poradnika o demencji.

"Takie osoby bardzo chętnie dają pieniądze". To może być sygnał alarmujący

"Takie osoby bardzo chętnie dają pieniądze". To może być sygnał alarmujący

Źródło:
TVN24+

Eksperci są zgodni, że migranci są nam potrzebni, bo w ciągu najbliższej dekady z polskiego rynku pracy ma zniknąć nawet 2,1 miliona osób. - Masowy napływ cudzoziemców pozwolił wypełnić lukę, która powstała z powodu starzenia się społeczeństwa i depopulacji - podkreśla Andrzej Kubisiak z Polskiego Instytutu Ekonomicznego. Ale to już nie wystarczy.

"Stanęłyby niektóre fabryki, a część szpitali miałaby problem z obsadą kadry"

"Stanęłyby niektóre fabryki, a część szpitali miałaby problem z obsadą kadry"

Źródło:
TVN24+

Zbliża się majówka. System rozliczeniowy Elixir, obsługujący przelewy międzybankowe w złotych, w czwartek (1 maja) będzie miał przerwę w standardowym funkcjonowaniu - poinformowała Krajowa Izba Rozliczeniowa. 

Przerwa w realizacji przelewów. Płatności warto zlecić z wyprzedzeniem

Przerwa w realizacji przelewów. Płatności warto zlecić z wyprzedzeniem

Źródło:
tvn24.pl

W marcu 2025 roku największy udział w oglądalności wśród dystrybutorów treści wideo w Polsce miała grupa TVN Warner Bros. Discovery - wynika z raportu All Screens Video Landscape Grupy Nielsen, na który powołuje się serwis Wirtualne Media.

Grupa TVN Warner Bros. Discovery liderem oglądalności

Grupa TVN Warner Bros. Discovery liderem oglądalności

Źródło:
Wirtualne Media