Az AI átalakítja a városnézést a látássérült felhasználók számára

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Az áttörés megváltoztatja azt a módot, ahogyan a látássérült emberek megtapasztalják a világot, és eszközöket adnak számukra, hogy felfedezzék, megértsék és megtapasztalják ismeretlen helyek szépségét, mint még soha. Tanulmány: Az AI-rendszer megkönnyíti a vak és gyengénlátó emberek számára az ismeretlen környezet értelmezését és megtapasztalását. A kép forrása: Angel Santana Garcia/Shutterstock.com Egy kínai kutatócsoport mesterséges intelligencia (AI) rendszert fejlesztett ki, amely segíthet a látássérült embereknek felfedezni, megérteni és élvezni az ismeretlen környezetet. A tanulmány a Nature Portfolio Journal Artificial Intelligence folyóiratban jelent meg. Háttér A természeti környezet tanulmányozása...

Az AI átalakítja a városnézést a látássérült felhasználók számára

Az áttörés megváltoztatja azt a módot, ahogyan a látássérült emberek megtapasztalják a világot, és eszközöket adnak számukra, hogy felfedezzék, megértsék és megtapasztalják ismeretlen helyek szépségét, mint még soha.

Tanulmány: Az AI-rendszer megkönnyíti a vak és gyengénlátó emberek számára az ismeretlen környezet értelmezését és megtapasztalását. Fotó: Angel Santana Garcia/Shutterstock.com

Egy kínai kutatócsoport mesterséges intelligencia (AI) rendszert fejlesztett ki, amely segíthet a látássérült embereknek felfedezni, megérteni és élvezni az ismeretlen környezetet. A tanulmány aNature Portfolio Journal Artificial Intelligence.

háttér

A természeti környezetek, például a parkok felfedezése jelentős pozitív hatással van a testi és lelki egészségre. A gyengénlátó vagy vak emberek azonban gyakran ki vannak zárva ezekből az előnyökből, mivel nem állnak rendelkezésre megfelelő eszközök a velük való proaktív együttműködéshez.

A látássérült egyének irányítására kialakított meglévő kisegítő megoldások elsősorban olyan funkcionális támogatásra összpontosítanak, mint például a navigáció és az akadálykerülés, lehetővé téve számukra, hogy passzívan foglalkozzanak a természettel.

A látássérült emberek gyakran tehetetlennek érzik magukat, miközben ismeretlen környezetet fedeznek fel. Ez általában azt jelenti, hogy családtagokra, barátokra vagy önkéntesekre támaszkodnak támogatásban, ami befolyásolja képességüket arra, hogy aktívan felfedezzék és megértsék az ismeretlen környezeteket, valamint emlékezzenek és kommunikáljanak más látássérültekkel az utazásukról.

Egy kínai kutatócsoport kifejlesztett egy mesterséges intelligenciával hajtott Viptour rendszert, amely a látássérült egyének számára a függetlenség érzését biztosítja ismeretlen környezetben.

Hogyan működik a Viptour?

A Viptour egy mesterséges intelligencia által vezérelt rendszer, amely egy sor könnyű, hordozható, fogyasztói minőségű eszközt (kamerát és okostelefont) és egy új, Focusformer nevű mélytanulási algoritmus-hálózatot tartalmaz. A hatékony multi-szenzoros interakciós technikák, mint például a hang és a hierarchikus tapintható interakció, fokozzák a látássérült felhasználók és a Viptour rendszer közötti interakciót.

A Focusformer az esztétikát, a frissességet (újszerűséget) és az alapvető igényeket (beleértve a navigációt és a biztonságot) kulcsfontosságú tényezőnek tekinti annak érdekében, hogy értelmes információkat nyerjen ki összetett, ismeretlen környezetből, és kiküszöbölje a felesleges vizuális részleteket. Ez csökkenti a látássérült felhasználók kognitív terhelését.

A Focusformer nagy mennyiségű információt alakít át strukturált, ritka és hierarchikus, személyre szabott diagrammá. A jól felépített diagram alapján a Focusformer okostelefon-alkalmazáson keresztül kommunikál a látássérült felhasználókkal, megérti preferenciáikat, és személyre szabott támogatást nyújt egy adapteren keresztül.

A látó turisták több ezer nyilvános turisztikai videójával készült, ami előnyös az esztétikai elfogultság hatékony csökkentésében.

A Viptour rendszerben lehetőség van a tapasztalatok rögzítésére, mentésére és megosztására, elősegítve a látássérültek közötti érzelmi kommunikációt, valamint elősegítve a tudás- és tapasztalatcserét közösségi hálózataikban.

A Viptours műszaki innovációja a Multi-T Focus Focusformer hálózatában rejlik. Ez a megközelítés egy háttéralhálózatot használ a gyakran látott objektumok kiszűrésére, egy vonzerő alhálózatot a kiemelések azonosítására, egy frissességi alhálózatot az új funkciók felfedezésére, és egy alhálózatot, amely a látássérült résztvevőkkel végzett felméréseken alapul. Ezek az alhálózatok együttesen választják ki, rangsorolják és bemutatják a legrelevánsabb információkat minden felhasználó számára.

A Viptour rendszer egy Blv-in-the-Loop adaptert is használ, amely valós időben frissíti ajánlásait az egyéni felhasználói mutatók, például a „tetszik” és a „nem tetszik” alapján, lehetővé téve a személyre szabást.

Felhasználói vélemény a Viptour-ról

A Viptour rendszert 33 vak vagy látássérült emberen tesztelték, és elemzés céljából összegyűjtötték az önbevallásos érzelmi élményeket.

Ami a segítő teljesítményt illeti, a tanulmány megállapította, hogy a Viptour rendszer hatékonyan segítette a látássérült egyéneket az ismeretlen környezet aktív felfedezésében és alapos megértésében, pontos és hosszan tartó emlékekkel ruházta fel őket, és lehetővé tette számukra, hogy kommunikáljanak kollégáikkal.

Az önbeszámoló tapasztalatok részletes elemzésével a tanulmány megállapította, hogy a Viptourt sikeresen használó résztvevők pozitív érzelmi válaszreakciót 67,9%-kal, izgalmat 94,7%-kal, kognitív térképezési pontosságot 772,73%-kal, és 200%-kal növelték a hosszú távú memória megtartását.

A felhasználói értékelések során a Viptour rendszer használhatósági pontszámai folyamatosan 80/100 felettiek, ami összehasonlítható vagy jobb, mint a látássérültek számára készült egyéb segédeszközök.

A fiziológiai mérések, beleértve az elektrodermális aktivitást és a pulzusszám változékonyságát, jelentős javulást mutattak a Viptour használatával, ami az érzelmi elkötelezettség javulását jelzi.

Vizsgálja meg a jelentőségét

A tanulmány rávilágít az AI-vezérelt Viptour rendszer lehetséges felhasználási területeire, amelyek kellemes és emlékezetes élményt nyújtanak a látássérülteknek, miközben aktívan felfedezik az ismeretlen környezeteket. Ezek az élmények jelentősen javíthatják érzelmi állapotukat és általános életminőségüket.

A meglévő bizonyítékok arra utalnak, hogy a szervezett és lebilincselő információk bemutatása javíthatja az egyén élvezetét, és elősegítheti a mélyebb memóriamegtartást. Az emberek hajlamosak a jól strukturált és értelmes információkat feldolgozni, ami élvezetesebbé és emlékezetesebbé teszi élményeiket.

Ez az emberi tendencia a kognitív fluencia fogalmával magyarázható, amely azt jelzi, hogy az információ világos és szervezett bemutatása csökkenti az egyének kognitív terhelését. Ezután segít nekik a mentális erőforrásokat a tartalom megértéséhez és integrálásához irányítani. Ez a jobb feldolgozási folyékonyság pozitív reakcióhoz vezet, mivel az emberek kellemesebben érzékelik az információt.

Ezenkívül az új és az ismerős információk közötti kölcsönhatás befolyásolja a rendezett és érdekes információk emlékezetre gyakorolt ​​hatását. Az új információk felkeltik a kíváncsiságot és javítják a figyelmet, míg az ismerős információk kognitív kényelmet és koherenciát biztosítanak.

Az információ strukturált és megnyerő módon történő bemutatása egyensúlyba hozhatja az újdonságot és az ismerősséget, ami segít fenntartani az egyén érdeklődését és elkötelezettségét.

A Focusformer saját maga által felügyelt tréningje több ezer felirat nélküli nyilvános turisztikai videóval hatékonyan rögzítette a kognitív nyelvtudást, és feltárta a statisztikai összefüggéseket a turisztikai szcénák különböző fogalmai között. Ez a megközelítés kiküszöböli a lehetséges torzításokat az utazási preferenciák címkézésében, és arra tanítja a modellt, hogy csak releváns kontextuális információkat nyerjen ki.

A Focusformer személyre szabott tervezési szempontjai lehetővé tették a Viptour rendszer számára, hogy sikeresen modellezze a kívánt kognitív nyelvi készségeket, ezáltal javítva a látássérült egyének turisztikai élményét.

Érdemes megjegyezni, hogy a Viptour hatása a mögöttes mesterséges intelligencia technikák minőségétől függ, mint például az objektumfelismerés és a szemantikus gráf generálás. E módszerek jövőbeni fejlesztései tovább javíthatják a rendszer teljesítményét.

Töltse le PDF másolatát most!


Források:

Journal reference:
  • Lin H. 2025. AI system facilitates people with blindness and low vision in interpreting and experiencing unfamiliar environments. NPJ Artificial Intelligence. https://doi.org/10.1038/s44387-025-00006-w  https://www.nature.com/articles/s44387-025-00006-w