AI förvandlar sightseeing för synskadade användare

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Genombrott förändrar hur människor med synnedsättning upplever världen och ger dem verktyg för att upptäcka, förstå och uppleva skönheten i okända platser som aldrig förr. Studie: AI-systemet gör det lättare för personer med blindhet och nedsatt syn att tolka och uppleva okända miljöer. Bildkredit: Angel Santana Garcia/Shutterstock.com Ett team av forskare från Kina utvecklade ett system med artificiell intelligens (AI) som kanske kan hjälpa synskadade att utforska, förstå och njuta av okända miljöer. Studien är publicerad i Nature Portfolio Journal Artificial Intelligence. Bakgrund Studiet av naturliga miljöer...

AI förvandlar sightseeing för synskadade användare

Genombrott förändrar hur människor med synnedsättning upplever världen och ger dem verktyg för att upptäcka, förstå och uppleva skönheten i okända platser som aldrig förr.

Studie: AI-systemet gör det lättare för personer med blindhet och nedsatt syn att tolka och uppleva okända miljöer. Fotokredit: Angel Santana Garcia/Shutterstock.com

Ett team av forskare från Kina utvecklade ett system med artificiell intelligens (AI) som kanske kan hjälpa synskadade att utforska, förstå och njuta av okända miljöer. Studien publiceras iNature Portfolio Journal Artificiell intelligens.

bakgrund

Att utforska naturliga miljöer som parker har en betydande positiv inverkan på den fysiska och mentala hälsan. Men personer med nedsatt syn eller blindhet är ofta uteslutna från dessa förmåner eftersom adekvata verktyg inte finns tillgängliga för att proaktivt engagera sig med dem.

Befintliga hjälplösningar utformade för att vägleda synskadade individer fokuserar i första hand på att tillhandahålla funktionellt stöd såsom navigering och undvikande av hinder, vilket gör att de passivt kan engagera sig i naturen.

Synskadade känner sig ofta hjälplösa när de utforskar okända miljöer. Detta innebär vanligtvis att de förlitar sig på familjemedlemmar, vänner eller volontärer för stöd, vilket påverkar deras förmåga att aktivt utforska och förstå okända miljöer, samt komma ihåg och kommunicera med andra synskadade om sin resa.

Ett team av forskare i Kina utvecklade ett AI-drivet system som heter Viptour för att ge synskadade individer en känsla av självständighet i okända miljöer.

Hur fungerar Viptour?

Viptour är ett AI-drivet system som inkluderar en serie lätta, bärbara enheter av konsumentklass (en kamera och en smartphone) och ett nytt algoritmnätverk för djupinlärning som kallas Focusformer. Effektiva multisensoriska interaktionstekniker som ljud och hierarkisk taktil interaktion ökar interaktionen mellan synskadade användare och Viptour-systemet.

Focusformer betraktar estetik, fräschhet (nyhet) och grundläggande behov (inklusive navigering och säkerhet) som nyckelfaktorer för att extrahera meningsfull information från komplexa, obekanta miljöer och eliminera överflödiga visuella detaljer. Detta minskar kognitiv belastning på synskadade användare.

Focusformer omvandlar stora mängder information till ett strukturerat, sparsamt och hierarkiskt personligt diagram. Baserat på detta välstrukturerade diagram interagerar Focusformer med synskadade användare via en smartphoneapplikation, förstår deras preferenser och ger personlig support via en adapter.

Den är självutbildad med tusentals offentliga turismvideor från seende turister, vilket är fördelaktigt för att effektivt minska estetisk fördom.

Viptour-systemet har också alternativ för att spela in, spara och dela upplevelser, underlätta känslomässig kommunikation mellan synskadade och främja utbyte av kunskap och erfarenheter i deras sociala nätverk.

Viptours tekniska innovation ligger i dess Multi-T Focus Focusformer-nätverk. Det här tillvägagångssättet använder ett undernätverk i bakgrunden för att filtrera bort föremål som ofta ses, ett undernätverk för attraktion för att identifiera höjdpunkter, ett undernätverk för att upptäcka nya funktioner och ett undernätverk som tränats i undersökningar gjorda med synskadade deltagare. Dessa undernätverk kombineras för att välja, rangordna och presentera den mest relevanta informationen för varje användare.

Viptour-systemet använder också en Blv-in-the-Loop-adapter som uppdaterar sina rekommendationer i realtid baserat på individuella användarmått som "gillar" och "ogillar", vilket möjliggör anpassning.

Användarnas åsikt om Viptour

Viptour-systemet testades på 33 personer med blindhet eller synnedsättning, och självrapporterade känslomässiga upplevelser samlades in för analys.

När det gäller assisterande prestanda fann studien att Viptour-systemet var effektivt för att hjälpa synskadade individer att aktivt utforska och grundligt förstå okända miljöer, ge dem korrekta och långvariga minnen och gjorde det möjligt för dem att kommunicera med sina kollegor.

Genom detaljerad analys av självrapporterade upplevelser fann studien att deltagare som använde Viptour framgångsrikt uppnådde en 67,9 % ökning av positiv emotionell respons, en 94,7 % ökning av upphetsning, en 772,73 % ökning av kognitiv kartläggningsnoggrannhet och en 200 % ökning av långtidsminnesbevarande.

I användarutvärderingar var Viptour-systemets användbarhetspoäng genomgående över 80 av 100, jämförbara med eller bättre än andra hjälpmedel för synskadade.

Fysiologiska mätningar, inklusive elektrodermal aktivitet och hjärtfrekvensvariabilitet, visade signifikanta förbättringar med Viptour-användning, vilket tyder på förbättrat känslomässigt engagemang.

Undersök betydelse

Studien belyser den potentiella användningen av det AI-drivna Viptour-systemet för att ge en trevlig och minnesvärd upplevelse för synskadade samtidigt som de aktivt utforskar okända miljöer. Dessa upplevelser kan avsevärt förbättra deras känslomässiga tillstånd och förbättra deras övergripande livskvalitet.

Befintliga bevis tyder på att presentation av organiserad och engagerande information kan förbättra en persons njutning och underlätta djupare minnesretention. Människor tenderar att bearbeta välstrukturerad och meningsfull information, vilket gör deras upplevelser roligare och mer minnesvärda.

Denna mänskliga tendens kan förklaras med begreppet kognitiv flyt, som indikerar att tydlig och organiserad informationspresentation minskar kognitiv belastning hos individer. Det hjälper dem sedan att kanalisera mentala resurser för att förstå och integrera innehållet. Denna förbättrade bearbetningsförmåga leder till ett positivt svar eftersom människor uppfattar informationen på ett trevligare sätt.

Dessutom påverkar interaktionen mellan ny och välbekant information effekten av organiserad och intressant information på minnet. Ny information stimulerar nyfikenhet och förbättrar uppmärksamheten, medan välbekant information ger kognitiv komfort och koherens.

Att presentera informationen på ett strukturerat och engagerande sätt kan balansera nyhet och förtrogenhet, vilket hjälper till att upprätthålla individens intresse och engagemang.

Focusformers självkontrollerade utbildning med tusentals omärkta offentliga turismvideor fångade effektivt kognitiva språkkunskaper och avslöjade de statistiska sambanden mellan olika koncept i turistscener. Detta tillvägagångssätt eliminerar potentiell fördom i märkning av turpreferenser och tränar modellen att endast extrahera relevant kontextuell information.

Dessa personliga designöverväganden från Focusformer har gjort det möjligt för Viptour-systemet att framgångsrikt modellera önskade kognitiva språkkunskaper, och därigenom förbättra turistupplevelsen för synskadade individer.

Det är värt att notera att Viptours inverkan beror på kvaliteten på dess underliggande AI-tekniker som objektigenkänning och semantisk grafgenerering. Framtida förbättringar av dessa metoder kan ytterligare förbättra systemets prestanda.

Ladda ner din PDF-kopia nu!


Källor:

Journal reference:
  • Lin H. 2025. AI system facilitates people with blindness and low vision in interpreting and experiencing unfamiliar environments. NPJ Artificial Intelligence. https://doi.org/10.1038/s44387-025-00006-w  https://www.nature.com/articles/s44387-025-00006-w