Umělá inteligence mění prohlídku památek pro zrakově postižené uživatele

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Průlom mění způsob, jakým lidé se zrakovým postižením prožívají svět, a dává jim nástroje k objevování, pochopení a prožívání krásy neznámých míst jako nikdy předtím. Studie: Systém umělé inteligence usnadňuje lidem se slepotou a slabozrakým interpretaci a zažívání neznámého prostředí. Obrazový kredit: Angel Santana Garcia/Shutterstock.com Tým výzkumníků z Číny vyvinul systém umělé inteligence (AI), který může pomoci lidem se zrakovým postižením objevovat, chápat a užívat si neznámá prostředí. Studie je publikována v Nature Portfolio Journal Artificial Intelligence. Pozadí Studium přírodního prostředí...

Umělá inteligence mění prohlídku památek pro zrakově postižené uživatele

Průlom mění způsob, jakým lidé se zrakovým postižením prožívají svět, a dává jim nástroje k objevování, pochopení a prožívání krásy neznámých míst jako nikdy předtím.

Studie: Systém umělé inteligence usnadňuje lidem se slepotou a slabozrakým interpretaci a zažívání neznámého prostředí. Fotografický kredit: Angel Santana Garcia/Shutterstock.com

Tým výzkumníků z Číny vyvinul systém umělé inteligence (AI), který může pomoci lidem se zrakovým postižením objevovat, chápat a užívat si neznámá prostředí. Studie je zveřejněna vNature Portfolio Journal Artificial Intelligence.

pozadí

Průzkum přírodního prostředí, jako jsou parky, má významný pozitivní dopad na fyzické a duševní zdraví. Lidé se slabým zrakem nebo nevidomí jsou však často z těchto výhod vyloučeni, protože nejsou k dispozici adekvátní nástroje, jak se s nimi proaktivně zapojit.

Stávající asistenční řešení určená k vedení zrakově postižených jedinců se zaměřují především na poskytování funkční podpory, jako je navigace a vyhýbání se překážkám, což jim umožňuje pasivně se zapojit do přírody.

Zrakově postižení lidé se často cítí bezmocní, když prozkoumávají neznámé prostředí. To obvykle znamená, že se spoléhají na rodinné příslušníky, přátele nebo dobrovolníky při podpoře, což ovlivňuje jejich schopnost aktivně prozkoumávat neznámá prostředí a porozumět jim, stejně jako si pamatovat a komunikovat s ostatními zrakově postiženými o své cestě.

Tým výzkumníků v Číně vyvinul systém s umělou inteligencí nazvaný Viptour, který poskytuje zrakově postiženým jedincům pocit nezávislosti v neznámém prostředí.

Jak Viptour funguje?

Viptour je systém řízený umělou inteligencí, který zahrnuje řadu lehkých, přenosných zařízení pro spotřebitele (fotoaparát a smartphone) a novou síť algoritmů hlubokého učení s názvem Focusformer. Účinné techniky vícesmyslové interakce, jako je zvuk a hierarchická hmatová interakce, zvyšují interakci mezi zrakově postiženými uživateli a systémem Viptour.

Focusformer považuje estetiku, čerstvost (novinka) a základní potřeby (včetně navigace a bezpečnosti) za klíčové faktory pro extrahování smysluplných informací ze složitých, neznámých prostředí a odstranění nadbytečných vizuálních detailů. To snižuje kognitivní zátěž zrakově postižených uživatelů.

Focusformer transformuje velké množství informací do strukturovaného, ​​řídkého a hierarchického personalizovaného diagramu. Na základě tohoto dobře strukturovaného diagramu Focusformer komunikuje se zrakově postiženými uživateli prostřednictvím aplikace pro chytré telefony, rozumí jejich preferencím a poskytuje personalizovanou podporu prostřednictvím adaptéru.

Je samocvičný s tisíci veřejnými turistickými videi od vidoucích turistů, což je výhodné pro účinné snížení estetického zkreslení.

Systém Viptour má také možnosti pro záznam, ukládání a sdílení zážitků, usnadňuje emocionální komunikaci mezi zrakově postiženými lidmi a podporuje výměnu znalostí a zkušeností na jejich sociálních sítích.

Technická inovace Viptours spočívá v síti Multi-T Focus Focusformer. Tento přístup využívá podsíť na pozadí k odfiltrování často viděných objektů, přitažlivou podsíť k identifikaci vrcholů, podsíť čerstvosti k objevování nových funkcí a podsíť vyškolenou na průzkumech prováděných se zrakově postiženými účastníky. Tyto podsítě se kombinují, aby vybrali, seřadili a prezentovali nejrelevantnější informace každému uživateli.

Systém Viptour také používá adaptér Blv-in-the-Loop, který aktualizuje svá doporučení v reálném čase na základě jednotlivých uživatelských metrik, jako jsou „líbí se“ a „nelíbí se“, což umožňuje personalizaci.

Názor uživatele na Viptour

Systém Viptour byl testován na 33 lidech se slepotou nebo zrakovým postižením a pro analýzu byly shromážděny vlastní emocionální zážitky.

Pokud jde o asistenční výkon, studie zjistila, že systém Viptour byl účinný v tom, že pomáhal zrakově postiženým jedincům aktivně prozkoumávat a důkladně porozumět neznámému prostředí, poskytoval jim přesné a dlouhodobé vzpomínky a umožňoval jim komunikovat se svými kolegy.

Prostřednictvím podrobné analýzy zkušeností, které sami uvedli, studie zjistila, že účastníci, kteří používali Viptour, úspěšně dosáhli 67,9% zvýšení pozitivní emoční reakce, 94,7% zvýšení vzrušení, 772,73% zvýšení přesnosti kognitivního mapování a 200% zvýšení dlouhodobé paměti.

V uživatelských hodnoceních bylo skóre použitelnosti systému Viptour trvale nad 80 ze 100, což je srovnatelné nebo lepší než u jiných pomůcek pro zrakově postižené.

Fyziologická měření, včetně elektrodermální aktivity a variability srdeční frekvence, prokázala významná zlepšení při používání Viptour, což ukazuje na zlepšené emoční zapojení.

Prozkoumejte význam

Studie zdůrazňuje potenciální využití systému Viptour řízeného umělou inteligencí při poskytování příjemného a nezapomenutelného zážitku pro zrakově postižené při aktivním zkoumání neznámého prostředí. Tyto zážitky mohou výrazně zlepšit jejich emocionální stav a zlepšit celkovou kvalitu života.

Existující důkazy naznačují, že prezentace organizovaných a poutavých informací může zlepšit požitek člověka a usnadnit hlubší uchování paměti. Lidé mají tendenci zpracovávat dobře strukturované a smysluplné informace, díky čemuž jsou jejich zážitky příjemnější a zapamatovatelné.

Tuto lidskou tendenci lze vysvětlit konceptem kognitivní plynulosti, který naznačuje, že jasná a organizovaná prezentace informací snižuje kognitivní zátěž u jednotlivců. To jim pak pomáhá nasměrovat mentální zdroje k pochopení a integraci obsahu. Tato zlepšená plynulost zpracování vede k pozitivní reakci, protože lidé vnímají informace příjemněji.

Kromě toho interakce mezi novými a známými informacemi ovlivňuje dopad organizovaných a zajímavých informací na paměť. Nové informace stimulují zvědavost a zlepšují pozornost, zatímco známé informace poskytují kognitivní pohodlí a koherenci.

Prezentace informací strukturovaným a poutavým způsobem může vyvážit novost a známost, což pomáhá udržovat zájem a angažovanost jednotlivce.

Samokontrolované školení Focusformer s tisíci neoznačených veřejných turistických videí účinně zachytilo kognitivní jazykové znalosti a odhalilo statistické vztahy mezi různými koncepty na scénách cestovního ruchu. Tento přístup eliminuje potenciální zkreslení v označování preferencí prohlídek a trénuje model tak, aby extrahoval pouze relevantní kontextové informace.

Tyto personalizované designové úvahy od Focusformer umožnily systému Viptour úspěšně modelovat požadované kognitivní jazykové dovednosti, a tím zlepšit zážitek z turistiky pro zrakově postižené jedince.

Stojí za zmínku, že dopad Viptour závisí na kvalitě základních technik AI, jako je rozpoznávání objektů a generování sémantických grafů. Budoucí vylepšení těchto metod by mohla dále zlepšit výkon systému.

Stáhněte si svou kopii PDF nyní!


Zdroje:

Journal reference:
  • Lin H. 2025. AI system facilitates people with blindness and low vision in interpreting and experiencing unfamiliar environments. NPJ Artificial Intelligence. https://doi.org/10.1038/s44387-025-00006-w  https://www.nature.com/articles/s44387-025-00006-w