AI verändert Sightseeing für sehbehinderte Benutzer

Durchbruch verändert die Art und Weise, wie Menschen mit Sehbehinderungen die Welt erleben und ihnen Werkzeuge geben, um die Schönheit unbekannter Orte wie nie zuvor zu entdecken, zu verstehen und zu erfahren.
Studie: Das KI -System erleichtert Menschen mit Blindheit und geringem Sehen bei der Interpretation und Erleben unbekannter Umgebungen. Bildnachweis: Angel Santana Garcia/Shutterstock.com
Ein Team von Forschern aus China entwickelte ein System für künstliche Intelligenz (KI), das möglicherweise sehbehinderte Personen dazu beitragen kann, nicht vertraute Umgebungen zu erforschen, zu verstehen und zu genießen. Die Studie wird in der veröffentlicht Nature Portfolio Journal Künstliche Intelligenz.
Hintergrund
Die Erforschung natürlicher Umgebungen wie Parks hat einen signifikanten positiven Einfluss auf die körperliche und psychische Gesundheit. Menschen mit geringem Sehen oder Blindheit werden jedoch häufig von diesen Vorteilen ausgeschlossen, da angemessene Hilfsmittel nicht verfügbar sind, um sie proaktiv mit ihnen in Kontakt zu treten.
Bestehende assistive Lösungen, die entwickelt wurden, um sehbehinderte Personen zu leiten, konzentrieren sich hauptsächlich auf die Bereitstellung von funktionaler Unterstützung wie Navigation und Hindernisvermeidung und ermöglichen es ihnen, sich passiv mit der Natur zu beschäftigen.
Sehbehinderte Personen fühlen sich oft hilflos, während sie unbekannte Umgebungen erforschen. Dies bedeutet normalerweise, dass sie sich auf Familienmitglieder, Freunde oder Freiwillige verlassen, um Unterstützung zu erhalten, was ihre Fähigkeit beeinträchtigt, ungewohnte Umgebungen aktiv zu erforschen und zu verstehen, sowie sich daran zu erinnern und mit anderen sehbehinderten Personen über ihre Reise zu kommunizieren.
Ein Team von Forschern in China entwickelte ein KI-gesteuertes System namens Viptour, um sehbehinderte Personen ein Gefühl der Unabhängigkeit in unbekannten Umgebungen zu bieten.
Wie funktioniert Viptour?
Viptour ist ein KI-gesteuerter System, das eine Reihe von leichten, tragbaren, konsumentenqualitativen Geräten (eine Kamera und ein Smartphone) und ein neuartiges Tief-Learning-Algorithmus-Netzwerk namens Focusformer enthält. Effiziente multisensorische Interaktionstechniken wie Audio- und hierarchische taktile Interaktion steigern die Interaktion zwischen sehbehinderten Benutzern und dem Viptour -System.
Focusformer berücksichtigt Ästhetik, Frische (Neuheit) und Grundbedürfnisse (einschließlich Navigation und Sicherheit) als Hauptfaktoren, um aussagekräftige Informationen aus komplexen, unbekannten Umgebungen zu extrahieren und redundante visuelle Details auszuschließen. Dies reduziert die kognitive Last bei sehbehinderten Benutzern.
Focusformer verwandelt große Mengen an Informationen in ein strukturiertes, spärliches und hierarchisches personalisiertes Diagramm. Basierend auf diesem gut strukturierten Diagramm interagiert Focusformer mit sehbehinderten Benutzern durch eine Smartphone-Anwendung, versteht ihre Vorlieben und bietet durch einen Adapter eine personalisierte Unterstützung.
Es ist auf selbstsagende Weise mit Tausenden von öffentlichen Tourismusvideos von gesichteten Touristen ausgebildet, was für die wirksame Verringerung der ästhetischen Vorurteile von Vorteil ist.
Das Viptour -System verfügt auch über Optionen zum Aufzeichnen, Speichern und Austausch von Erfahrungen, die emotionale Kommunikation zwischen visuell beeinträchtigten Personen und die Förderung des Austauschs von Wissen und Erfahrungen in ihren sozialen Netzwerken.
Die technische Innovation von Viptours liegt in seinem Multi-T-Focus-Focusformer-Netzwerk. Dieser Ansatz verwendet ein Hintergrund -Subnetzwerk, um häufig gesehene Objekte herauszufiltern, ein Attraktionssubnetz, um Highlights zu identifizieren, ein Subnetzwerk für Frische, um neuartige Funktionen zu entdecken, und ein Subnetzbedarf, das auf Umfragen ausgebildet ist, die mit visuell beeinträchtigten Teilnehmern durchgeführt werden. Diese Subnetzwerke kombinieren sich, um jeden Benutzer die relevantesten Informationen auszuwählen, zu rangieren und zu präsentieren.
Das Viptour-System verwendet außerdem einen Blv-in-the-Loop-Adapter, der seine Empfehlungen in Echtzeit basierend auf individuellen Benutzerkennzahlungen wie „Likes“ und „Abneigungen“ aktualisiert, wodurch die Personalisierung ermöglicht wird.
Benutzungsmeinung zu Viptour
Das Viptour-System wurde an 33 Personen mit Blindheit oder Sehbehinderung getestet, und zur Analyse wurden selbst berichtete emotionale Erfahrungen gesammelt.
In Bezug auf die assistive Leistung ergab die Studie, dass das Viptour-System effektiv dazu beigetragen hat, dass visuell beeinträchtigte Personen unbekannte Umgebungen aktiv erforscht und gründlich verstehen, sie durch genaue und lang anhaltende Erinnerungen befähigten und sie ermöglichten, mit ihren Kollegen zu kommunizieren.
Durch die ausführliche Analyse selbst berichteter Erfahrungen stellte die Studie fest, dass die Teilnehmer, die Viptour verwendeten, erfolgreich einen Anstieg der positiven emotionalen Reaktion um 67,9%, eine Erregung um 94,7%, eine Erhöhung der kognitiven Kartierungsgenauigkeit um 772,73% und eine Erhöhung der Langzeitgedächtniserakkuration um 200% erzielten.
Bei Benutzerauswertungen lagen die Usability -Scores des Viptour -Systems konsistent über 80 von 100, vergleichbar mit oder besser als die anderer Hilfsmittel für sehbehinderte Personen.
Physiologische Maßnahmen, einschließlich elektrodermaler Aktivität und Herzfrequenzvariabilität, zeigten signifikante Verbesserungen bei der Verwendung von Viptour, was auf ein verbessertes emotionales Engagement hinweist.
Signifikanz untersuchen
Die Studie unterstreicht die potenzielle Verwendungszwecke des KI-gesteuerten Viptour-Systems bei der Bereitstellung eines angenehmen und unvergesslichen Erlebnisses von Sehbehinderten und gleichzeitig aktiv ungewohnte Umgebungen. Diese Erfahrungen können ihren emotionalen Zustand erheblich verbessern und ihre allgemeine Lebensqualität verbessern.
Bestehende Nachweise deuten darauf hin, dass die Präsentation von organisierten und ansprechenden Informationen das Vergnügen einer Person verbessern und eine tiefere Gedächtnisbindung erleichtern kann. Menschen neigen dazu, gut strukturierte und sinnvolle Informationen zu verarbeiten, was ihre Erfahrungen angenehmer und unvergesslicher macht.
Diese menschliche Tendenz kann durch das Konzept der kognitiven Flüssigkeit erklärt werden, was darauf hinweist, dass eine klare und organisierte Informationspräsentation die kognitive Belastung bei Individuen verringert. Anschließend hilft ihnen, mentale Ressourcen zum Verständnis und der Integration des Inhalts zu kanalisieren. Diese verbesserte Verarbeitungsfluenz führt zu einer positiven Reaktion, da die Personen die Informationen angenehmer wahrnehmen.
Darüber hinaus beeinflusst die Interaktion zwischen neuartigen und vertrauten Informationen die Auswirkung organisierter und interessanter Informationen zum Gedächtnis. Neuartige Informationen wecken die Neugier und verbessern die Aufmerksamkeit, während vertraute Informationen kognitive Komfort und Kohärenz bieten.
Die Präsentation der Informationen auf strukturierte und ansprechende Weise kann Neuheit und Vertrautheit in Einklang bringen, was dazu beiträgt, das Interesse und das Engagement des Einzelnen aufrechtzuerhalten.
Die selbstüberwachende Ausbildung von Focusformer mit Tausenden von nicht markierten öffentlichen Tourismusvideos hat die kognitive Sprachkenntnisse effektiv erfasst und die statistischen Beziehungen zwischen verschiedenen Konzepten in Tourismusszenen enthüllt. Dieser Ansatz beseitigt potenzielle Verzerrungen bei der Kennzeichnung der Tourpräferenz und trainiert das Modell, um nur relevante Kontextinformationen zu extrahieren.
Diese personalisierten Konstruktionsüberlegungen von Focusformer haben es dem Viptour -System ermöglicht, die gewünschte kognitive Sprachkenntnisse erfolgreich zu modellieren, wodurch das Tourismuserlebnis für sehbehinderte Personen verbessert wird.
Es ist erwähnenswert, dass der Einfluss von Viptour von der Qualität der zugrunde liegenden KI -Techniken wie Objekterkennung und semantischer Diagrammerzeugung abhängt. Zukünftige Verbesserungen dieser Methoden könnten die Leistung des Systems weiter verbessern.
Laden Sie jetzt Ihre PDF -Kopie herunter!
Quellen:
- Lin H. 2025. AI system facilitates people with blindness and low vision in interpreting and experiencing unfamiliar environments. NPJ Artificial Intelligence. https://doi.org/10.1038/s44387-025-00006-w https://www.nature.com/articles/s44387-025-00006-w