hell leuchtendes iPad

KI-Apps für Blinde

von Felix Heilmann

In den letzten Jahren hat die Entwicklung der sogenannten “Künstlichen Intelligenz” (KI, engl.: Artificial Intelligence (AI)) rapide Fortschritte gemacht und das Forschungsgebiet ist so beliebt wie nie. Es geht hierbei immer darum, dass menschliches Denken und Lernen auf Computersysteme übertragen werden soll, damit diese nach Trainingsphasen selbstständig Probleme lösen können. So ist dann irgendwann keine extra Programmierung für neue Arten von Aufgaben mehr notwendig. Auch in Bezug auf Inklusion und Barrierefreiheit werden Systeme mit Künstlicher Intelligenz vermehrt als Assistive Technologie eingesetzt. 

Die Apps Seeing AI (Apple Store ab iOS 10.0) und Supersense – AI for Blind (Apple Store ab iOS 11.0; Google Play Store ab Android 6.0) setzen auf eben diese KI, um Menschen mit Sehbehinderung den Alltag zu erleichtern. Die jeweilige KI ist darauf trainiert kurze Texte, Dokumente und Währungen, aber auch Barcodes oder Farben zu erkennen und den Anwender:innen vorzulesen bzw. die sich dahinter versteckenden Informationen akustisch auszugeben. Im Folgenden möchte ich die Gemeinsamkeiten und Unterschiede der beiden Apps genauer beleuchten. 

Hinweis: Supersense – AI for Blind hat leicht unterschiedliche Funktionen in den zwei Versionen auf iOS und Android, dieser Tool-Tipp bezieht sich lediglich auf die iOS-Version.

Funktionen

Seeing AI wurde von Microsoft entwickelt und bietet weitaus mehr als das Erkennen und Vorlesen von Text. Zwischen den einzelnen Funktionen oder auch Modi kann bequem über eine Leiste am unteren Rand gewechselt werden. Zwei Modi beschäftigen sich aber mit Text. Zum einen die Funktion “Kurzer Text”, mit der jegliche Form von Text vorgelesen wird, die von der Kamera erkannt wird. Zum Anderen die Funktion “Dokument”, bei der die App beim Erkennen eines Dokumentes Anweisungen gibt, wann das Dokument vollständig von der Kamera erfasst wird. Sobald das Gerät still gehalten wird, macht Seeing AI ein Foto und gibt den Text aus. In diesem kann auch mit VoiceOver navigiert werden. Außerdem kann das Ergebnis als Bild oder Text exportiert werden. Für beide Modi sollte die Sprache vorher eingestellt werden. Das geht über einen Button unten rechts. Es werden 19 Sprachen unterstützt. Wie gesagt gibt es aber deutlich mehr Funktionen, so können zum Beispiel Barcodes und Geldscheine erkannt werden. Im Fall der Barcodes wird der Name des Produktes vorgelesen, mit einem schneller werdenden Biep-Ton wird der Nutzer zum Barcode geführt. Die App erkennt die Banknoten sechs verschiedener Währungen, darunter Euro, britische Pfund und US Dollar. Mit der interessanteste Modus ist “Person”, da die KI hier für Gesichtserkennung und -erinnerung verwendet wird. Werden eine oder mehrere Personen erkannt, gibt die App dies und die ungefähre Entfernung zur Kamera wieder. Es kann auch in diesem Modus für genauere Informationen ein Bild aufgenommen werden, dann schätzt Seeing AI das Alter der Person und gibt Auskunft über Geschlecht, Haarfarbe und Merkmale wie Brillen. Darüber hinaus können von einer Person mehrere Bilder mit unterschiedlichen Gesichtsausdrücken aufgenommen werden. Danach wird diese Person in der Kamera namentlich erkannt. Ein weiterer Modus beschäftigt sich mit den Lichtverhältnissen in der Umgebung. Je höher der ertönende Ton, desto mehr Licht fällt in die Kamera des Geräts. Zwei weitere Modi sind bereits einsetzbar, sind in der App aber noch als experimentell, also noch in der Testphase, bezeichnet. Dazu zählen “Szene” und “Farbe”. Letzterer ist leicht zu erklären, es geht um Farberkennung in einem bestimmten Bildausschnitt. Ersterer ist jedoch spannender. Erst muss ein Foto aufgenommen werden, dann wird versucht die Szene auf dem Bild allgemeiner zu beschreiben. Beispielsweise wird dann folgendes ausgegeben: “Mann sitzt am Tisch vor einem Laptop”. Das Potenzial dieses Modus ist groß. Eine wichtige letzte Funktion, die nicht zu den Standardmodi gehört, gibt es noch, nämlich das Importieren von Bildern aus der Fotos-App. Diese können genauer auf Objekte, Personen und Text analysiert werden. Die Qualität der Ergebnisse hängt bei allen Funktionen immer von den Lichtverhältnissen und etwas Übung ab, allerdings war es im Testen selten notwendig ein zweites Mal zu scannen oder zu analysieren. 

Grundlegend bietet Supersense – AI for Blind, welches von einem MIT-Startup entwickelt wurde, sehr ähnliche Funktionen. So ist “Quick Read” (dt. “Schnelles Lesen”) mit “Kurzer Text” gleichzusetzen, die Möglichkeit Dokumente zu scannen gibt es ebenfalls genauso. Diese beiden Funktionen sind zusammen mit einem Modus für Banknotenerkennung noch einmal zusätzlich im Modus “Smart Scanner” (dt. “Intelligenter Scanner”) zusammengefasst, dies soll zumindest für diese drei Funktionen ständiges Wechseln zwischen den Modi ersparen. Einen Barcode-Modus für das Erkennen von Produkten gibt es auch, wie groß die Datenbank dahinter ist, bleibt aber auch hier fragwürdig. Die Möglichkeit Bilder zu importieren ist auch vorhanden, diese werden aber genau wie importierbare PDFs lediglich auf Text analysiert. Zwei Modi, die Seeing AI nicht bietet, sind abschließend noch vorhanden. Zum Einen die Möglichkeit sich den Verlauf aller vom Nutzer selbst gescannten beziehungsweise vorgelesenen Texte des Tages anzusehen. Zum Anderen der sogenannte “Object Explorer” (dt. “Objekt Entdecker). Hier soll das Gerät senkrecht vor dem Körper gehalten werden. Dreht oder bewegt sich der Nutzer nun im Raum, sollen beispielsweise Türen, Personen und Gegenstände angesagt werden, was zu einer grundlegenden Orientierung im Raum beitragen soll. Diese Funktion ist noch nicht komplett ausgereift, funktioniert aber ähnlich gut wie der Szene-Modus von Seeing AI.

Nutzung mit VoiceOver

Durch den Umstand, dass beide Apps als Hauptzielgruppe Blinde und Menschen mit Sehbehinderungen ansprechen und diese unterstützen wollen, sollte die gute Zusammenarbeit mit VoiceOver eigentlich selbstverständlich sein. Wenn sich die Apps nicht oder nur schlecht mit Apples hauseigenem Screenreader bedienen lassen, wäre das fatal. Seeing AI macht hier alles richtig. Alle Bedienelemente sind so programmiert und bezeichnet, dass mit VoiceOver problemlos durch sie navigiert werden kann. Der Moduswechsel geht leicht von der Hand und in den Ergebnissen lässt es sich ebenfalls leicht zurechtfinden. 

Bei Supersense ist es anders. Zwar sind auch hier alle Buttons und Menüs ausreichend für VoiceOver gekennzeichnet, allerdings überlappen sich die VoiceOver- und die Supersense-Sprachausgabe ständig. Die Verständlichkeit leidet darunter. Es ist daher fragwürdig, ob die App für die Zielgruppe überhaupt praktisch ist. Hinzu kommt für deutschsprachige Nutzer:innen, dass die Bezeichnungen der Benutzeroberfläche komplett auf Englisch sind. Das ist schade, da Ergebnisse sehr wohl auf deutsch wiedergegeben werden können. Infolgedessen ist die Navigation unnötig schwerfällig.

Preismodelle und Fazit

Seeing AI ist mit allen Funktionen kostenlos nutzbar. Supersense hingegen hat ein Abo-Modell mit entweder monatlichen, jährlichen oder einmaligen Kosten, bei denen man die Premiumfunktionen auf Lebenszeit nutzen kann. Die Lizenz auf Lebenszeit kostet 109,99 Euro, ein monatliches Abonnement jeweils 4,49 Euro. 

Abschließend lässt sich sagen, dass es beeindruckend ist, wie weit die Forschung an künstlicher Intelligenz aktuell ist. Diese Art von Apps, zu denen Seeing AI und Supersense – AI for Blind gehören, stellen eine umfangreiche Assistive Technologie für Blinde und Menschen mit Sehbehinderungen dar. Natürlich hängt es von diversen Faktoren, wie beispielsweise den Lichtverhältnissen und der Kameraqualität, ab, wie gut die Ergebnisse im Einzelnen ausfallen, ich bin mir aber sicher, dass sich diese Technologien in der Zukunft noch weiter verbessern werden. Im Vergleich der beiden vorgestellten Apps gewinnt Seeing AI für mich. Die Gründe dafür liegen vor Allem in der besseren Bedienung mit VoiceOver und den in der Summe leicht besseren Ergebnissen. Aktuell lohnt es sich noch nicht Geld für Supersense auszugeben, vielleicht ändert sich das irgendwann.