主要導航

電子學習通訊

 

主頁 > 電子學習通訊 > 電子學習通訊內容

指點迷津的千里眼 - 微軟的 Seeing AI

撰文﹕顏東鋒(香港失明人協進會資訊科技主任)

指點迷津的千里眼 - 微軟的 Seeing AI

近年來,不少科技公司都著力在不同的範疇運用人工智能技術,讓電腦像人類一樣認知世界。透過無限的擴充性,加上極快的速度,電腦能夠解決特定的問題。「電腦視覺」(Computer Vision)就運用了大量影像作深度學習,讓電腦透過攝像機鏡頭看懂世界。

微軟公司在今年七月初推出了一個專為視障人士而設計,名為 Seeing AI 的流動應用程式。顧明思意,它是一個應用人工智能技術的應用程式,透過智能電話的鏡頭來協助視障人士觀看世界。

現在,就讓筆者來介紹一下這個應用程式與電子學習相關的功能,看看它是否可以幫助讀者解決一些在學習上所遇到的困難。

1. Short Text (閱讀簡短文字):這是一個實時辨識文字的功能,只要把鏡頭對準文字,程式就會立刻透過讀屏軟件讀出來。除了可用它來閱讀信封上的姓名地址,我們還可用它來尋找門牌或房間號碼。

2. Document (辨識文件內容):與其它 OCR 程式一樣,用者需要對準文件拍攝,才會獲得理想效果。只要文件與周圍環境有一定的顏色對比,Seeing AI 便會告知鏡頭有否看到文件內容。當文件四邊都落在拍攝範圍內,程式就會拍攝文件,並傳送至雲端進行文字辨識。雖然 Seeing AI 暫時只有英文版本,它的介面都只提供英文內容。但唯一例外的就是這個 OCR 功能。因此,無論你的文件包含了中、英、日、韓等多國文字, Seeing AI 都可以辨認得到。跟據筆者的測試,它的辨識準確度也較其它流動 OCR 程式為佳。

由此可見,當電腦視覺的技術越趨成熟,視障人士就越能掌握身處環境的資訊,從而使得生活越見獨立。這個程式暫時只提供 iOS 版本,有興趣的讀者可以在蘋果的 App Store 內,搜尋 Seeing AI 並下載來試試吧﹗