國際

復旦大學研發AI大模型 助視障者“看見”世界

(上海3日綜合電)在上海復旦大學自然語言處理實驗室師生的努力下,基於多模態大模型“複旦·眸思”為視障者量身打造的“聽見世界”App近日上線,成為視障人士的生活助手與智能管家。

綜合中新社、澎湃新聞等陸媒報道,去年上半年,復旦大學自然語言處理實驗室發布了開發MOSS對話式大型語言模型,被稱為中國版的GPT,僅用半年時間多模態模型“眸思”問世。據介紹,“眸思”和基於文本的MOSS不同,它能夠理解並識別圖片內容,致力於成為視障者的一雙“眸”。

Advertisement

基於“眸思”,“聽見世界”App為視障者日常生活需求量身打造街道行走模式、自由問答模式和尋物模式。

在街道行走模式中,“眸思”如向導一般,能細致掃描紅綠燈、十字路口、障礙物等道路情況,提示潛在風險,陪伴視障者安全通行“看不見”的道路;在自由問答模式中,“眸思”可以在博物館、藝術館、公園等場景內,捕捉四周的每個細節,用聲音構建豐富的生活場景;在尋物模式中,“眸思”則成為一名可靠的管家,讓視障人士找尋日常物件變得輕松。

復旦大學自然語言實驗室張奇教授表示,人工智能發展日新月異,科技應改變更多人的生活,希望“眸思”能夠幫助視障人士走出家門,讓他們可以嘗試更多工作,為人生書寫更多可能。

數據顯示,中國視障人群總量約有1700多萬人。

ADVERTISEMENT
Tags
你也可能感兴趣...