2月2日消息,國內(nèi)人工智能圈最近發(fā)生了一件事,改變了國內(nèi)1700多萬視障人士的生活。QQ空間獨(dú)立版7.7安卓版日前正式上線,融入騰訊AILab提供的"圖像描述生成"技術(shù),讓視障用戶也可以“看到圖片”。比如,一張海邊夕陽的圖片。AI識(shí)別后,讀屏軟件會(huì)讀出:夕陽下的天空。
“這不僅僅讓視障者能夠更好、更廣泛、更深入地參與互聯(lián)網(wǎng)社交,更是利用AI技術(shù)落地信息無障礙的一個(gè)經(jīng)典案例?!毙畔o障礙研究會(huì)技術(shù)主管同時(shí)也是視障人士的劉彪說。
人工智能:信息無障礙的利器
QQ空間的“圖片描述”功能對(duì)于普通人來說,可能只是提供了一種趣味性。但是,對(duì)于1700多萬視障人士來說,這是一個(gè)值得被記住的信息無障礙進(jìn)程。
使用安卓手機(jī)的用戶,只要打開手機(jī)里的“系統(tǒng)設(shè)置-輔助功能-開TalkBack功能”,隨后打開最新版QQ空間APP就能體驗(yàn)這一最新科技應(yīng)用。
在以往,哪怕開啟了手機(jī)讀屏功能,視障用戶也只能知道別人在空間里發(fā)了圖片,而并不知道圖片具體是什么內(nèi)容。如今,有AI做他們的“翻譯器”,用一位視障用戶的話來說,那就是:我們終于可以和明眼人一樣“看”圖片了。
海外社交網(wǎng)站Facebook此前也推出了與QQ空間“圖片描述”相似的功能,以輔助視障用戶無障礙地訪問網(wǎng)站,更好地參與互聯(lián)網(wǎng)社交。
一位視障用戶說:QQ空間的“圖片描述”功能,比Facebook體驗(yàn)還更好一些,因?yàn)镕acebook提供的圖片描述是詞匯的組合,而QQ空間“圖片描述”可以實(shí)現(xiàn)看圖造句的功能。
試想,“一個(gè)女孩站在海邊”的描述,是不是比“女孩,大海,藍(lán)天”這樣的詞匯堆疊,更有畫面感?
前年,阿法狗人工智能打敗眾多世界頂級(jí)圍棋選手的事件,一度成為科技界的一條導(dǎo)火線,引發(fā)整個(gè)人類社會(huì)恐被人工智能取代的危機(jī)感。世界排名前列的中國圍棋選手柯潔也承認(rèn):騰訊研發(fā)的AI“絕藝”1年的深度學(xué)習(xí),已經(jīng)超過他13年全職投入所積累的經(jīng)驗(yàn)。
人工智能的確在圍棋等策略游戲上碾壓了大多數(shù)人。如果僅僅看到“碾壓”的部分,恐怕你會(huì)喪失對(duì)人工智能發(fā)展的想象力——機(jī)器和算法的出現(xiàn),首先是為了輔助、延伸人類本身的能力。所以說,人工智能將成為信息無障礙的利器。
QQ空間的“圖片描述”功能是由騰訊AILab提供,其自主研發(fā)的強(qiáng)化學(xué)習(xí)算法在國際頂級(jí)大賽MSCOCO的該類別挑戰(zhàn)賽上排名第一,超越微軟和谷歌等公司。
QQ空間也是國內(nèi)率先將人工智能應(yīng)用在信息無障礙領(lǐng)域的社交產(chǎn)品。
QQ空間與信息無障礙
2009年,騰訊內(nèi)部的多款產(chǎn)品便開始關(guān)注和推進(jìn)信息無障礙。
QQ空間團(tuán)隊(duì)與信息無障礙研究會(huì)一直保持著長期穩(wěn)定合作。因?yàn)樾畔o障礙研究會(huì)有部分工程師就是視障人士,所以在工作對(duì)接和日常溝通過程中,除了基礎(chǔ)的無障礙優(yōu)化,雙方還會(huì)主動(dòng)探討信息無障礙的各種可能性。
QQ空間的“圖片描述”功能的靈感,就來源于與信息無障礙研究會(huì)的一次日常探討,工程師提出的建議。
在“圖片描述”功能測(cè)試階段,信息無障礙研究會(huì)還協(xié)助QQ空間團(tuán)隊(duì),尋找大量外部視障用戶進(jìn)行體驗(yàn)收集反饋,用于打磨優(yōu)化產(chǎn)品。其中有用戶率先體驗(yàn)到這一功能時(shí),提到他激動(dòng)的心情:
上學(xué)時(shí),較長的假期如暑假寒假都會(huì)去新西蘭呆一段時(shí)間,給我印象最為深刻的互聯(lián)網(wǎng)社交體驗(yàn)就是臉書(Facebook)的圖片簡(jiǎn)述。在國內(nèi)一直以來都沒有任何社交應(yīng)用擁有過類似功能。一些有考慮無障礙優(yōu)化的產(chǎn)品,會(huì)多讀一個(gè)“圖片”,而大多數(shù)產(chǎn)品完全沒有考慮無障礙優(yōu)化的,干脆連有沒有配圖都無法獲知。
作為最大的社交巨頭,QQ空間沒有忘記我們這群用戶,在我首度拿到帶有圖片場(chǎng)景描述的版本時(shí),頓時(shí)就有些熱淚盈眶的感覺。
眾所周知,人類80%以上的信息來自視覺,對(duì)于視障者,僅能通過聽覺、觸覺等非視覺感官來努力認(rèn)知這個(gè)世界、獲取信息。所以我們可以理解,當(dāng)視障用戶可以靠科技獲得“視覺”,他們表現(xiàn)得如此興奮。
一位體驗(yàn)了QQ空間圖片描述功能的視障用戶評(píng)論說:醫(yī)學(xué)不能讓我們復(fù)明,但或許科技可以。
AI技術(shù)落地信息無障礙的經(jīng)典案例
這次,QQ空間借助AI技術(shù),為圖片自動(dòng)添加描述文本,能夠讓視障者通過讀屏軟件,以聽覺(讀屏軟件)、觸覺(點(diǎn)顯器)等感官了解圖片內(nèi)容,在QQ空間這個(gè)社交場(chǎng)景實(shí)現(xiàn)了圖片信息的多重感官的傳遞,對(duì)于信息無障礙的發(fā)展有著重要的意義。
國內(nèi)的信息無障礙優(yōu)化,通常限于軟件對(duì)于讀屏軟件兼容性的優(yōu)化,這次QQ空間團(tuán)隊(duì)利用人工智能技術(shù)升級(jí)產(chǎn)品體驗(yàn),讓各界人士看到了科技賦予更多信息無障礙的可能性。
“這不僅僅讓視障者能夠更好、更廣泛、更深入地參與互聯(lián)網(wǎng)社交,更是利用AI技術(shù)落地信息無障礙的一個(gè)經(jīng)典案例?!?,信息無障礙研究會(huì)技術(shù)主管同時(shí)也是視障人士的劉彪說。
相信QQ空間這一舉動(dòng),將帶動(dòng)AI技術(shù)在信息無障礙領(lǐng)域,在消除信息鴻溝方面的廣泛深入的應(yīng)用?!皼]有殘障的人,只有殘障的科技,希望所有人都能平等享受信息價(jià)值?!?/p>