今年的博鰲亞洲論壇正在進行中,來自全球上百個國家的嘉賓齊聚博鰲鎮(zhèn),用不同的語言討論經(jīng)濟、、文化等重大議題。在這屆論壇上,除了傳統(tǒng)的同聲傳譯員外,部分現(xiàn)場還額外配備了人工智能翻譯。嘉賓演講時,翻譯系統(tǒng)會實時捕捉發(fā)言內(nèi)容,并以中英雙語的方式投影在大屏幕上,展示給聽眾。
這是博鰲論壇創(chuàng)辦17年來第一次采用人工智能同傳技術(shù)。不過,這個方案并不是來自于搜狗、百度或者科大訊飛這些已經(jīng)有過技術(shù)公開展示的公司,而是來自于此前在語音技術(shù)上曝光率較低的騰訊。
據(jù)界面新聞記者了解,這次博鰲論壇上使用的,是騰訊在2017年所推出的“騰訊同傳”服務(wù)。騰訊和博鰲論壇主辦方溝通了3個月,才戰(zhàn)勝其他服務(wù)供應(yīng)商,獲得這次機會。
騰訊同傳由兩部分服務(wù)組成,分別是“騰訊翻譯君”和“微信智聆”。騰訊翻譯君在2016年11月正式上線,是一款由人工智能技術(shù)驅(qū)動的、面向消費端的翻譯產(chǎn)品,常規(guī)功能包括15種語言的文本翻譯、語音翻譯和拍照翻譯等,目前已經(jīng)推出了網(wǎng)頁版、App和小程序以供用戶使用。
微信智聆則是微信團隊打造的一款語音識別技術(shù),2017年11月正式對外推出,我們?nèi)粘J褂玫奈⑿耪Z音轉(zhuǎn)文字功能就是微信智聆提供的。
在論壇上,微信智聆負責把演講嘉賓的語音識別為文字,騰訊翻譯君再把文本翻譯成目標語言,最終通過語音合成進行播報,形成同傳的翻譯效果。
和其他翻譯服務(wù)相比,騰訊同傳的一大優(yōu)勢是海量數(shù)據(jù)積累。據(jù)騰訊方面透露,目前騰訊翻譯君每天收到翻譯請求次數(shù)超過4億次,其能力已經(jīng)輸送到社交、硬件等等領(lǐng)域。
騰訊同傳已經(jīng)在騰訊內(nèi)部活動上廣泛應(yīng)用,例如2017年11月舉行的騰訊媒體+峰會上,騰訊COO任宇昕的演講內(nèi)容就通過這項服務(wù),以中英雙語的方式實時展現(xiàn);同時,騰訊旗下的機器人寫作工具Dreamwriter還把他的演講內(nèi)容實時編寫成文字,對外發(fā)布。
不過,在以往的場景中,騰訊同傳面對的翻譯內(nèi)容相對固定,難度較小。這次在博鰲論壇亮相,是騰訊同傳第一次見識“大場面”,而從臨場效果來看,騰訊同傳還有點兒嫩。昨天下午就有網(wǎng)友在微博上指出其部分錯誤,例如詞匯重復、短語誤用等等。
“博鰲論壇和其他活動的不同點在于,活動規(guī)格高,演講者的語種變化多、專業(yè)方向多、發(fā)言人數(shù)多,而且形式以討論為主?!彬v訊翻譯君負責人李學朝說。這些因素都為騰訊同傳帶來了一定的挑戰(zhàn)。
李學朝對界面新聞表示,此前的數(shù)據(jù)顯示,騰訊同傳在會議現(xiàn)場的平均語音識別準確率可達97%,翻譯可接受度超過92%;但由于論壇上有各種語料知識、專業(yè)名詞、五湖四海的英語流派,再加上話筒噪聲、回聲等環(huán)境音的干擾,騰訊同傳確實面臨較大挑戰(zhàn)。
總之,從現(xiàn)在的情況來看,騰訊同傳還需要繼續(xù)積累數(shù)據(jù)、不斷訓練,從而提升技術(shù)體驗。
李學朝告訴界面新聞,目前騰訊同傳主要面向企業(yè)端,以積累數(shù)據(jù)、優(yōu)化服務(wù)為主,暫時不以營利為短期目標。
他認為,從目前的使用效果來看,機器翻譯與人工翻譯各有其擅長的應(yīng)用場景和服務(wù)。比如,機器翻譯可以每天提供億級翻譯次數(shù)、有對新領(lǐng)域的定制術(shù)語快速掌握的能力,這是人工翻譯難以復制的;而翻譯員所能整合的人際了解、模糊語義的掌握等,這些是機器翻譯短期內(nèi)不容易達到的。
目前,隨著大型語料庫的出現(xiàn)和技術(shù)的成熟,越來越多的公司都已經(jīng)推出了相關(guān)的機器翻譯產(chǎn)品或服務(wù)。從現(xiàn)在的趨勢來看,如果機器翻譯和人工翻譯真的能夠形成互補的話,同傳人員在未來的幾年內(nèi)的工作也許會越來越輕松了。