美國南加州大學(xué)的科學(xué)家們最近提出一種全新的機(jī)器翻譯方法——解碼外語。安徽譯博翻譯的小編近日獲悉:美國南加州大學(xué)的科學(xué)家們最近提出一種全新的機(jī)器翻譯方法——解碼外語??茖W(xué)家認(rèn)為這種翻譯方法今后甚至可以破譯“海豚音”或“外星人語言”。
機(jī)器翻譯,簡稱“機(jī)譯”,是利用計(jì)算機(jī)實(shí)現(xiàn)從一種自然語言(源語言)文本到另一種或多種自然語言(目標(biāo)語言)文本的翻譯;而用以翻譯的軟件叫做機(jī)譯系統(tǒng)。機(jī)譯涉及語言學(xué)、計(jì)算機(jī)科學(xué)、認(rèn)知科學(xué)、數(shù)學(xué)等多個學(xué)科,是一門前沿交叉學(xué)科。這一充滿挑戰(zhàn)的研究領(lǐng)域,被列為21世紀(jì)世界十大科技難題的第一位。
最新成果
新思路:解碼外語
美國南加州大學(xué)的科學(xué)家們最近提出一種全新的機(jī)譯方法——解碼外語。之所以叫“解碼”,是因?yàn)樗麄儼延⒄Z視為一種初始語言,把需要翻譯的外語看成類似一種加密后的高級文字,通過解碼破譯,把外語“破解”成英語。這種翻譯方法可以運(yùn)用到任何一種語言中。雖然目前還只能翻譯一些短句或電影字幕,尚未運(yùn)用到長句或片段翻譯中,但它卻給機(jī)譯研究打開了一條新的思路??茖W(xué)家聲稱:因?yàn)椴恍枰魏渭扔械奈谋緸榛A(chǔ),這種翻譯方法今后甚至可以對“海豚音”或“外星人語言”進(jìn)行破譯。
新應(yīng)用:即時翻譯
日前,谷歌推出了一款手機(jī)翻譯軟件,能讓手機(jī)即時翻譯用戶通話。對著谷歌Android智能手機(jī)講話的用戶,將會聽到他們的話被翻譯成另外一種語言;而通話對方的話也會被翻譯成該用戶的母語。這是因?yàn)樗鼡碛休^強(qiáng)的語音識別技術(shù),可以通過聲音實(shí)現(xiàn)自動檢索,再將語音識別和機(jī)譯結(jié)合在一起。這款軟件的翻譯語言目前僅限于英語和西班牙語。但谷歌表示,不久的將來將會推出包括其他語言的升級版本。
這是日本發(fā)明的愛犬翻譯機(jī)。狗狗的頸部套上一只無線麥克風(fēng),主人握有一只手持接收器。愛犬的吠聲、狂叫和哀嗚將分別與數(shù)據(jù)庫存貯的聲音對比后翻譯成為“好無聊呀”、“我喜歡你”等。
從盲目樂觀到“不可行”——機(jī)譯發(fā)展浮沉
早在古希臘時代就有人提出利用機(jī)械裝置來進(jìn)行語言翻譯的想法;然而,只有在計(jì)算機(jī)問世后,機(jī)譯的夢想才逐漸變成現(xiàn)實(shí)。被譽(yù)為機(jī)譯鼻祖的美國數(shù)學(xué)家、工程師沃倫·韋弗(Warren Weaver)于1947年的各類交談和信件中多次提到機(jī)譯的設(shè)想,并于1949年7月發(fā)表了其有著廣泛而深遠(yuǎn)影響的備忘錄——《翻譯》,正式提出了機(jī)譯問題。此后的60多年中,機(jī)譯研究經(jīng)歷了艱難而曲折的發(fā)展歷程,有成功和興奮,但更多的是挫折和困惑。
1954年,美國喬治敦大學(xué)在IBM公司協(xié)助下,用IBM-701型計(jì)算機(jī)首次完成了英俄機(jī)譯試驗(yàn),向公眾和科學(xué)界展示了機(jī)譯的可行性,從而拉開了機(jī)譯研究的序幕。隨后蘇聯(lián)、英國、中國、法國、日本、加拿大等也相繼進(jìn)行了機(jī)譯試驗(yàn)。機(jī)譯研究一時出現(xiàn)熱潮;在這個時期,機(jī)譯雖然剛剛處于開創(chuàng)階段,但很快就進(jìn)入了盲目樂觀的泡沫期。
當(dāng)時由于人們忽略了自然語言和翻譯本身的復(fù)雜性以及機(jī)器自身的局限性,機(jī)譯系統(tǒng)的翻譯質(zhì)量很差,還鬧出了不少笑話。最著名的例子是,當(dāng)英語諺語“心有余而力不足”翻譯成俄語時,其意思卻變成“酒是好的,肉變質(zhì)了”。1964年,為了對機(jī)譯的研究進(jìn)展作出評價,美國科學(xué)院成立了語言自動處理咨詢委員會(ALPAC),開始了為期兩年的綜合調(diào)查分析和測試。ALPAC于1966年11月公布了一個題為《語言與機(jī)器》的報告;該報告全面否定了機(jī)譯的可行性,并建議停止對機(jī)譯項(xiàng)目的資金支持。這份報告的公開發(fā)表給了正在蓬勃發(fā)展的機(jī)譯當(dāng)頭一棒,各國的機(jī)譯研究陷入了近乎停滯的僵局。
打開電腦上網(wǎng)翻譯——互聯(lián)網(wǎng)讓機(jī)譯再次風(fēng)靡
全球化進(jìn)程的加速以及國際交流的日趨頻繁,讓人們對于翻譯的需求空前增長,而互聯(lián)網(wǎng)的發(fā)展讓機(jī)譯迎來了一個全新的機(jī)遇。從上世紀(jì)80年代中期開始,基于語料庫或多引擎的機(jī)譯方法在研發(fā)中得以廣泛運(yùn)用,機(jī)譯系統(tǒng)的性能、效率和譯文質(zhì)量都有了明顯的提高;各式各樣的翻譯軟件如雨后春筍般層出不窮。
如今功能較強(qiáng)、方便易用的在線翻譯工具有谷歌翻譯、雅虎翻譯、臉譜翻譯、巴比倫翻譯等,其中谷歌翻譯最具特色。谷歌翻譯目前可提供63種主要語言之間的即時翻譯;它可以提供所支持的任意兩種語言之間的互譯,包括字詞、句子、文本和網(wǎng)頁翻譯。谷歌翻譯主要是采用統(tǒng)計(jì)翻譯模型,往計(jì)算機(jī)內(nèi)輸入大量的文字文本,包括源語言的文本,以及對應(yīng)目標(biāo)語言人工翻譯的文本,通過海量統(tǒng)計(jì)數(shù)據(jù)來提高翻譯精確度。谷歌翻譯之所以采用統(tǒng)計(jì)翻譯模型一個重要原因就是谷歌的云計(jì)算架構(gòu);該架構(gòu)擁有谷歌研發(fā)的分布式計(jì)算系統(tǒng)(MapReduce)和分布式存儲系統(tǒng)(BigTable)。
近年來,各種翻譯機(jī)不斷問世。人們在關(guān)注軟件質(zhì)量的同時,對外形的要求也越來越高。圖為卡通造型的翻譯機(jī)器人。資料圖片
2029年機(jī)譯質(zhì)量能否達(dá)到人工翻譯水準(zhǔn)——我們拭目以待
美國發(fā)明家、未來學(xué)家雷·科茲威爾(Ray Kurzweil)最近在接受《赫芬頓郵報》采訪時預(yù)言,到2029年機(jī)譯的質(zhì)量將達(dá)到人工翻譯的水準(zhǔn)。
對于這一論斷,還存在很多爭議。但不可否認(rèn)的是,目前是人們對機(jī)譯最為看好的時期,這種關(guān)注是建立在一個客觀認(rèn)識和理性思考的基礎(chǔ)上的。我們也有理由相信:隨著科學(xué)技術(shù)的發(fā)展,尤其是人工智能的突破,機(jī)譯的瓶頸問題將會得以解決。
不過就已有的成就來看,機(jī)譯系統(tǒng)的譯文質(zhì)量離終極目標(biāo)仍相差甚遠(yuǎn);而機(jī)譯質(zhì)量是機(jī)譯系統(tǒng)成敗的關(guān)鍵。中國數(shù)學(xué)家、語言學(xué)家周海中曾在論文《機(jī)器翻譯五十年》中指出:要提高機(jī)譯的質(zhì)量,首先要解決的是語言本身問題而不是程序設(shè)計(jì)問題;單靠若干程序來做機(jī)譯系統(tǒng),肯定是無法提高機(jī)譯質(zhì)量的。另外,在人類尚未明了“人腦是如何進(jìn)行語言的模糊識別和邏輯判斷”的情況下,機(jī)譯要想達(dá)到“信、達(dá)、雅”的程度是不可能的。這些都是制約機(jī)譯質(zhì)量提高的瓶頸。
不管怎么說,現(xiàn)在匆忙下結(jié)論為時過早,還是讓我們拭目以待吧!