百度翻譯技術(shù)突破機(jī)器即時(shí)翻譯靠譜嗎？

2023-09-08 17:08:20

　　近日，百度發(fā)布重磅消息稱(chēng)，百度研發(fā)了具備預(yù)測(cè)能力和可控延遲的即時(shí)機(jī)器翻譯系統(tǒng)，可實(shí)現(xiàn)兩種語(yǔ)言之間的高質(zhì)量、低延遲翻譯。這是自然語(yǔ)言處理方面的重大技術(shù)突破，將對(duì)機(jī)器即時(shí)筆譯和口譯的發(fā)展起到極大地推動(dòng)作用。

　　即時(shí)機(jī)器翻譯系統(tǒng)是2016年百度Deep Speech 2發(fā)布以來(lái)，又一項(xiàng)引發(fā)MIT科技評(píng)論、IEEE Spectrum等外媒矚目的重大技術(shù)進(jìn)展。IEEE Spectrum認(rèn)為，百度開(kāi)發(fā)的這個(gè)新系統(tǒng)揭示了一種通過(guò)預(yù)測(cè)未來(lái)而保持穩(wěn)定的翻譯工具，可以與聯(lián)合國(guó)會(huì)議期間提供同傳服務(wù)的口譯人員相媲美，讓人們離軟件巴別魚(yú)又近了一步。還有媒體認(rèn)為，百度推出新的翻譯系統(tǒng)，是向谷歌發(fā)起了挑戰(zhàn)。

　　這項(xiàng)引發(fā)行業(yè)震動(dòng)的技術(shù)，到底有何過(guò)人之處?

　　機(jī)器同傳利用語(yǔ)音識(shí)別技術(shù)自動(dòng)識(shí)別演講者的講話(huà)內(nèi)容，將語(yǔ)音轉(zhuǎn)化為文字，然后調(diào)用機(jī)器翻譯引擎，將文字翻譯為目標(biāo)語(yǔ)言，顯示在大屏幕或者通過(guò)語(yǔ)音合成播放出來(lái)。相比人類(lèi)譯員，機(jī)器最大的優(yōu)勢(shì)是不會(huì)因?yàn)槠＞攵鴮?dǎo)致譯出率下降，能將所有“聽(tīng)到”的句子全部翻譯出來(lái)，這使得機(jī)器的“譯出率”可以達(dá)到100%，遠(yuǎn)高于人類(lèi)譯員的60%-70%。同時(shí)，在價(jià)格上也占有優(yōu)勢(shì)。

　　此次，百度聯(lián)合語(yǔ)音技術(shù)、機(jī)器翻譯技術(shù)，從語(yǔ)音識(shí)別、翻譯質(zhì)量、時(shí)延、融合領(lǐng)域知識(shí)等方面推出了“一攬子”解決方案。

　　在語(yǔ)音識(shí)別方面，區(qū)別于傳統(tǒng)的上下文相關(guān)建模技術(shù)，百度提出了上下文無(wú)關(guān)音素組合的中英文混合建模單元，包含1749個(gè)上下文無(wú)關(guān)中文音節(jié)和1868個(gè)上下文無(wú)關(guān)英文音節(jié)。該方法具有泛化性能好、對(duì)噪聲魯棒、中英文混合識(shí)別等特點(diǎn)。

　　在翻譯質(zhì)量方面，提出了“語(yǔ)音容錯(cuò)”的對(duì)抗訓(xùn)練翻譯模型，根據(jù)語(yǔ)音識(shí)別模型常犯的錯(cuò)誤，在訓(xùn)練數(shù)據(jù)中有針對(duì)性的加入噪聲數(shù)據(jù)，使得模型在接受到錯(cuò)誤的語(yǔ)音識(shí)別結(jié)果時(shí)，也能夠在譯文中糾正過(guò)來(lái)。比如，語(yǔ)音識(shí)別系統(tǒng)將“大堂”錯(cuò)誤的識(shí)別為“大唐”，這一對(duì)噪聲詞將被自動(dòng)收錄到訓(xùn)練數(shù)據(jù)中，并將源語(yǔ)言句子“我們?cè)诰频甏筇靡?jiàn)面吧”替換為“我們?cè)诰频甏筇埔?jiàn)面吧”，而保持目標(biāo)語(yǔ)言翻譯不變“Let’s meet at the lobby of the hotel”，同時(shí)將這兩個(gè)中文句子用于訓(xùn)練，進(jìn)而獲得具有更強(qiáng)的容錯(cuò)能力模型。

　　為了降低時(shí)延提升翻譯質(zhì)量，人類(lèi)譯員通常對(duì)演講內(nèi)容進(jìn)行合理預(yù)測(cè)，百度開(kāi)發(fā)人員從人類(lèi)譯員身上獲得啟示，研發(fā)了“wait-k words”模型，可以根據(jù)歷史信息，直接預(yù)測(cè)翻譯中目標(biāo)語(yǔ)言詞匯。該模型在翻譯質(zhì)量和翻譯延遲之間做出了很好的平衡，用戶(hù)可根據(jù)實(shí)際需求設(shè)定延遲時(shí)間(例如延遲1(k=1)詞或延遲5(k=5)詞)。比如，法語(yǔ)和西班牙語(yǔ)這種較為接近的語(yǔ)言，延遲可設(shè)置在比較低的水平;但是，對(duì)于英語(yǔ)和漢語(yǔ)這種差異較大的語(yǔ)言，以及英語(yǔ)和德語(yǔ)這種詞序不同的語(yǔ)言，延遲應(yīng)當(dāng)設(shè)置為較高水平，以便于更好地應(yīng)對(duì)差異。

　　在同聲傳譯時(shí)，經(jīng)常會(huì)遇到不同領(lǐng)域的專(zhuān)業(yè)知識(shí)，這就要求同傳人員在短時(shí)間內(nèi)吸收大量相關(guān)領(lǐng)域的內(nèi)容，這對(duì)他們也是極大地挑戰(zhàn)?；诖耍俣饶７氯祟?lèi)同傳的準(zhǔn)備過(guò)程，提出了快速融合領(lǐng)域知識(shí)策略。該策略依托百度海量的互聯(lián)網(wǎng)大數(shù)據(jù)，訓(xùn)練得到的具有通用翻譯能力的模型;當(dāng)它接到某一個(gè)領(lǐng)域的同傳翻譯任務(wù)時(shí)，系統(tǒng)會(huì)收集該領(lǐng)域數(shù)據(jù)并在通用模型的基礎(chǔ)上進(jìn)行增強(qiáng)訓(xùn)練，得到相應(yīng)領(lǐng)域的增強(qiáng)模型;最后對(duì)該領(lǐng)域術(shù)語(yǔ)庫(kù)進(jìn)行強(qiáng)制解碼，使專(zhuān)業(yè)術(shù)語(yǔ)翻譯得準(zhǔn)確可靠，且提升翻譯效率。

　　雖然機(jī)器同傳有了新的突破，但它與經(jīng)驗(yàn)豐富的同傳人員相比，依然存在一定差距。百度翻譯技術(shù)負(fù)責(zé)人表示，百度研發(fā)新系統(tǒng)的初衷是為了降低同傳成本，讓同傳在不同領(lǐng)域構(gòu)筑溝通橋梁，而非取代人類(lèi)譯員。

H无码精品动漫在线观看免费 ,最新亚洲国产综合V,99久久99久久久精品齐齐综合色圆,国产极品粉嫩馒头一线天

百度翻譯技術(shù)突破機(jī)器即時(shí)翻譯靠譜嗎？

相關(guān)內(nèi)容推薦

語(yǔ)言橋中山游戲翻譯服務(wù) — 打開(kāi)通往世界的大門(mén)

語(yǔ)言橋中山醫(yī)學(xué)翻譯服務(wù) — 專(zhuān)業(yè)、準(zhǔn)確、值得信賴(lài)

精準(zhǔn)遠(yuǎn)程醫(yī)療翻譯服務(wù)，構(gòu)筑全球醫(yī)療通道

呼和浩特游戲翻譯服務(wù)- 專(zhuān)業(yè)提供精準(zhǔn)翻譯服務(wù)

呼和浩特醫(yī)藥翻譯服務(wù)-專(zhuān)業(yè)提供高質(zhì)量翻譯服務(wù)

醫(yī)療認(rèn)證翻譯 | 專(zhuān)業(yè)醫(yī)療行業(yè)翻譯服務(wù) | 語(yǔ)言橋翻譯公司

游戲語(yǔ)音包翻譯 | 專(zhuān)業(yè)游戲本地化翻譯服務(wù) | 語(yǔ)言橋翻譯公司

東營(yíng)游戲翻譯 | 專(zhuān)業(yè)語(yǔ)言橋翻譯公司助您征服全球市場(chǎng)

東營(yíng)醫(yī)藥翻譯專(zhuān)業(yè)服務(wù) | 解密語(yǔ)言橋翻譯公司

生物材料翻譯 | 專(zhuān)業(yè)生物科技翻譯服務(wù) | 語(yǔ)言橋翻譯公司

人工客服咨詢(xún)

翻譯服務(wù)

筆譯翻譯

證件翻譯

口譯翻譯

圖紙翻譯

本地化翻譯

譯員外派

推薦閱讀

熱門(mén)標(biāo)簽

關(guān)于我們

筆譯翻譯

證件翻譯

口譯翻譯

百度翻譯技術(shù)突破 機(jī)器即時(shí)翻譯靠譜嗎？

相關(guān)內(nèi)容推薦

人工客服咨詢(xún)

翻譯服務(wù)

筆譯翻譯

證件翻譯

口譯翻譯

圖紙翻譯

本地化翻譯

譯員外派

推薦閱讀

熱門(mén)標(biāo)簽

關(guān)于我們

筆譯翻譯

證件翻譯

口譯翻譯

百度翻譯技術(shù)突破機(jī)器即時(shí)翻譯靠譜嗎？