作者簡(jiǎn)介:蘇明陽(yáng)
學(xué)歷:碩士研究生
研究方向:翻譯語(yǔ)料庫(kù),計(jì)算機(jī)輔助翻譯
發(fā)表期刊:《外語(yǔ)研究》2007 年第 5 期
摘要:翻譯記憶技術(shù)應(yīng)用于計(jì)算機(jī)輔助翻譯,其思想可以追溯到二十世紀(jì)七十年代,而翻譯記憶系統(tǒng)的具體實(shí)現(xiàn)則是在二十世紀(jì)九十年代初。經(jīng)歷了近二十年的發(fā)展,當(dāng)今業(yè)界出現(xiàn)的翻譯記憶系統(tǒng)已有數(shù)十種。本文從翻譯記憶模型、翻譯記憶檢索和翻譯編輯環(huán)境三個(gè)角度,對(duì)當(dāng)前的翻譯記憶系統(tǒng)進(jìn)行了梳理和劃分,描述了翻譯記憶系統(tǒng)的現(xiàn)狀,提出了當(dāng)前翻譯記憶及翻譯記憶系統(tǒng)的局限性,總結(jié)了其發(fā)展趨勢(shì),并對(duì)我國(guó)翻譯記憶研究與應(yīng)用提出了建議。
Abstract: The idea of implementing translation memory (TM) in computer-aided translation (CAT) can be traced back to the 1960s, while translation memory software did not come into being until the beginning of 1990s. After nearly 20 years of development, dozens of translation memory systems are now competing in the arena of translation and localization industry. In this paper, the author first presents the overall state of the art in TM systems with categorization from the perspectives of TM architecture, TM retrieval and translation environment; then gives a brief summary on the limitation as well as its trend of development. As the conclusion, suggestions on TM research, TM system development and CAT teaching are given to better the relevant research and application in China.
關(guān)鍵詞:計(jì)算機(jī)輔助翻譯翻譯記憶翻譯記憶系統(tǒng)
1. 翻譯記憶與翻譯記憶系統(tǒng)
翻譯記憶( translation memory )是計(jì)算機(jī)輔助翻譯( computer-aided translation , CAT )技術(shù)之一,是譯者工作站( translator's workstation )的重要組成部分。 Bowker 將翻譯記憶定義為一種用于儲(chǔ)存原文本及其譯文的語(yǔ)言數(shù)據(jù)庫(kù) (Bowker 2002 : 93) 。其工作原理為: “ 用戶利用已有的原文和譯文,建立起一個(gè)或多個(gè)翻譯記憶庫(kù),在翻譯過程中,系統(tǒng)將自動(dòng)搜索翻譯記憶庫(kù)中相同或相似的翻譯資源(如句子、段落),給出參考譯文,使用戶避免無謂的重復(fù)勞動(dòng),只需專注于新內(nèi)容的翻譯。翻譯記憶庫(kù)同時(shí)在后臺(tái)不斷學(xué)習(xí)和自動(dòng)儲(chǔ)存新的翻譯譯文,擴(kuò)大記憶量(方夢(mèng)之 2004 : 341 )。 ” 對(duì)于系統(tǒng)提供的參考譯文,譯者可以完全照搬,也可以修改后使用,如果不滿意可以棄之不用。
使用翻譯記憶輔助譯者進(jìn)行翻譯的系統(tǒng),目前常被籠統(tǒng)地稱作計(jì)算機(jī)輔助翻譯系統(tǒng)。這種認(rèn)識(shí)略嫌以偏概全,廣義的計(jì)算機(jī)輔助翻譯工具還包括電子辭典、對(duì)齊工具、術(shù)語(yǔ)管理系統(tǒng)、平行語(yǔ)料庫(kù)等,有時(shí)還將機(jī)器翻譯包括在內(nèi)。因此,將主要使用翻譯記憶技術(shù)的計(jì)算機(jī)輔助翻譯系統(tǒng)命名為翻譯記憶系統(tǒng)更為合理。
根據(jù) Hutchins ( 1998 : 287-307 ),翻譯記憶的思想最早可以追溯到 1971 年,當(dāng)時(shí)供職于聯(lián)邦德國(guó)國(guó)防部翻譯服務(wù)處的 Krollman 提出了 “ 語(yǔ)言數(shù)據(jù)庫(kù) ” ( linguistic data banks )的設(shè)想,其子庫(kù)之一即為 “ 翻譯檔案 ” ( translation archive )。七十年代后期到八十年代初, Peter Arthern 、 Martin Kay 與 Alan Melby 等人分別研究和完善了翻譯記憶的理論,將其視為當(dāng)時(shí)仍處于理論構(gòu)想的譯者工作站中的重要組件。八十年代后期,個(gè)人計(jì)算機(jī)技術(shù)的發(fā)展與普及為翻譯記憶和譯者工作站的實(shí)現(xiàn)提供了可能。第一個(gè)具備翻譯記憶功能的譯者工作站 ALPS ( Automated Language Processing Systems )在此期間問世。到了九十年代,翻譯記憶隨譯者工作站系統(tǒng)的市場(chǎng)化為業(yè)界所接受,出現(xiàn)了包括 Trados , IBM TM/2 以及 Transit 在內(nèi)的多種翻譯記憶系統(tǒng),應(yīng)用于文本重復(fù)性強(qiáng)且對(duì)術(shù)語(yǔ)一致性和翻譯效率要求較高的領(lǐng)域,如歐盟文件翻譯和軟件本地化行業(yè)等。 1990 年,本地化行業(yè)標(biāo)準(zhǔn)組織( Localization Industry Standards Association , LISA )成立,于 1998 年基于可擴(kuò)展標(biāo)記語(yǔ)言( eXtensible Markup Language , XML ),制定了中立、公開的翻譯記憶交換標(biāo)準(zhǔn) TMX ( Translation Memory eXchange ),統(tǒng)一了翻譯記憶的存儲(chǔ)格式。幾次小幅度修訂后, LISA 于 2007 年 3 月公布了 TMX 2.0 草案接受業(yè)界的評(píng)議。如今,翻譯記憶技術(shù)對(duì)翻譯的助益已經(jīng)得到公認(rèn),翻譯記憶系統(tǒng)的使用也不再局限于專門的語(yǔ)言機(jī)構(gòu)和語(yǔ)言服務(wù)商,部分翻譯公司開始要求譯者用特定的翻譯記憶系統(tǒng)進(jìn)行翻譯。
2. 翻譯記憶系統(tǒng)的分類與現(xiàn)狀
根據(jù) Hutchins 的統(tǒng)計(jì)( 2007 : 126 ),截止到 2007 年 6 月,市場(chǎng)上的翻譯記憶系統(tǒng)(在其文章中定義為 translation memory system/component )如下: Across, An-Nakel El-Arabi, CATALYST, DéjàVu, ESI Professional, ESTeam Translator, ForeignDesk, Heartsome TMX Editor, Heartsome XLIFF Translation Editor, LogiTerm, LogoVista X Pro, m2T, Memory Explorer, MemorySphere, MetaTexis, Multilizer, MultiTrans, ProMemoria, Sakhr Enterprise Translation, SDL ContextTM, Similis, Trados GXT, Trados TM, Tr-AID, TraNew, TranSmart, Visual Localize, WordAlign, WordFast 。(此外,還存在部分新出現(xiàn)或未被收錄入上述列表的系統(tǒng)。)
翻譯記憶系統(tǒng)的分類目前尚無定論,本文擬從記憶模型、檢索方式和編輯環(huán)境的角度,對(duì)市場(chǎng)上的翻譯系統(tǒng)進(jìn)行梳理。
2.1 翻譯記憶模型
翻譯記憶模型即翻譯記憶的儲(chǔ)存方式,根據(jù)國(guó)內(nèi)研究者的分類(王華偉、崔啟亮 2005 : 107 ),目前翻譯記憶模型共有兩種:其一是數(shù)據(jù)庫(kù)模型。在數(shù)據(jù)庫(kù)模型下,翻譯記憶以 “ 翻譯單元 ” ( translation unit )的形式儲(chǔ)存,源語(yǔ)言句段與目標(biāo)語(yǔ)言句段精確對(duì)應(yīng)。目前絕大多數(shù)翻譯記憶系統(tǒng)使用的都是這一模型。另一種是引用模型。這種模型并不將源語(yǔ)言句段同目標(biāo)語(yǔ)言句段成對(duì)保存為翻譯單元,而是利用 “ 雙語(yǔ)文本字符串 ” ( Character-string-in-bitext , CSB )檢索技術(shù)( Gow 2004 : 34-37 )檢索并引用其在文檔中所出現(xiàn)的位置。采用這種模型的翻譯記憶系統(tǒng)有 MultiTrans 、 LogiTrans 和 STAR Transit 等。這兩種模型各有優(yōu)劣:引用模型建立大型翻譯記憶庫(kù)時(shí)更為快捷;用戶檢索的任何結(jié)果都附有上下文語(yǔ)境;雙語(yǔ)文本保持完整,可作為譯者背景閱讀材料或培訓(xùn)資料。而數(shù)據(jù)庫(kù)模型中的數(shù)據(jù)更易于管理和維護(hù);翻譯記憶為即時(shí)更新,能夠識(shí)別并處理同一文本中的重復(fù)性文本,而不像引用模型中的翻譯記憶必須在當(dāng)前文本翻譯全部完成后才能更新為翻譯記憶。此外,目前的翻譯記憶交換標(biāo)準(zhǔn) TMX 是基于數(shù)據(jù)庫(kù)模型的,這使引用模型翻譯記憶較難共享與交換。
2.2 翻譯記憶檢索
Lagoudaki 認(rèn)為,翻譯記憶系統(tǒng)之間最重要的區(qū)別在于匹配檢索技術(shù),她將當(dāng)前的翻譯記憶匹配檢索技術(shù)歸結(jié)為兩類:基于字符串的匹配檢索和語(yǔ)言學(xué)知識(shí)增強(qiáng)匹配檢索( Lagoudaki 2006 : 4 )?;谧址乃阉鞣绞绞欠g記憶檢索的傳統(tǒng)方式,當(dāng)前的翻譯記憶系統(tǒng)中絕大多數(shù)都是基于字符串的檢索,借用自然語(yǔ)言處理領(lǐng)域中的 “ 編輯距離 ” ( edit distance )比較字符串之間的相似程度,并用一個(gè)百分比表示匹配率。這種檢索方式僅考慮到語(yǔ)言的形式而不涉及語(yǔ)言的意義,檢索精確度不高。曾有研究者在 Trados 中用以下三個(gè)句子進(jìn)行了測(cè)試( Planas & Furuse 1999 : 331-339 ):
The wild child is destroying his new toy.
The wild chief is destroying his new tool.
The wild children are destroying their new toy.
系統(tǒng)給出的結(jié)果是( 2 )與( 1 )的匹配率高于( 3 )與( 1 )的匹配率,然而( 1 )與( 3 )之間僅僅是主語(yǔ)單復(fù)數(shù)的不同,從意義上來說更為相近。
使用語(yǔ)言學(xué)知識(shí)增強(qiáng)檢索技術(shù),是翻譯記憶系統(tǒng)發(fā)展的新趨勢(shì),但實(shí)際應(yīng)用這種技術(shù)的系統(tǒng)為數(shù)不多。其中, Similis 在句段切分后運(yùn)用詞頻統(tǒng)計(jì)、 N-gram 模型將句段進(jìn)一步切分為語(yǔ)塊( chunk ),借助于單語(yǔ)字典和語(yǔ)法范疇識(shí)別算法進(jìn)行語(yǔ)法標(biāo)注( Planas 2005 )。而一款名為 Masterin 的翻譯記憶系統(tǒng)據(jù)稱可以根據(jù)翻譯記憶庫(kù)(知識(shí)庫(kù))中的例子更為靈活地切分源文本的句段,并對(duì)每個(gè)句段都進(jìn)行語(yǔ)法信息標(biāo)記,構(gòu)成一個(gè) “ 翻譯模式 ” ( translation pattern )供深層檢索。同時(shí)出現(xiàn)多個(gè)翻譯記憶匹配時(shí),系統(tǒng)還會(huì)結(jié)合內(nèi)置字典給出的語(yǔ)義、使用頻率和領(lǐng)域信息進(jìn)行篩選比較。若無匹配,系統(tǒng)還會(huì)綜合利用庫(kù)中已有資源構(gòu)建模糊匹配提供給譯者( Gronroos 2005 )。
利用語(yǔ)言學(xué)知識(shí)增強(qiáng)的匹配檢索技術(shù)目前也被非正式地稱為 “ 第二代翻譯記憶技術(shù) ” ,它在匹配檢索能力和匹配精度上較基于字符串的匹配檢索技術(shù)有所改善。但 “ 第二代翻譯記憶 ” 更依賴于特定語(yǔ)言的語(yǔ)言學(xué)知識(shí)與資源,而建立一個(gè)能有效運(yùn)用于翻譯的語(yǔ)言學(xué)知識(shí)庫(kù)并非易事。
2.3 翻譯編輯環(huán)境
翻譯編輯環(huán)境是指譯者進(jìn)行翻譯工作的文字處理程序環(huán)境。依翻譯編輯環(huán)境不同,目前所有的翻譯記憶系統(tǒng)可分為嵌入式和獨(dú)立式兩類。嵌入式系統(tǒng)需要借助與文字處理程序 Word 為工作界面,安裝后會(huì)創(chuàng)建一個(gè)新的 Word 模板,借助于 Word 中的 VBA 功能增加用于翻譯記憶操作的工具欄和宏命令。譯者仍然在 Word 中進(jìn)行文檔翻譯。簡(jiǎn)單的嵌入式系統(tǒng)(如 Wordfast )可以僅僅是一個(gè) Word 模板文件,復(fù)雜的嵌入式系統(tǒng)(如 Trados )還有外部程序( workbench )同內(nèi)置的 Word 模板相連接,提供更為高級(jí)的功能。獨(dú)立式系統(tǒng)的翻譯過程不使用 Word 等外部文字處理程序作為編輯器,全部翻譯工作都在系統(tǒng)內(nèi)進(jìn)行。翻譯之前通過各種內(nèi)置過濾器( filter )將相應(yīng)格式的文檔中的源語(yǔ)言導(dǎo)入,在系統(tǒng)內(nèi)部完成翻譯后導(dǎo)出為原文檔格式的譯文。一些獨(dú)立式系統(tǒng)(如 Catalyst )專門面向軟件的本地化,雖屬翻譯記憶系統(tǒng)范疇,但已視為本地化工具( localization tool )。兩類系統(tǒng)雖能實(shí)現(xiàn)相同的功能,但在操作方式、工作流程等方面存在較大差別,篇幅所限,在此不做詳述。根據(jù)翻譯編輯環(huán)境的不同,將筆者實(shí)際操作過的翻譯記憶系統(tǒng)分類如下:
嵌入式
獨(dú)立式
純 Word 模板
Word 模板加外部程序
獨(dú)立式文檔翻譯系統(tǒng)
本地化工具
MetaTexis 2003 Tr-Aid 2.0 Wordfisher 4.45 Wordfast 5.1
Trados 7.0 雅信 3.5 朗瑞 1.0 TransAssist 1.5
Across 3.5 Aidtrans 2.0 Déjà Vu 7.5 Heartsome TMX/XLIFF Editor 6.2 IBM Translation Manager 6.0 MemoQ 1.0 SDLX 2004 Similis 2.6 Transit 3.0
Catalyst 6.0 Multilizer 6.2 Passolo 6.0
3. 目前翻譯記憶技術(shù)和翻譯記憶系統(tǒng)的局限性
3.1 翻譯記憶技術(shù)本身的局限
首先,翻譯記憶基于以下假設(shè):已翻譯過的源語(yǔ)與目標(biāo)語(yǔ)對(duì)照的文本可再利用于翻譯新的源語(yǔ)文本,然而現(xiàn)實(shí)中的翻譯活動(dòng)大多缺乏重復(fù)性,只有在某些限定的領(lǐng)域中,文本的重復(fù)率才能達(dá)到一定的比率,從而能夠有效地利用翻譯記憶。由于語(yǔ)言的無限生成能力,即使翻譯記憶容量再大,模糊搜索能力再?gòu)?qiáng),依然無法保證在新的翻譯工作時(shí)總能提供翻譯記憶。
其次,兩種翻譯記憶的模型互不兼容且各有不足之處。兩種模型各自的缺點(diǎn)中,有的存在互補(bǔ)性,如原文和譯文的完整性在數(shù)據(jù)庫(kù)模型下被 “ 碎片化 ” ,而在引用模型下可以得到很好的保留。有的缺點(diǎn)則在兩種模型下均沒有好的解決方案。如對(duì)語(yǔ)塊( chunk )或亞句段單位( subsentential segment )的檢索,數(shù)據(jù)庫(kù)模型下的翻譯記憶以句段為單位,檢索無法深入到句段以下的層次;而引用模型下檢索雖不受翻譯單元的限制,產(chǎn)生的不相關(guān)結(jié)果卻相對(duì)( noise )較多( Gow 2003 : 38 )。
此外,當(dāng)前的翻譯記憶大多不具備語(yǔ)言學(xué)標(biāo)注,作為翻譯記憶儲(chǔ)存交換標(biāo)準(zhǔn)的 TMX ,也未針對(duì)語(yǔ)言學(xué)標(biāo)注進(jìn)行擴(kuò)展或規(guī)定。翻譯記憶如同語(yǔ)料庫(kù)中的 “ 生語(yǔ)料 ” ,其中包含的翻譯資源得不到充分挖掘,限制了其深度應(yīng)用。
3.2 翻譯記憶系統(tǒng)的局限
第一,如前所述,翻譯記憶檢索的算法基于語(yǔ)言形式而非意義,檢索深度和精度不高。譯者對(duì)于檢索的控制性弱,檢索時(shí)可配置的選項(xiàng)較少。同時(shí)匹配率的設(shè)置過于概括,僅使用百分制比較句子相似度不甚合理。
第二,由于商業(yè)原因,翻譯記憶系統(tǒng)之間差異較大,在系統(tǒng)要求、所支持的文件格式、提供的功能、價(jià)格和售后服務(wù)等方面均不相同。專業(yè)譯者有時(shí)不得不安裝多個(gè)系統(tǒng)以解決翻譯過程中出現(xiàn)的各種問題。此外,出于市場(chǎng)競(jìng)爭(zhēng)考慮,各類翻譯記憶系統(tǒng)雖然均支持 TMX 格式,但為增加用戶粘性,都在各自系統(tǒng)中添加對(duì)數(shù)據(jù)(翻譯記憶、術(shù)語(yǔ)等)更詳細(xì)的描述與屬性,在數(shù)據(jù)轉(zhuǎn)移或系統(tǒng)更換時(shí)有可能會(huì)造成數(shù)據(jù)流失。
第三,使用翻譯記憶系統(tǒng)進(jìn)行翻譯同譯者所熟悉的傳統(tǒng)翻譯過程區(qū)別較大,需要較長(zhǎng)時(shí)間學(xué)習(xí)并掌握。翻譯記憶系統(tǒng)也會(huì)對(duì)翻譯過程產(chǎn)生一些負(fù)面影響,如:譯者可能會(huì)避免使用指代以遷就翻譯記憶,提高匹配率( Heyn 1998 : 135 ),而以句段為翻譯單位讓譯者容易失去語(yǔ)篇觀念等。
此外,翻譯記憶系統(tǒng)往往價(jià)格昂貴,前期投入較高,使不少有此需求的個(gè)人和小型單位用戶望而卻步。雖有少數(shù)開源系統(tǒng)可供自由使用,但均為純 Word 模板類型的簡(jiǎn)單的嵌入式系統(tǒng)。
4. 翻譯記憶技術(shù)和翻譯記憶系統(tǒng)的發(fā)展趨勢(shì)
自第一個(gè)翻譯記憶系統(tǒng)問世至今已有近 20 年,此間,已存的翻譯記憶系統(tǒng)升級(jí)換代,新的翻譯記憶系統(tǒng)層出不窮。通過對(duì)可獲及的翻譯記憶系統(tǒng)進(jìn)行歷時(shí)與共時(shí)的研究,筆者認(rèn)為,雖然現(xiàn)在的翻譯記憶系統(tǒng)較過去增加了諸如對(duì)齊、項(xiàng)目 / 流程管理、質(zhì)量保證和術(shù)語(yǔ)提取等多種外圍功能組件,但其核心翻譯記憶技術(shù)缺乏突破性進(jìn)展,檢索能力沒有質(zhì)的飛躍。展望將來,翻譯記憶技術(shù)與翻譯記憶系統(tǒng)存在如下發(fā)展趨勢(shì):
集中化趨勢(shì)。將翻譯記憶與術(shù)語(yǔ)等翻譯資源集中儲(chǔ)存在中央服務(wù)器的數(shù)據(jù)庫(kù)中,不同權(quán)限的工作站通過網(wǎng)絡(luò)連接到中央服務(wù)器進(jìn)行按需檢索。翻譯資源的集中一方面可以使翻譯記憶匹配和詞語(yǔ)索引更全面可靠,檢索和維護(hù)更簡(jiǎn)單;另一方面也可以更方便地實(shí)現(xiàn)對(duì)翻譯資源知識(shí)產(chǎn)權(quán)的保護(hù),適應(yīng)信息情報(bào)保密與安全的需要。加拿大蒙特利爾大學(xué) RALI 實(shí)驗(yàn)室的翻譯記憶檢索庫(kù) TransSearch 目前已實(shí)現(xiàn)商用,其經(jīng)驗(yàn)可供借鑒。
深加工翻譯記憶的趨勢(shì)。翻譯記憶,從某種程度上而言就是對(duì)齊后的平行語(yǔ)料,而目前翻譯記憶所挖掘出的僅僅是譯文中表層的很少一部分的知識(shí)與經(jīng)驗(yàn)。因此,目前研究者們都在關(guān)注如何結(jié)合語(yǔ)料庫(kù)的研究方法進(jìn)一步利用并完善翻譯記憶。
與機(jī)器翻譯相結(jié)合的趨勢(shì)。翻譯記憶屬于計(jì)算機(jī)輔助翻譯,是研究機(jī)器翻譯的過程中出現(xiàn)的一種折衷。高質(zhì)量的、可作為雙語(yǔ)語(yǔ)料庫(kù)的翻譯記憶可以應(yīng)用于基于統(tǒng)計(jì)和基于實(shí)例的機(jī)器翻譯系統(tǒng)。
5. 對(duì)我國(guó)相關(guān)研究與應(yīng)用的思考與建議
5.1 翻譯記憶技術(shù)研究
我國(guó)學(xué)術(shù)界對(duì)國(guó)外計(jì)算機(jī)輔助翻譯技術(shù)與工具的評(píng)介早已有之,但大多局限在機(jī)器翻譯和計(jì)算機(jī)輔助翻譯比較上,對(duì)計(jì)算機(jī)輔助翻譯的介紹過于概括,缺乏新意,具體到翻譯記憶技術(shù)和翻譯記憶系統(tǒng)的應(yīng)用研究更不多見。然而,在翻譯服務(wù)行業(yè)中,翻譯記憶系統(tǒng)為大多數(shù)本地化從業(yè)者,專職翻譯以及兼職翻譯所熟知,并在部分從業(yè)者中得到了合理應(yīng)用,提高了工作效率與翻譯質(zhì)量。這些實(shí)際使用者對(duì)當(dāng)前國(guó)內(nèi)外主流的翻譯記憶系統(tǒng)乃至其他計(jì)算機(jī)輔助翻譯工具有著豐富的使用經(jīng)驗(yàn),但由于缺乏理論研究氛圍,或忙于本職工作無暇研究,對(duì)翻譯記憶系統(tǒng)的認(rèn)識(shí)與評(píng)價(jià)往往注重于實(shí)際操作經(jīng)驗(yàn),主要以技巧心得的形式在互聯(lián)網(wǎng)上流傳。這就形成了整體上 “ 言者不盡知,知者未盡言 ” 的局面,一方面誠(chéng)然是由于一般文科學(xué)者缺乏信息技術(shù)敏感性所致,另一方面也是翻譯理論研究與實(shí)踐脫節(jié)的一種具體體現(xiàn)。
筆者認(rèn)為,為改變這種局面,應(yīng)當(dāng)引介國(guó)外相關(guān)學(xué)術(shù)著作與文章,追趕同國(guó)外翻譯記憶技術(shù)乃至計(jì)算機(jī)輔助翻譯技術(shù)研究之間并不巨大的差距。值得注意的是,香港和臺(tái)灣在計(jì)算機(jī)輔助翻譯的研究和應(yīng)用上起步早、應(yīng)用廣、同國(guó)際聯(lián)系緊密,取得了不少成果。大陸研究者應(yīng)當(dāng)與其加強(qiáng)交流,相互借鑒。此外,隨著翻譯研究的跨學(xué)科性越來越鮮明,計(jì)算機(jī)輔助翻譯研究作為信息技術(shù)和翻譯研究的結(jié)合需要所有相關(guān)領(lǐng)域研究者的合力協(xié)作。具體到翻譯記憶技術(shù)上,除了翻譯研究者之外,還需要自然語(yǔ)言處理、語(yǔ)料庫(kù)、軟件工程學(xué)等諸多領(lǐng)域?qū)<覍W(xué)者的共同努力,重點(diǎn)在翻譯記憶的語(yǔ)塊識(shí)別、翻譯記憶與平行語(yǔ)料庫(kù)建設(shè)、翻譯記憶標(biāo)準(zhǔn)擴(kuò)展、翻譯記憶系統(tǒng)設(shè)計(jì)等方面加強(qiáng)研究與合作。 2007 年 5 月,北京大學(xué)軟件與微電子學(xué)院、北京大學(xué)計(jì)算語(yǔ)言研究所與香港中文大學(xué)電腦輔助翻譯系啟動(dòng)了科研與教學(xué)合作,在學(xué)術(shù)機(jī)構(gòu)間交流和跨領(lǐng)域合作上邁出了第一步。
5.2 翻譯記憶系統(tǒng)開發(fā)
目前我國(guó)自主開發(fā)的較為成熟的翻譯記憶系統(tǒng)有雅信 CAT 系統(tǒng),華建機(jī)器翻譯系統(tǒng)等。其中,筆者了解并實(shí)際使用過雅信 CAT 系統(tǒng)。該系統(tǒng)采用數(shù)據(jù)庫(kù)儲(chǔ)存模型,基于字符串檢索,編輯環(huán)境同 Trados 類似,為嵌入式 Word 模板加外接程序。雅信 CAT 系統(tǒng)的特色是針對(duì)國(guó)內(nèi)譯者實(shí)際需求,內(nèi)置了大容量的中英專業(yè)詞庫(kù),能夠進(jìn)行中文自動(dòng)分詞,并在此二者基礎(chǔ)上具備中英機(jī)器互譯功能,這是國(guó)外翻譯記憶系統(tǒng)目前無法做到的。當(dāng)然,作為國(guó)內(nèi)翻譯記憶系統(tǒng)的典型代表,雅信尚非完美,在很多方面仍需改進(jìn)。
針對(duì)今后翻譯記憶系統(tǒng)的研發(fā),筆者建議:一、優(yōu)先采用數(shù)據(jù)庫(kù)模型的翻譯記憶,支持 TMX 標(biāo)準(zhǔn),同國(guó)際接軌。同時(shí)要對(duì)數(shù)據(jù)庫(kù)模型的缺點(diǎn)有清醒的認(rèn)識(shí),尋求克服其缺點(diǎn)的對(duì)策,條件允許情況下可以對(duì)結(jié)合兩種模型架構(gòu)的系統(tǒng)進(jìn)行探索性研究。二、順應(yīng) “ 第二代翻譯記憶 ” 的趨勢(shì),結(jié)合中文自動(dòng)處理技術(shù)建立適用于中文翻譯記憶檢索的算法、標(biāo)注體系和語(yǔ)言知識(shí)庫(kù)。只要字符集支持,基于字符串檢索的第一代檢索方式可以應(yīng)用于任何一種語(yǔ)言,包括以中文為源語(yǔ)或目標(biāo)語(yǔ)的翻譯。然而利用語(yǔ)言學(xué)知識(shí)增強(qiáng)翻譯記憶檢索的 “ 第二代翻譯記憶 ” 技術(shù)則需要真正了解中文,通曉中文自動(dòng)處理的國(guó)內(nèi)學(xué)者的研究才能實(shí)現(xiàn)。三、翻譯編輯環(huán)境同翻譯記憶系統(tǒng)使用者最為密切相關(guān)。其友善性一向被用戶注重,卻往往容易被系統(tǒng)開發(fā)者忽視。據(jù)調(diào)查( Lagoudaki 2006 : 1 ),開發(fā)人員在系統(tǒng)設(shè)計(jì)之前很少向用戶征詢意見,而往往是在系統(tǒng)已經(jīng)基本定型,開始測(cè)試時(shí)才給用戶提出意見的機(jī)會(huì),而此時(shí)的反饋很少能使開發(fā)者對(duì)系統(tǒng)做出相應(yīng)更改。由于嵌入式系統(tǒng)和獨(dú)立式系統(tǒng)差異較大,因此在翻譯編輯環(huán)境的設(shè)計(jì)時(shí),應(yīng)當(dāng)廣泛聽取使用者及潛在使用者的意見,在此基礎(chǔ)上針對(duì)用戶需求選擇形式進(jìn)一步完善。
5.3 翻譯記憶系統(tǒng)的教學(xué)
在翻譯教學(xué)的學(xué)歷教育中增加計(jì)算機(jī)輔助翻譯與翻譯記憶系統(tǒng)應(yīng)用課程,國(guó)內(nèi)已有學(xué)者對(duì)此進(jìn)行專門的研究與探索: “ 通過網(wǎng)上檢索香港中文大學(xué)可以發(fā)現(xiàn),其翻譯專業(yè)目前的課程體系設(shè)置中列有 Computer Translation Project 、 Information Technology and Computing 、 Introduction to Computer-aided Translation 等課程。但據(jù)筆者粗略調(diào)查,大陸的高等院校,真正在翻譯專業(yè)的本科和碩士階段全面開始 CAT 課程的還基本沒有,例外的是北京大學(xué)的語(yǔ)言信息工程系,提供計(jì)算機(jī)輔助翻譯專業(yè)的碩士學(xué)位課程(徐彬 2006 : 63 )。 ” 并且首度明確提出應(yīng)將計(jì)算機(jī)輔助翻譯課程納入我國(guó)翻譯專業(yè)課程體系設(shè)置。非學(xué)歷翻譯培訓(xùn)方面,據(jù)筆者所知,國(guó)內(nèi)目前有北京大學(xué)的 “ 計(jì)算機(jī)輔助翻譯高級(jí)研修班 ” (已于 2007 年 4 月開課)以及 SDL-Trados 公司對(duì)其旗下產(chǎn)品的應(yīng)用培訓(xùn)(目前已舉辦兩期)和其他推廣性培訓(xùn)活動(dòng)。
通過將北大語(yǔ)言工程系計(jì)算機(jī)輔助翻譯碩士專業(yè)培養(yǎng)方案和課程計(jì)劃與香港中文大學(xué)翻譯系電腦輔助翻譯碩士課程簡(jiǎn)介相比較可以看出,前者的培養(yǎng)目標(biāo)是使學(xué)生成為 “ 具備超越其他翻譯師的信息技術(shù)的應(yīng)用能力,掌握機(jī)器翻譯和機(jī)器輔助翻譯的原理和使用技巧,可自由靈活地進(jìn)行系統(tǒng)定制,從而最大限度地提高翻譯工作的效率;或直接參與語(yǔ)言信息處理系統(tǒng)和多媒體內(nèi)容信息處理系統(tǒng)的研發(fā)工作(俞敬松 2006 ; 1 )。 ” 后者在 2005 年稱 “ 課程取向?qū)⒓訌?qiáng)翻譯的訓(xùn)練和軟件的理論和應(yīng)用,使課程更具實(shí)用性,也就是從 ‘ 電腦翻譯 ' 趨向 ‘ 電腦輔助翻譯 ' ,以適應(yīng)世界潮流和社會(huì)的需要,同時(shí)配合翻譯系課程專業(yè)化的目標(biāo) ” (方梓勛 2005 : 2 )。香港中文大學(xué)的這一專業(yè)通過課程的組合提供了三種修讀模式:翻譯實(shí)踐、電腦輔助翻譯、電腦科學(xué),并于 07 年除已有的兩年兼讀制之外又開設(shè)了一年全日制課程供學(xué)生更為靈活的學(xué)習(xí)??梢钥闯觯愀壑形拇髮W(xué)應(yīng)用性的培養(yǎng)目標(biāo)與課程設(shè)置相比,北大開設(shè)的計(jì)算機(jī)輔助翻譯碩士專業(yè)增加了對(duì)技術(shù)研究與系統(tǒng)開發(fā)的側(cè)重,意在培養(yǎng)高層次的 “ 同時(shí)擁有兩個(gè)領(lǐng)域技能的寶貴人才。 ”
然而,僅憑一所或幾所高校開設(shè)計(jì)算機(jī)輔助翻譯專業(yè)并不能滿足市場(chǎng)對(duì)通曉計(jì)算機(jī)輔助翻譯工具、能熟練使用翻譯記憶系統(tǒng)進(jìn)行實(shí)際工作的譯員的需求。況且,高校計(jì)算機(jī)輔助翻譯專業(yè)還要承擔(dān)培養(yǎng)科研與開發(fā)人才的任務(wù),僅培養(yǎng)計(jì)算機(jī)輔助翻譯工具的使用者未免大材小用。計(jì)算機(jī)輔助翻譯作為當(dāng)今翻譯實(shí)踐中的一種重要手段,應(yīng)該定位為譯者的常備技能進(jìn)行培養(yǎng)。 2007 年 3 月 30 日,國(guó)務(wù)院學(xué)位委員會(huì)印發(fā)了《翻譯碩士專業(yè)學(xué)位設(shè)置方案》,以培養(yǎng)注重翻譯實(shí)踐能力的碩士人才。筆者認(rèn)為,應(yīng)該借此契機(jī)將計(jì)算機(jī)輔助翻譯課程納入翻譯碩士專業(yè)課程設(shè)置,并將翻譯記憶系統(tǒng)的應(yīng)用作為筆譯課程的必修科目之一。還可將計(jì)算機(jī)輔助翻譯作為選修課引入本科翻譯專業(yè)課程設(shè)置,向?qū)W生做一般性介紹。
Copyright @ 2005-2020 南京同傳翻譯公司 版權(quán)所有