Wikipediaが自動翻訳機能を拡張

WikipediaWikipediaを提供しているWiki Mediaは先週末、現在試験的に提供している自動翻訳機能をさらに拡充していく計画を明らかにした。ベータ・プログラムは間もなく8つのWikipediaで順次提供される。翻訳エンジンはオープンソース・プラットフォームのApertiumが使用されているが、日本語、中国語、韓国語はサポートされていない。

差異を知り、共有する手段

Wikipediaによれば、この百科事典が現在サポートする言語は287あり、国とは必ずしも対応しない。Wikimedia財団にはエンジニアリング・チームがあり、Wikimediaサイトのための標準ベースのツールの実装を担当している。多国語版は、Internationalization and Localization (i18N/L12N)チームが扱う。今回の対象はカタロニア語、デンマーク語、エスペラント語、インドネシア語、マレー語、ノルウェー語(ブークモール)、ポルトガル語、スペイン語。ノルウェー語(ニーノシュク)およびスウェーデン語販でも使用可能だが、それぞれノルウェー語(ブークモール)とデンマーク語への翻訳のみ利用可。

translate自動翻訳は日本ではあまり使えないITの一つだが、欧州系言語間ではかなり使われるようになってきた。アルゴリズムの改善と最適翻訳事例(翻訳データベース)からのフィードバックの蓄積などによるものだ。とくにGoogle Chromeに組込まれているGoogle Translateは、筆者もよく「非英語→英語」の変換に使っている。欧州言語については大いに重宝している。自動翻訳技術がインターネットによって飛躍の機会を得たことは言うまでもない。それは情報共有のスピードによる。

辞書・事典の自動翻訳の最大の意味は、各国語版の記述の異同を相互に参照し、それぞれの言語圏での意味空間のさを知ることが出来ることだろう。これは外国語の翻訳をする場合に特に有効で、とくに動きの速い技術用語では、出版活動における「中心」の辞書と「周辺」の辞書の違いを知っていないと間違いの原因になる。では、世界最大のオンライン辞書Wikipediaの場合はどうか。これは辞書のプロフェッショナルが部分的にしか関わっていないので、スタイルにおいても記述内容においてもまちまちだ。それはプラスとマイナスの両面で大きい。問題は、マイナス面をどう克服するかで、それにはとりあえず幅広く「違い」を認識・共有し、議論をオープン化するにしくはない。Wikipediaが昨年秋に行ったスペイン語とカタロニア語の相互翻訳機能は、差異の理解を通じた相互理解に貢献すると思われる。

乏しい語学力でWikipediaの各国語版を比較することがあるが、事典リテラシーに関して日本の水準はあまり高くない。記述の一貫性欠如、必須事項の欠落、審査の甘さ、公共性意識といった点でプロフェッショナルの水準に達しないものが多いのだが、逆に最も厳しい英語版はBritannicaなどに近いものとなっている。

私見では、インターネット時代の辞書・事典の意義は、個別のタイトルの維持というよりはむしろ、相互参照を前提とした多様性と変化そして追跡性(いつ・誰・何)にある。それによって言葉はコミュニケーションにおける縦糸(時間軸)と横糸(空間軸)を得るだろう。そのためには「差異」に目を向け、差異の位相を共有し、差異を議論するためのルールを共有する環境がなくてはならないが、自動翻訳はその一つの鍵を提供してくれる。 (鎌田、01/13/2015)

Cx-new-languages1

Scroll Up