bdaudey コメントはまだありません

ビデオ会議における通訳サービス プロの通訳が必要な理由とは?

活発なグローバルビジネスが経済の根幹である現代社会。新型コロナウイルスの感染拡大に伴い、ほぼ全ての対面コミュニケーションに制限がかけられ、多言語コミュニケーションの場はオンライン上の時代に。翻訳通訳へのニーズは多様化するとともに、非接触型のスタイルが求められるようになりました。

ビデオ会議と機械による自動翻訳は、ここ数年で飛躍的に進歩した大変便利なツールですが、その性能にはまだまだ限界があるのが現状です。

状況を問わず、スムーズ直感的なグローバルコミュニケーションを実現するには、何が必要なのでしょうか。

夢のツール、ビデオ会議システム

ビデオ会議システムは、今年の春以降、新型コロナショックの影響を受け広く認知され、 感染拡大防止にも大きく貢献するツールとして、社会にすっかり定着しました。その定着ぶりは、ビデオ会議サービス「Zoom」を運営する 米ズーム・ビデオ・コミュニケーションズ社の創設者・CEOであるエリック・ヤン氏が発表した最新の決算からもうかがい知ることができます。

Zoomの利用者数は急速に拡大は、個人ユーザーが無料で利用できることから始まり、それに伴いビジネスユーザーの数も右肩上がりに。同社サイトによると、今期だけでもZoomのサービスに10万ドル超を支払う顧客数は、2倍余り増加。まさに、破竹の勢いです。またAFP通信によると、同社が8月末発表した決算は、売上高が前年同期と比較して大幅に急伸。それを受け、発表翌日には株価も急騰しました。

特に欧米では、学校やオフィスへの復帰が慎重に進められているため、ビデオ会議システムは、今後もますます社会に定着することが見込まれます。Zoomの第3四半期の収益見込みは6億8500万ドルから6億9000万ドル、年間収益は23.7億ドルから239万ドルと、

大変強気な数字です。

成功は誰かの犠牲の上に成り立つとは言うものの、ビデオ会議システムは今や、まぎれもなくウィズ・コロナ時代の経済を支える強力な助っ人であり、その存在感は大きくなる一方です。

IATA(国際航空運送協会)の発表によると、 世界の航空需要はもはや瀕死とも言える落ち込みぶりで、2021年の商業渡航の需要予測も、大幅な感染拡大やロックダウンが実施されないことを前提としても、2019年の半分程度にとどまると予測。企業の商業渡航も、景気が改善した後も、企業が出張予算を大幅に抑えると予測しています。つまり近い将来、ビデオ会議システムを通じての実施が一般化するのは、仕事や教育活動以外にも、国際会議、カンファレンス、ミーティング、スポーツ大会や文化系の展覧会などに至るまで、多岐に渡る見通しです。

そんな時代の到来に際し、私達が行うべき準備とは何でしょうか。

「翻訳」は、21世紀の新言語

グローバル化と情報化が飛躍的に進む2000年代は、一般翻訳の時代の幕開けと言えるでしょう。

翻訳ニーズの全体量、ジャンルの多様性、求められる処理スピードと正確さへのレベルが上昇の一途を辿る中、これまでより複数の言語が使われるコミュニケーションの機会も増加し、翻訳通訳の質の向上には、世界的にも高い期待が寄せられています。

 

翻訳や通訳の質の向上は、IT技術の進歩に比例しているとも言えます。そして、私たちの生活を便利で快適にしてくれる電子機器、プログラム、アプリケーション類は、大衆化とともに多様化しています。ニーズに応じた電子機器の種類や使い方を知ることは、今まで以上に重要な意味を持つ時代になり、同時に、どのソフトウェアやツールが多言語コミュニケーションに適しているのか、見極めることも重要です。

 

現在、Google Meet, Microsoft Teams, Skype, GoTo Meeting de LogMeIN, Cisco WEBEX等の大手のビデオ会議システムが提供している通訳サービスの大半は、チャットによるサービスや人工知能(AI)による機械翻訳にとどまっています。Zoom は唯一、プロの人間による通訳を介したサービスを提供し始めました。

つまり、私たちがビデオ会議において通訳サービスを利用したい場合、AIによる機械翻訳あるいは人間の同時通訳サービスのどちらかを選ぶことになるのですが、より自分のニーズに合った選択をするためには、機械翻訳の仕組みと、人間による同時通訳の違いを理解する必要があります。

機械翻訳と人工知能(AI)

2000 年の時点では、その正確性に定評があるとは言えなかった機械翻訳。しかし今では、AIによる翻訳レベルの向上と活用法の向上により、最新テクノロジーを扱う企業においても積極的に利用され、利用者全体も急速に拡大しています。

機械翻訳が誕生した背景とは?

機械による自動翻訳の本格的な研究は、今からおよそ80年近くも昔、ロシア語から英語への膨大な翻訳ニーズがあった米ソ冷戦時代に開始されました。

第二次世界大戦中、英国諜報機関がドイツ軍の暗号の解読に成功したことから、翻訳への応用に期待が高まったのです。戦時中の暗号解読は、コンピューター技術の向上を後押しした要因でした。

機械翻訳の原点は、第二次世界大戦中、有名な数学者・暗号研究者のアラン・チューリングを含む有識者らが、イギリス政府により極秘に集められ、 ナチスドイツの暗号を機械で解読する研究が秘密裏に行われていた学校、ブレッチリー・パークにあります。

連合軍は、ドイツ軍が使用していた機械式の暗号機「エニグマ」を盗み出すことに成功し、これを元に、有識者らが暗号解読用の機械を開発したとされています。

この機械は、史上初のコンピューターとも言われ、機械翻訳の原点になりました。

初期の機械翻訳システム

長年の間、機械翻訳は複数の辞書データを組み合わせた機能にとどまり、1960年代初頭には、専門家たちが「機械による自動翻訳は、実現不可能である」という結論を発表しました。

人間の言葉には、含みや曖昧なニュアンスを持つ言葉や言い回しが多く、全体の意味を正しく理解するためには、この曖昧さを適切に理解できる能力が必要です。

暗号の場合は、鍵となるパターンさえ解れば解読できますが、言葉の曖昧さを理解するための統一されたパターンは、残念ながら存在しません。

言葉の「あや」や、口調(トーン)の持つ意味、言外の曖昧なニュアンスを理解できる能力こそが、人間のみが正確な翻訳・通訳を行える所以なのです。

現時点ではまだ、人間のみが持つこの能力の詳細なメカニズムは解明されていませんが、

コンピューターの限界が顕著になる一面と言えるでしょう。

このような背景から、機械による自動翻訳の研究は1950年半ばから80年代後半までの20年以上の間低迷し、大きな発展はありませんでした。

しかし80年代後半、「pitch to text」と呼ばれる、音声をテキストに自動変換する機能の開発に取り組んでいたIBM社が、統計学的な手法を取り入れる試みに着手しました。この機能を、外国語から英語の自動翻訳に応用できないかと着目したのです。

 

例えば、コンピューターは統計から「House」という単語が「家」を表す単語であるということを認識することで、「House」を「家」と訳する作業を学習します。そして同様の機能により、単語1つ1つのみではなく、単語のグループの意味も学習できるようになります。膨大な言語資料体を読み込ませることにより、コンピューターは統計学的に翻訳パターンを学び、文章の翻訳を行えるようになったのです。

 

このように、機械による自動翻訳の進化は、大量のデータを統計処理できるコンピューターと共に、進化してきました。90年代のウェブデータの拡充は、コンピューターがより多くのパターンを学習するための大きな足がかりとなりました。ウェブ上に存在するデータ全体が、コーパス(言語資料体)となったのです。

人工知能、AIの台頭

2010年以降、人工知能を意味するAIという用語は一般的に知られるようになり、メディアでも目にする機械が増えました。しかしそもそも、AIとは何なのでしょうか?

欧州評議会のウェブサイトには、次のような説明があります。

「IAとは広い意味で、SFの領域にあるシステムのことを漠然と指す言葉で、(例えば映画『トランスフォーマー』にウィルスミスと共に登場する強力なAIは、自我を持ったAI)自動翻訳、顔や画像認識、音声認識、自動車の自動運転等の非常に複雑なタスクの処理能力を身につけています。」

機械による自動翻訳機能については、AIが自力で学習できる「機械学習」(マシーンラーニング/略称ML)から派生した人工知能の一種である「深層学習」(ディープラーニング/略称DL)について、より詳細な説明をしたいと思います。

深層学習(ディープラーニング)の役割

深層学習の構造は、人間の脳神経の構造をモデルとした、人工ニューロンのネットワークに基づいています。このネットワークは、数十または数百のニューロンの「層」により構成されており、それぞれが前の層から情報を受け取り、情報を​​解釈します。このシステムは、例えばテキストに含まれている単語の意味を解釈する前に、文字として認識したり、画像の中に人間の顔が含まれることを、個人を特定する前に検知したりします。

2012年以降、人工ニューロンのネットワークを基本とした機械翻訳は、文章をまとまりごとにも解釈できるようになったため、従来の、統計学を基本とした言葉を1つ1つ訳してから文章にまとめ直す機械翻訳と比べて、飛躍的に精度が向上しました。

また、深層学習は自分で言葉のカテゴリーを認識することもできます。例えば、「犬」という言葉の中には「ラブラドール」も「プードル」も含まれるといった類の解釈ができるようになったことも、翻訳の質の向上につながりました。

機械による自動翻訳の精度は、機械が学習する元となる「翻訳データの総量」と、「対象言語の複雑さ」の、2つの要素に依存しています。

例えば、英語-フランス語の翻訳に関するデータは、日本語やロシア語などの、より稀少な言語よりもデータの総量が多いので、有利であると言えます。次に言語の複雑さですが、ラテン語、ドイツ語、ハンガリー語やフィンランド語など、文法の活用や、文脈次第で単語の形や意味が変化する言語の解釈は、難易度が高いのです。

いずれにしても、機械翻訳の技術は大きく進歩しているのですが、コンピューターが言葉のニュアンスや、文脈から正しい言葉の意味を理解することは、今後の課題として残っています。

ビデオ会議の通訳、翻訳、同時通訳、逐次通訳…何をどう選ぶべき?

現在、機械による自動翻訳機能は、ほぼすべてのビデオ会議システムに搭載されています 。一方、翻訳通訳会社が提供しているビデオ会議用のサポートサービスには、翻訳、同時通訳、逐次通訳、リエゾン通訳といろいろな選択肢がありますが、それぞれの特徴についてご紹介したいと思います。

まず、すべてのカテゴリーに共通して言えることは、翻訳あるいは通訳者が、元の言語を自分の母国語レベルの言語に訳するという点です。

「翻訳」とは、テキスト形式の情報を、テキスト形式で別の言語に訳する作業です。そのため、情報が口頭でやり取りされるビデオ会議の通訳には、マッチしていません。

一方「通訳」とは、口頭で発信された情報を、口頭(あるいはテキスト)で異なる言語にすることを指します。

ビデオ会議に関しては、話者が口頭あるいはチャットで発言した情報を、通訳者があらかじめ定められた参加者あるいは参加者全員に向けて、異なる言語で伝えます。前記の通り、現時点では、このサービスを提供しているビデオ会議システムはZoomのみになります。

流れとしては、ビデオ会議あるいはウェビナーの開始とともに、プロの通訳者がそれぞれの担当チャネルに接続して通訳を行います。参加者は、言語チャネルの1つを選択することで通訳された音声を視聴することができ、同時に元の言語の音声も、より小さな音量で聞くことができます。(元の言語の音声は、オフにすることも可能)

通訳の種類は、瞬時に単語を置き替えながら、話者の後を影のようについて行く「同時通訳」あるいは「 逐次通訳」のいずれかになります。

「逐次通訳」とは、通訳が話者の発言を一旦聞いてメモを取り、解釈した上で話者のニュアンスに最も近い文章を考えてしゃべります。話者は通訳されている間は黙り、通訳が終わるとまた次の発言に進んで行きます。話者の話が長引く場合は、通訳が途中割って入る(20〜30秒ごと程度に)こともありますが、基本は文章の最後にまとめて通訳します。

通訳の種類にかかわらず、会議が2時間以上に及ぶ場合は、通訳の品質を維持するために2名の通訳者が30〜40分おきに交代しながら対応します。

「リエゾン通訳」も、ビデオ会議の通訳に適している通訳形式です。通訳者が参加者の一員のように画面に見える形で参加し、各話者の発言ごとに通訳を行う、グループミーティング、ブレインストーミングや交渉会議と相性が良いスタイルです。

ビデオ会議サービスそのものは基本的に無料で利用できるため、多言語会議にかかるコストは、事前に通訳サービスを申し込んだ際に請求される通訳費のみです。

通訳の対応分野は、時代の変化や文化に応じて、すべての経済および社会セクターに無限に存在します。通訳者が、言語スキル以外にも、文化的、文学的な教養や、技術的な知識を身につけていることが重要であることは、言うまでもありません。

ユビキタス社会寵児翻訳と通訳

ユビキタスの語源はラテン語で「いたるところに存在する(遍在)」という意味があり、インターネットなどの情報ネットワークに、いつでも、どこからでもアクセスできる環境を指します。

例えば、2つの異なる言語でのコミュニケーションの場は、2つの異なる価値観の出会いの場であると言えるでしょう。この異なる者同士の交流の機会を最適なものにするためには、互いの文化を尊重する姿勢が必要不可欠です。

私たちの生きるユキビタス社会において、互いが理解できない事柄を理解する場を設けることは、翻訳通訳が担う使命です。

言語は世界を認識し、組織化するツール

言語学者によると、世界には6000から7000もの異なる言語が存在し、独自の文法構造と音声を持って、それぞれの世界を反映しています。文字が存在しない言語も数多く存在しますが、独自の文字体系を持つ言語は概ね、50種類前後の文字を組み合わせて活用しています。一方で中国語の漢字のように、膨大な種類の文字が存在する言語もあり、文字を体系化する手法は多種多様です。

文字の組む合わせに応じて異なる発音法やコーディング法には、それぞれ歴史的背景があり、その起源については多くの仮説があり、人類学者、考古学者、遺伝学者、科学者達の研究対象となってきました。

言語とは、アイデンティティーの表れ

人類の多くは、最低1つの言語(手話などのサイン言語を含む)を使って生活をしていますが、自分が使用している言語について説明したり、他の言語と比較したり、定義付けたりすることは非常に困難です。

海外に滞在し、他国の言語を学んだ人はよく「自分の生まれ育った国とは異なる生活習慣、言語、文化を通じて初めて、自分の国を理解し始めることができた」と言います。

母国語の学習はもちろん重要ですが、ある程度のレベルまでは、自然と習得できるものでもあります。未知の文化や言語に触れ、自らのアイデンティティーと対峙する瞬間は、自分の文化や言語について知る瞬間でもあります。

時間軸の表現

言語間で異なる特徴の1つに、時間の表現方法があります。

例えばフランス語の文章において時系列は、過去を左側、未来を右側とした水平方向の時間軸のような観念で表現されます。それがアラビア語の場合は逆に右から左、中国語においては、上から下になります。

時間の表し方1つを取っても、言語ごとに大きな違いがあります。

言語における性別

言語によっては、名詞や代名詞に女性、男性、中性と複数の文法性が存在したり、心や意思を持ち、自ら動くものであるか等によって決まる有生、無生といった文法カテゴリーもあります。名詞や代名詞の文法性は、 関連する語の表記や発音に影響を与えます。

フランス語の文法においては、デフォルトの性は男性です。本来フランス語に存在しなかった外来語や、主語の文法性が男女混合で複数ある場合、関連する語には男性形が適応されます。ちなみにヨーロッパの言語では、アイスランド語のみが、男女混合で複数の人間に関連する語に中性が適応されます。

中国語においては、「彼は中国人です」も「彼女は中国人です」も、口頭では同じ発音になり、名詞の文法性も存在しないため、関連する語が変化することもありません。

文法は、言語ごとに大きく異なるだけでなく、例外的な規則も多数存在する複雑なルールであるため、翻訳や通訳の作業には高度な知識が必要です。

さらに、話の内容を正しく理解するためには、言葉のニュアンスの他にも、話者の声色、表情、ジェスチャーによる追加的な意味や、発言の文化的背景、社会的立場など、複数の要素を総合的に加味しながら解釈する必要もあります。

結論

この10年で目覚ましい進化を遂げ、日常生活レベルの翻訳ニーズには非常に便利に使える、機械翻訳。一方で、ビデオ会議の通訳を担うには、まだ程遠い性能レベルであるのが現状です。

機械による通訳は、機械が聞き取った音声をテキスト化し、それを翻訳するというプロセスで処理されるため、「聞き取り」「テキスト化」「翻訳」という3つの関門があり、1つのミスが全体の意味を大きく狂わせてしまうのです。

 

言葉や文章の持つ「ニュアンス」や「含み」を正しく理解することや、声色、表情、文化的背景などを理解した上での解釈などは、人間同士のコミュニケーション上大変重要な要素ですが、機械にはそれらに対応することができません。

プロの人間の通訳のみが、口頭で発信された情報を、言外のニュアンスや含意を理解した上で、要点を整理しつつ、 ターゲット言語の文化にマッチした表現で通訳を行えるのです。

現代社会における翻訳と通訳は、ユキビタスの賜物とも言える、異なる価値観同士に、時間と場所を超越した「橋」をかけるような作業です。

そしてこれは、訓練を積んだプロの通訳者にのみ委ねることができる、特殊技術なのです。

 

リソース :

https://investors.zoom.us/news-releases/news-release-details/zoom-reports-second-quarter-results-fiscal-year-2021
IATA COVID-19 relief : Corporate Travel Management Survey
Babel 2.0 – Où va la traduction automatique ? Signé par Thierry Poibeau
https://lejournal.cnrs.fr/articles/dans-le-secret-des-langues-a-clics
https://fr.wikipedia.org/wiki/Langue_%C3%A0_tons
https://chine.in/mandarin/methode/index.php?lecon=2
https://fr.wikipedia.org/wiki/Langue_agglutinante
https://www.natural-solutions.eu/blog/histoire-du-deep-learning
https://www.coe.int/fr/web/artificial-intelligence/what-is-ai
http://www.axl.cefan.ulaval.ca/monde/origine-langues.htm

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です