東京大学教員の著作を著者自らが語る広場

緑の表紙

書籍名

Routledge Studies in Translation Technology and Techno-Humanities Controlled Document Authoring in a Machine Translation Age

著者名

Rei Miyata

判型など

236ページ

言語

英語

発行年月日

2022年4月29日

ISBN コード

9780367500207

出版社

Routledge

出版社URL

書籍紹介ページ

英語版ページ指定

英語ページを見る

「以下の書類を提出します」
 
この文を英語に訳してくださいと言われたらどうしますか。高校の英語の授業課題であれば、適当に主語を補完して、“I will submit the following document.”とすれば十分かもしれません。しかし、現実の産業翻訳であれば、この文がどのようなジャンル・分野のどのような文書のどのような場所に書かれているか、といったことを確認した上で訳す必要があります (というより、そのような確認をした上で翻訳が開始されるはずです)。例えば、この文が、自治体が発信する市民向けの文書において行政手続きを順を追って説明する箇条書きの一つだとします。またこの文の直後に、提出すべき書類が2つ書かれていたとします。そうすると、“Submit the following documents.”のように、命令文を使用し、「書類」は複数形で訳出する方法が候補にあがるでしょう。もちろん、これ以外にも翻訳の目的や準拠すべきスタイルガイドに照らしながら、最終的な訳文が作られます。
 
プロの翻訳者であれば、妥当な翻訳に到達するために、このような判断は「当たり前」にやっているはずです。それでは、機械翻訳ではどうでしょうか。本書では、機械翻訳を用いながら、文書の属性や要素を考慮した翻訳を実現する方法を提案し、その効果を検証しています。ポイントは、機械翻訳そのものに手を加えるのではなく、入力である日本語原文をうまく編集することです。例えば、上記の例では、箇条書きの動作ステップでは、翻訳前処理の段階で、原文を「~提出しろ」という命令文に書き換えておくことで、英語でも“Submit ...”と命令形で訳す可能性が上がります。単純ではありますが、文書の構造に応じた言語の表現形式を定め、執筆の段階で十分に表現を統制することで、機械翻訳の高度な活用が期待できます。なおここで、「文書の構造」や「言語の表現形式」とはそもそも何であり、どのような種類のものがあるかについては、プロの翻訳者の間でも、必ずしも明確な知識として共有されているわけではありません。それを言葉にし、地道に整理する作業が本書の第II部でなされています。
 
本書の研究では、現在主流の方式である深層学習を用いたニューラル機械翻訳は扱われていません。自然言語処理技術がめまぐるしく進展する中で、本書で扱う個々の技術自体は正直なところ時代遅れになりつつあります。しかし、現在の機械翻訳は、依然として文書の属性や要素を広範かつ明示的に考慮するものではありません。大量の訓練データからそれらを暗黙的に学んでいるともいえますが、翻訳結果についてなぜそれでよいのかを説明してくれるわけではありません。また、最近では、ChatGPTなど大規模言語モデルを活用した生成系AIサービスが注目され、言葉で具体的な指示を与えることでよりよい翻訳を出力する可能性も模索されています。文書や言語を精密に理解し制御するという本書で示した枠組みは、最新の技術を用いて、改めて検証する価値があるといえます。
 
なお、本書の研究の展開として、翻訳において参照されうる文書の属性や要素をより網羅的に整理する作業を進めており、その成果は、産業翻訳を主な対象とした翻訳プロセスのメタ言語を作る試みの一つとして書籍化されています。
 

(紹介文執筆者: 教育学研究科・教育学部 講師 宮田 玲 / 2023)

本の目次

Part I. Research background
1. Introduction
2. Related work
 
Part II. Controlled document authoring
3. Document formalization
4. Controlled language
5. CL contextualization
6. Terminology management
 
Part III. MuTUAL: An authoring support system
7. System development
8. Evaluation of the CL violation detection component
9. System usability evaluation Part
 
Part IV. Conclusion
10. Research findings and outlook

関連情報

受賞:
第50回日本図書館情報学会賞 (日本図書館情報学会 2021年度)
https://jslis.jp/activities/awards/lis/
 
第37回電気通信普及財団賞 (テレコム学際研究賞) (電気通信普及財団 2021年度)
https://www.taf.or.jp/award/inter/inter.html
 
書評:
Xie’an Huang & Hong Xu 評(『Language Resources and Evaluation』Vol.57 pp.1423–1430 2023年)
https://doi.org/10.1007/s10579-022-09598-0
 
清田陽司 評 (『日本図書館情報学会誌』67巻3-4号 pp.167–168 2021年)
https://doi.org/10.20651/jslis.67.3-4_167

このページを読んだ人は、こんなページも見ています