東京大学教員の著作を著者自らが語る広場

白い表紙の上部にピンクの渦のようなイラスト

書籍名

情報工学テキストシリーズ 自然言語処理 第5巻

著者名

加藤 恒昭 (著)、 三木 光範 (編)

言語

日本語

発行年月日

2014年12月

ISBN コード

978-4-320-12265-9

出版社

共立出版

出版社URL

書籍紹介ページ

学内図書館貸出状況(OPAC)

自然言語処理

英語版ページ指定

英語ページを見る

自然言語とは、人間が日常的に用いている言葉、つまり日本語や英語や中国語のことであって、自然言語処理は、それをコンピュータで処理して、何か役に立つことを実現しようという情報工学の一分野である。ウェブ検索や自動翻訳がその応用先としてあげられ、ウェブをはじめとしたテキスト情報がますます膨大になってきている現代社会において大きな期待を持たれている。一方で、言語を処理するためには、言語を理解したり産出したりする仕組みを考えることが必要になるため、自然言語処理は、それらを人間がどのように行っているかを探求するという科学的な側面も併せ持つ。
 
本書は自然言語処理技術のいわゆる教科書であるが、技術や工学としての側面だけでなく、併せて、言語学にも繋がる科学的な側面への知見をとりあげている。処理の方法だけでなく処理の対象についても学ぶことは一般に必要であるが、特に自然言語処理の場合、その対象が言語という人間的で知的な生産物であるので、その重要性は特に大きいと考えている。内容としては、学部後期課程あるいは大学院修士課程の1セメスタの授業を想定したものとなっているが、同程度の分量を持つこれまでの教科書では取り上げられていなかった依存構造解析や統計的機械翻訳等、比較的新しいトピックも含めていることが大きな特徴である。併せて、演習問題が充実していることもあげておきたい。意味処理、文脈処理ということになると、学習者の理解を助ける演習問題を作成するのは難しく、貧弱になってしまうことが多いが、本書では手間を惜しまず、問題を工夫した。これらを通じて、読者がしっかりと技術の中身を身につけていただければ幸いである。
 
著者として、本書の執筆は一冊の書籍を仕上げることの大変さをあらためて思い知らされた体験であったが、それに懲りもせず、幾つか想い描いていることがある。ひとつには、すべての技術の例に漏れず、それどころかそれを代表するかのように、自然言語処理技術は日進月歩で、最近では、本書で紹介しきれなかった技術が学会を席巻している。それらを理解する基礎はまがりなりにも本書で書き終えたので、それに続いて技術の「今」を紹介するような新たな書籍を著せたらと願う。もうひとつは、それと直交する方向で、言語についての科学と工学をもっとバランスよく、理系文系を問わず、言語に興味と関心を持つすべての人達を対象として、言語とその処理をもっと面白いと思っていただくように誘う書籍を執筆できればと考えている。いずれも筆者の手に余る大望ではあるが、恐れを知らず、その機会を狙っている次第である。
 

(紹介文執筆者: 総合文化研究科・教養学部 教授 加藤 恒昭 / 2016)

本の目次

第1章 自然言語処理とは
第2章 形態素処理
第3章 情報検索
第4章 情報検索の関連技術
第5章 統語処理とチャンキング
第6章 句構造解析
第7章 依存構造解析
第8章 意味処理
第9章 語の意味
第10章 文脈処理
第11章 機械翻訳

このページを読んだ人は、こんなページも見ています