University of Tsukuba | Grad. Scho. Syst. and Info. Eng. | Dept. Comp. Sci. | List of Lectures
自然言語処理特論
Instructor(s)
山本幹雄
E-Mail myamaATcsDOTtsukubaDOTacDOTjp
URL http://www.coins.tsukuba.ac.jp/~myama/lecture/ から入ってください。
Office hours 7B214 月曜11:00-12:00, その他はメールでアポイントメントを取ってください。
Cource# 01CH603, 01CJ223
Area 知能情報工学分野
Course style 講義
Term
Period
Room#
Outline 日本語や英語等の自然言語を計算機処理する技術(自然 言語処理)に関して講義する。特に、大規模コーパス (テキスト・データベース)と確率・統計的な学習手法 を利用する手法を中心に学ぶ。
Keywords Statistical Natural Language Processing, Language modeling, Statistics
Prerequisites 入門レベルの確率論、統計学、情報理論の知識。また、 最終課題はプログラミングを伴うため、プログラミング の知識が必要である。
Course plan
1.自然言語の統計的な性質
2.確率と統計学の復習
3.ngramモデル入門と情報理論
4.ngramモデルのスムージング
5.EMアルゴリズムとInterpolation
6.最大エントロピーモデル
7.隠れマルコフモデル
8.ベイズ統計と言語モデル
9.トピックモデル
10.最終課題に関する議論
Textbook web上のpdfファイル。(参考書の(1)は本講義の半分程度 の内容をカバーする。)
References (1) 北研二、「確率的言語モデル」、東京大学出版会、 1999.(3800円+税)
(2) C. D. Manning and H. Schutze, "Foundations of Statistical Natural Language Processing", MIT Press, 1999.
Evaluation ○以下の3つの条件をすべて満たすことが単位取得の最 低条件
  (1)授業への出席(80%以上)
  (2)最終課題レポートの期限内の提出
  (3)最終課題の最低条件のクリア
○成績A〜Cのグレードは最終課題のパフォーマンスで決 定する。
TF / TA
TOP