筑波大学システム情報工学研究科コンピュータサイエンス専攻科目一覧
統計的言語モデル特論
担当教員
山本幹雄
電子メール myamaATcsDOTtsukubaDOTacDOTjp
URL http://www.coins.tsukuba.ac.jp/~myama/lecture/ から入ってください。
オフィスアワー SB908 月曜11:00-12:00
科目番号 01CH603
分野 知能情報工学分野
基礎/専門の別
授業形態 講義
開講学期 秋AB
時限 火5,6
教室 総合B112-1
キーワード 自然言語処理、言語モデル、スムージング, バックオフ・スムージング, 補完法.
Keyword Natural Language Processing, Language modeling, Smoothing, Backoff-smoothing, Interpolation.
前提条件 入門レベルの確率論、統計学、情報理論の知識。また、 最終課題はプログラミングを伴うため、プログラミング の知識が必要である。
学位プログラム・コンピテンスとの関係 知の活用力,マネジメント能力,コミュニケーション能力,研究力,知識力
学習目標 統計的言語モデルの数理的な理論を学び、実際にモデルを作成できる程度の実践的な技術も同時に身につける。
概要 日本語や英語等の自然言語を計算機処理する技術(自然言語処理)分野のうち、言語の生成的なモデルに関して講義する。特に、大規模コーパス (テキスト・データベース)と確率・統計的な学習手法を利用する手法を中心に学ぶ。
授業計画
1.イントロダクション
2.コーパス言語学と確率論
3.統計学入門(パラメータ推定)
4.ngramモデル入門と情報理論
5.back-offスムージング
6.線形補間とEMアルゴリズム
7.最大エントロピーモデル
8.言語モデルの実装手法
9.確率モデルの設計法
10.課題に関する議論
教科書 web上のpdfファイル。(参考書の(1)は本講義の半分程度の内容をカバーする。)
参考書 (1) 北研二、「確率的言語モデル」、東京大学出版会、 1999.(3800円+税)
(2) C. D. Manning and H. Schutze, "Foundations of Statistical Natural Language Processing", MIT Press, 1999.
成績評価 言語モデル作成課題による成績評価を行う。作成したモデルの性能および課題レポートを評価し、A+, B, C, Dを判定する。
TF・TA
その他の情報 奇数年度(西暦)開講
2015年度まで開講された「自然言語処理特論」(01CH603, 01CJ223)の単位を修得した者の履修は認めない。
ページ先頭へ