筑波大学システム情報工学研究科コンピュータサイエンス専攻科目一覧
自然言語処理特論
担当教員
山本幹雄
電子メール myamaATcsDOTtsukubaDOTacDOTjp
URL http://www.coins.tsukuba.ac.jp/~myama/lecture/ から入ってください。
オフィスアワー SB908 月曜11:00-12:00, その他はメールでアポイントメントを取ってください。
科目番号 01CH603, 01CJ223
分野 知能情報工学分野
基礎/専門の別
授業形態 講義
開講学期
時限
教室
キーワード 統計的自然言語処理、言語モデル、統計学
Keyword Statistical Natural Language Processing, Language modeling, Statistics
前提条件 入門レベルの確率論、統計学、情報理論の知識。また、 最終課題はプログラミングを伴うため、プログラミング の知識が必要である。
学習目標
概要 日本語や英語等の自然言語を計算機処理する技術(自然 言語処理)に関して講義する。特に、大規模コーパス (テキスト・データベース)と確率・統計的な学習手法 を利用する手法を中心に学ぶ。
授業計画
1.自然言語の統計的な性質
2.確率と統計学の復習
3.ngramモデル入門と情報理論
4.ngramモデルのスムージング
5.EMアルゴリズムとInterpolation
6.最大エントロピーモデル
7.隠れマルコフモデル
8.ベイズ統計と言語モデル
9.トピックモデル
10.最終課題に関する議論
教科書 web上のpdfファイル。(参考書の(1)は本講義の半分程度 の内容をカバーする。)
参考書 (1) 北研二、「確率的言語モデル」、東京大学出版会、 1999.(3800円+税)
(2) C. D. Manning and H. Schutze, "Foundations of Statistical Natural Language Processing", MIT Press, 1999.
成績評価 ○以下の3つの条件をすべて満たすことが単位取得の最 低条件
  (1)授業への出席(80%以上)
  (2)最終課題レポートの期限内の提出
  (3)最終課題の最低条件のクリア
○成績A〜Cのグレードは最終課題のパフォーマンスで決定する。
TF・TA
その他の情報 奇数年度(西暦)開講
ページ先頭へ