|
データ解析特論
|
|
| 担当教員 |
亀山啓輔,日野英逸,津川翔
|
| 電子メール | 亀山啓輔(keisuke@cs),日野英逸(hidehino@cs),津川翔(s-tugawa@cs) |
| URL | 資料などの配布にはmanabaを利用する. |
| オフィスアワー | 各担当教員に事前に連絡のこと. |
| 科目番号 | 01CH738, 01CJ235 |
| 分野 | 共通科目 |
| 基礎/専門の別 | |
| 授業形態 | 講義+演習 |
| 開講学期 | 秋AB |
| 時限 | 木5,6 |
| 教室 | 3B405 |
| キーワード | データ解析,統計学 |
| Keyword | Data analysis, Statistics |
| 前提条件 | 学部(学類)レベルの確率論,統計学の知識. |
| 学習目標 | 多様なデータに対して,それらを解析,解釈するための基礎から発展に至る手法を理解する. 修士論文研究を行う上で研究成果をデータに基づき客観的に評価し,プレゼンテーションできるようになる. |
| 概要 | コンピュータサイエンス研究の様々な場面で遭遇する多様なデータを用いた分析,解釈,予測に関して,基礎的な知識の確認から開始し,従来より用いられてきた解析手法,近年開発されてきている手法に至るまで,それぞれの考え方と特徴について講述し,R言語を用いた演習を行う. |
| 授業計画 |
亀山担当 第1週:導入 第2週:推定 第3週:主成分分析 第4週:相関解析と回帰 日野担当 第5週:データハンドリング 前処理,層別化,分割,種々の可視化 第6週:検定と検出力分析 統計的検定の基礎と,検定・検出力・効果量とサンプルサイズの設計 第7週:サンプリングメソッド 計算機指向統計手法入門 津川担当 第8週:ネットワーク分析 第9週:クラスタリングとその評価 第10週:データのランキングとその評価 |
| 教科書 | |
| 参考書 |
Rで学ぶデータサイエンスシリーズ(共立出版) Applied Predictive Modeling, Max Kuhn & Kjell Johnson,Springer,2013 |
| 成績評価 | 3名の担当教員の課するレポートを総合して評価する. |
| TF・TA | |
| その他の情報 | 毎週2時限の授業のうち,前半を講義,後半をR言語を用いた演習にあてる.R言語の処理系を実行することができるノートパソコンを持参すること. |