課題1:Webリンク解析

→ 詳細マニュアルはこちら

本実験では,Web ページのリンク関係を用いて各ページの人気度を測る方法について学ぶ.Web ページ間の閲覧者の移動を行列で表すことで,Web ページを閲覧している人の移動の問題が行列の固有値問題に帰着する.MATLAB を用いて,この移動を表す行列の生成やその固有値計算などを行う.さらに,そのプログラムを用いて実際の Web ページを解析する.

webページのリンク構造の例

実験課題(概略)

実験課題1-1:Webリンク構造の行列表現

図に示すようなリンク構造の Web について,リンク関係を表す行列 G,および,それに対応する移動確率を表す行列 A を生成せよ.すべての要素が1/6 の 6 次元ベクトル x を与えて Ax を計算し,その要素がどのように変化するか確認せよ.

実験課題1-2:固有値問題解法の利用

A の固有値と固有ベクトルを求めよ.A の固有ベクトルのうち,固有値 1 に対応するベクトルを y とし,y の要素が大きいものから順に並べ替え,並べ替えた順番を示せ.要素を並べ替える MATLAB の関数は sort である.引数などの関数の使い方はコマンドウインドウ上で help sort と入力することで得られる.

実験課題1-3:簡単な例によるWebページ人気度の計算

図 に示すようなリンク関係を表す行列 G,および移動確率を表す行列 A を求めよ.ページの人気度の順番を示せ.

実験課題1-4:実際のWebによる解析

MATLAB の関数 surfer は,与えられたページから下のリンク構造を返す.適当な Webサイトを選び,この関数を用いてリンク構造を求め,ページの人気度を解析せよ.その結果について考察し,この方法によって得られる結果に問題点がないかどうか検討せよ.もし,問題点が見つかった場合,それに対してどういう解決策が考えられるか述べよ.