ページランクとトラストランク
トラストランクとは、リンク分析手法の一つである。 つまりトラストランクによって、有益なウェブページをスパムから半自動的に区別することができる。
多くのウェブ上にあるスパムページは、検索エンジンを「騙す」ように作られている。こういったページは、主に商用目的て作られており、さまざまなテクニックを用いて、検索エンジンで上位に表示されるように工夫している。しかも上位に表示されるに値しないウェブページであるため、スパムとみなされる。人間の目で確認すれば、これらのウェブページがスパムであるかどうかは簡単に判別できるが、人力に頼って多大な数のページをチェックしていくのは費用がかかりすぎるのである。
検索順位を上位にするためによく使われるのは、複雑なリンク対策によって、ウェブページの重要性を不自然に高めるという手法である。 これは、ウェブ上のドキュメントの相対的な重要度を測る、グーグルのページランクや同様の方法が悪用され得ることを物語っている。
トラストランクという方法は、専門家の判断による元となる信頼の置ける(トラスト)ページ(種ページ)を選ぶことから始まる。信頼の置ける元ページが人的に選ばれたところで、そのページセットから出る外部リンクをクロールして同様の信頼の置けるページを探しにいくことになる。元ページから離れれば離れるほど、あるページのトラストランクは減少することになる。
トラストランク手法を編み出した研究者たちは、関連トピックや「スパム・マス」(スパムがページの検索結果順位に及ぼす影響力)などをさらに調べることによって益々トラストランクというリンク分析手法に磨きをかけている。
2007年07月20日 13:07トラックバックURL http://www.hirakawatomokazu.com/mt/mt-tb.cgi/14