Studencheskie Programmisty

Google・Yahoo・Internet Archiveから情報を削除する方法

Apr 15, 2010

移転前のサイトを検索で引っかからないようにしようと思ったので、ついでに削除方法をまとめてみることにした。

Google

Googleに削除してもらうためには、必ずすでに削除してもらいたい部分が削除されている必要がある。具体的には、

  • サイト全体、もしくはディレクトリ全体
    • robots.txtで、サイト全体もしくはディレクトリ全体をブロックしている
  • 1つのページ
    • 削除したいページにアクセスした際に、404または410が返る
    • robots.txtでクローラーのアクセスがブロックされている
    • noindex メタタグでサイトのインデックスがブロックされている
  • ページの一部分
    • ある語句で検索した時にページがヒットするのを拒否したい時は、その語句をサイト上から削除する必要がある。

ただし、以下の情報のいずれかが掲載されているサイトの場合には、情報が削除されていなくても検索結果から削除される。

  • 政府発行の個人識別番号(住基ネット番号とかだろうか?)
  • 銀行口座番号またはクレジットカード番号
  • 手書きの署名の画像

また、ページをリダイレクトさせている場合、302を返しているとGoogleはリダイレクト前のページを参照し続けるので注意。301を返すようにしたほうが良い。ちなみにmetaタグを用いてリダイレクトさせる場合、下の1行目のように即時にリダイレクトさせていると301に、2行目のように間隔を空けていると302として扱われる。このことはYahoo!も同様である。

<meta http-equiv="Refresh" content="0,http://・・・>
<meta http-equiv="Refresh" content="10,http://・・・>

自分で、もしくはサイト管理人に連絡して情報を削除したら、次はGoogleに削除の申請を行う必要がある。自分が管理しているサイトの場合はウェブマスター ツールを使うと良い。ディレクトリごとの削除も申請できるので簡単である。ダッシュボード > サイト設定 > クローラのアクセス > URL の削除 から行える。

自分が管理していないサイトの場合、ウェブページ削除リクエストツールを使う。こちらの場合は、他人のサイトを削除することになるため、審査が厳しめである。削除された場合、少なくとも90日間は検索結果から表示されなくなる。

Yahoo!

Yahoo!の場合は、基本的に自分が管理しているサイトのみ削除することが出来るシステムとなっている。自分が管理している場合には、サイトエクスプローラーから削除することが出来る。管理サイト詳細 > インデックス状況から、「検索結果で非表示」というボタンを押せば完了。無審査で削除が可能である。

一方、他人のサイトの場合は少々厄介で、Googleと同じように簡単に削除を申請できるツールはない。情報を削除してもらった後で、Yahoo!のクローラーがページを再クロールしてもらうのを待つしかない。ただ、個人情報などのやばい情報の場合は、Yahoo!検索の問題となる検索結果に関するご連絡 - 情報提供フォームから連絡すれば削除してもらえる可能性はある。ただ、明確な削除基準が示されていない上、審査結果が分からないため、Googleほどには分かりやすくない。

Internet Archive

Internet Archiveは、robots.txtでアクセスをブロックすれば、過去の全てのページも見れなくなるので、robots.txtを置く/置いてもらうのが最も簡単。何らかの事情で設置できない場合には、info@archive.org宛てにメールを送るしかない。

    近況報告

    Apr 11, 2010

    新年度になって一息ついたので。といっても1ヶ月ぶりの日記か...もっと頻度を高めたい物だが今年から忙しくなりそうだし。

    クラス分けがされたが知り合いが結構いるのでまず一安心。ハズレなのは担任と英語教師くらい。よかったよかった。

    備忘録

    • 学校の課題で発見したIE向けの対策を導入する。
    • 最近作ってるゲームについて書く
    • アニメについて(ry

    まあまた時間がとれたらおいおいということで。漢検準1級の勉強が終わらないー