■
簡単にまとめます。
まず、できるだけ早くサーバーをオフラインにします。
電源を切ったり、ネットワークから切り離したりして、アクセスができない状態にするということです。
そうしないとクローラがアクセスして、トラブルに見舞われている状態を最新として、キャッシュしてしまうからです。
次に、Warrickというサービスを使って、データを取り戻します。
Warrickというのは初めて知ったのですが、Internet Archive, Google, Live Search, Yahooにキャッシュされているデータを探し出して集めてくれるサービスです。