簡単にまとめます。

まず、できるだけ早くサーバーをオフラインにします。

電源を切ったり、ネットワークから切り離したりして、アクセスができない状態にするということです。

そうしないとクローラがアクセスして、トラブルに見舞われている状態を最新として、キャッシュしてしまうからです。

次に、Warrickというサービスを使って、データを取り戻します。

Warrickというのは初めて知ったのですが、Internet Archive, Google, Live Search, Yahooにキャッシュされているデータを探し出して集めてくれるサービスです。