之前經歷「Blogger 網誌被刪除」事件,為了救回被刪除的一列相關網站,開發了網站救援工具,可以從網路現存的備份頁面,爬取文章相關內容。
由於處理了相當多網站,此工具已可作為一項服務,有需要網站救援的話請用文末聯絡表單與本站聯繫。
(圖片出處: unsplash.com)
site:網址 :
然後試著從搜尋結果,看看有沒有提供快取頁面了。
一、救援管道
網站救援跟硬碟救援的概念有點像又不太一樣,硬碟資料不見了,必須用工具從硬碟磁區想辦法將檔案碎片拼湊回來。而網站若是被刪除,想要救回所有文章的話,得想辦法從整個浩瀚的網路上,看看是否有哪些地方曾經備份過你的文章資料。 如果網站很冷門,沒有任何其他網站想要收集,那麼在沒有任何網路備份的情況下,將沒有任何救援的機會。這也就是說,除非網路上能找到曾蒐集你文章的蛛絲馬跡,才能把各處的文章碎片收集起來,盡可能恢復原本的網站內容。 過去我們痛恨某些抄襲網站直接複製貼上我們的文章內容,但此時反而要感謝他們幫我們進行異地備份。以下列舉一些能找回文章碎片的管道:- Wayback Machine:最主要的網路備份服務
- RSS 閱讀器:有人曾訂閱網站的話就能找到備份
- 瀏覽器快取:從瀏覽器快取有機會找到近期的快取頁面內容
- 瀏覽器搜尋:搜尋自己的文章標題或內容,或許能從抄襲網站找到內容
二、Wayback Machine
「Wayback Machine」( 網站時光機)這個網路服務備份了世界上多數網站的內容,也是主要的救援管道。如果你的網站越熱門,這個服務備份的內容也會越頻繁、越多,可以說是目前最強的網頁救援武器。 但他並非營利網站,所以伺服器的運作會有優先工作排程,不可能即時備份所有網站的文章,這也就是說可能會有時間差,例如以目前 2024 這個時間點,他最多只能備份到 3 個月前的文章。將來網站更多、伺服器更累的情況,能備份到什麼程度誰也說不准。 總之這是個佛心也是最強的網站備份服務,然而終究無法備份所有的內容。但我多次需要靠此服務救援客戶文章,所以已經 donate 多次,未來如果有需要本站協助救援的話,費用的一部分也會包含對此網站的捐獻。三、RSS 閱讀器及瀏覽器
1. RSS 閱讀器如果網站夠熱門的話,在許多 RSS 閱讀器可能會有讀者訂閱,那麼就能找到完整的文章備份,例如「Feedly RSS 閱讀器」。 那麼跟「Wayback Machine」相比,「RSS 閱讀器」可能是唯一能夠找回所有文章的管道。但若是沒有任何讀者訂閱的話,RSS 閱讀器也將找不到半篇文章的蹤跡。 2. 瀏覽器快取由於 Google 已經宣佈「不再提供"網頁庫存"服務」,那麼只能從其他瀏覽器的快取試著尋找蛛絲馬跡了,例如在這些瀏覽器輸入四、救援工具說明
1. Wayback Machine本站救援工具主要會爬 Wayback Machine 的資料,並儲存以下內容:- 文章 HTML 內容
- 標籤
- 留言
- Blogger
- WordPress
五、聯絡表單
如您需要網站救援的話,請填寫下面的表單與我聯繫:更多「資訊安全」相關文章: