Quantcast
Channel: WFU BLOG
Viewing all articles
Browse latest Browse all 571

網站救援服務﹍復原被刪除的部落格文章

$
0
0
blog-post-rescue.jpg-網站救援服務﹍復原被刪除的部落格文章之前經歷「Blogger 網誌被刪除」事件,為了救回被刪除的一列相關網站,開發了網站救援工具,可以從網路現存的備份頁面,爬取文章相關內容。 由於處理了相當多網站,此工具已可作為一項服務,有需要網站救援的話請用文末聯絡表單與本站聯繫。 (圖片出處: unsplash.com)

一、救援管道

網站救援跟硬碟救援的概念有點像又不太一樣,硬碟資料不見了,必須用工具從硬碟磁區想辦法將檔案碎片拼湊回來。而網站若是被刪除,想要救回所有文章的話,得想辦法從整個浩瀚的網路上,看看是否有哪些地方曾經備份過你的文章資料。 如果網站很冷門,沒有任何其他網站想要收集,那麼在沒有任何網路備份的情況下,將沒有任何救援的機會。這也就是說,除非網路上能找到曾蒐集你文章的蛛絲馬跡,才能把各處的文章碎片收集起來,盡可能恢復原本的網站內容。 過去我們痛恨某些抄襲網站直接複製貼上我們的文章內容,但此時反而要感謝他們幫我們進行異地備份。以下列舉一些能找回文章碎片的管道:
  • Wayback Machine:最主要的網路備份服務
  • RSS 閱讀器:有人曾訂閱網站的話就能找到備份
  • 瀏覽器快取:從瀏覽器快取有機會找到近期的快取頁面內容
  • 瀏覽器搜尋:搜尋自己的文章標題或內容,或許能從抄襲網站找到內容

二、Wayback Machine

Wayback Machine」( 網站時光機)這個網路服務備份了世界上多數網站的內容,也是主要的救援管道。如果你的網站越熱門,這個服務備份的內容也會越頻繁、越多,可以說是目前最強的網頁救援武器。 但他並非營利網站,所以伺服器的運作會有優先工作排程,不可能即時備份所有網站的文章,這也就是說可能會有時間差,例如以目前 2024 這個時間點,他最多只能備份到 3 個月前的文章。將來網站更多、伺服器更累的情況,能備份到什麼程度誰也說不准。 總之這是個佛心也是最強的網站備份服務,然而終究無法備份所有的內容。但我多次需要靠此服務救援客戶文章,所以已經 donate 多次,未來如果有需要本站協助救援的話,費用的一部分也會包含對此網站的捐獻。

三、RSS 閱讀器及瀏覽器

1. RSS 閱讀器如果網站夠熱門的話,在許多 RSS 閱讀器可能會有讀者訂閱,那麼就能找到完整的文章備份,例如「Feedly RSS 閱讀器」。 那麼跟「Wayback Machine」相比,「RSS 閱讀器」可能是唯一能夠找回所有文章的管道。但若是沒有任何讀者訂閱的話,RSS 閱讀器也將找不到半篇文章的蹤跡。 2. 瀏覽器快取由於 Google 已經宣佈「不再提供"網頁庫存"服務」,那麼只能從其他瀏覽器的快取試著尋找蛛絲馬跡了,例如在這些瀏覽器輸入 site:網址然後試著從搜尋結果,看看有沒有提供快取頁面了。

四、救援工具說明

1. Wayback Machine本站救援工具主要會爬 Wayback Machine 的資料,並儲存以下內容:
  • 文章 HTML 內容
  • 標籤
  • 留言
blog-post-rescue-1.jpg-網站救援服務﹍復原被刪除的部落格文章爬完的資料會儲存在 Google 試算表,上圖為文章相關資料。 blog-post-rescue-2.jpg-網站救援服務﹍復原被刪除的部落格文章上圖為爬取留言的紀錄 2. RSS 閱讀器及瀏覽器如果能在 RSS 閱讀器找到訂閱備份的話,本站也有工具可以爬取所有文章內容。 不過 RSS 閱讀器的缺點為,無法紀錄標籤及留言,所以經由此管道的話,只能備份文章內容。 3. 瀏覽器快取如果要從瀏覽器快取取的文章備份,缺點是必須每個頁面逐一手動複製內容,這件事沒辦法程式化。 如果能在瀏覽器快取找到備份頁面,本站可提供工具,簡化手動複製的時間,快速一鍵取得相關內容。 4. 製作部落格匯入檔在 Google 試算表儲存的所有備份資料,可以依照不同平台的需求,來製作匯入檔,例如:
  • Blogger
  • WordPress
如有其他平台的需求,請提供匯入檔範例,來判斷匯入檔格式,以製作對應的匯入檔。

五、聯絡表單

如您需要網站救援的話,請填寫下面的表單與我聯繫:
稱呼:(必填)
電子郵件:(必填)
填寫表單網址:(必填)
填寫表單目的:(必填)
請詳細描述您的需求、問題或意見:(必填)
更多「資訊安全」相關文章:

Viewing all articles
Browse latest Browse all 571

Trending Articles