
我們講到了采集內容的弊端與風險,但仍然有不少網站為了快速充實網站的內容,不斷地采集內容,以獲取更大的流量,追求網站短期內的最大利益而不顧一切。我們只能通過一些技術手段采取措施防止內容被采集。
1.加上隨機廣告或版權聲明網站
采集者在采集時,通常都是指定頭尾特征從哪到哪過濾。我們可以在文章頭尾加隨機廣告,當然隨機廣告是不固定的。比如文章的內容是“防止網站內容被采集的4種方法”,則可以這樣加入隨機廣告或版權說明:
<div id=”xxx”>隨機廣告 “防止網站內容被采集的4種方法”內容出自XX網站(xxx.com)</div>
2.圖片防盜鏈
現在很多博客服務商都作了圖片防盜鏈處理,由服務器程序判斷,當前圖片被外部調用時,提示“此圖片僅限于XX用戶之間交流與溝通”,這只對有圖片的內容有效,不管圖片被保存到本地還是遠程連接都可以防止被盜。
3.使用多套模板
采集器的原理就是根據關鍵字符串找出要采集的內容,多做幾個列表和內容模板,使用隨機模板可有效地防止采集器,并對搜索引擎無任何影響。模板越多,采集者需要定制的對策采集模板就越多。但是需要懂得采集器原理來制作防采集模板,不然就會白費工夫。
4.使用專業的防采集軟件
目前防采集這塊做得不錯的軟件要算魚羊防采集了,它能在很大程度上防止采集器的采集。其對網頁瀏覽速度無影響,不需要專業知識與技巧,對搜索引擎無影響。最新的v3.0版只能運行在Windows的IIS下,需要獨立的服務器。