龍媒SEO專注高端網站建設,網站優化,營銷型網站設計
微信:sh99002313  電話:189 6217 7230

蘇州高端網站設計
Our toughts in one place

織夢網站系統防止被采集的方法

發布者:龍媒SEO 來源:pbyseo 時間:2019-03-12 查看:1388次

現在有不少的企業和個人都在用織夢網站程序建站的,現在網絡上不管是企業還是個人網站發個文章多數都是采集別人的網站上資料,同樣是原創的文章,但是出現了被復制,被采集,甚至被鏡像網站的結構,直接導致我放棄了以前的網站,現在這個網站同樣是新網站,同樣是原創的文章,但是又遇到了這樣的情況。

因為遇到過同樣的情況,所以這里分享一些防止網站被采集的方法。

1、在代碼上禁止右鍵,禁止復制,可以防止別人復制你的文章。

網站內容被復制的話只能是禁止復制,但是如果轉載者愿意保留你的鏈接,還是非常愿意被分享的,但是如果被轉走還要去掉你的版權,去掉你的鏈接,這就讓人很不舒服了。在被復制這方面,我們只能防君子不能防小人。

但是,不得不說,愿意復制你的文章的,更多的還是不會留你的鏈接的。所以,我們還是禁止別人復制為好,等到你的文章可以達到秒收的情況的時候就可以放開文章復制了。

禁止頁面右擊的代碼,在欄目頁和文章頁,產品內容頁的里加如下代碼:

織夢網站系統防止被采集的方法

這樣可以禁止右鍵,所以可以禁止復制了。但是懂代碼的還是可以復制的。但是可以防止那些大部分的人。另外,也可以添加其他的禁止復制的代碼,綜合運用,提高復制文章的難度,也可以減少被復制的幾率。

2、織夢防止采集可以添加動態ID,還有更好的方法。

現在對防止網站被采集的方法上研究了一段時間,發現網絡上織夢網站防止被采集的方法就是為文章代碼兩頭添加織夢的ID的方式,然后就是多次添加,但是我發現這種ID的方式很簡單,因為ID其實就是文章的ID,感覺很容易被破解。

同時我發現,文章的時候其實有發布時間的,所以就想到用調用的時間替代ID的形式變化更多。

網站防止被采集的方法

用文章發布時間來替代調用ID,變化更多,采集會更難,所以這樣就提高了采集的難度。

大家應該會發現,即便是調用發布時間,數字同樣也是各不相同的,是因為時間有年月日時分秒六種樣式,同時每個都是兩位數的。所以隨便取其中兩個,都會不顯示不同的數字,另外還可以加入ID的形式,一共七種樣式,組合方式會更多,這樣比單單只調用ID的樣式會更加困難,無規律。


代碼:{dede:field.id/}{dede:field.pubdate function="MyDate('YmdHis',@me)"/}

解釋一下:{dede:field.id/}這就是織夢文章ID調用標簽了,后面的YmdHis分別是年月日時分秒,除了年以外,基本上都是兩位數的形式,所以,可以任選組合替換調用ID標簽,也可以綜合運用。最大程度上防止被采集。

一、判斷一個IP在一定時間內對本站頁面的訪問次數,如果明顯超過了正常人瀏覽速度,就拒絕此IP訪問 

弊端: 

1、此方法只適用于動態頁面,如:asp\jsp\php等…靜態頁面無法判斷某個IP一定時間訪問本站頁面的次數;

2、此方法會嚴重影響搜索引擎蜘蛛對其收錄,因為搜索引擎蜘蛛收錄時,瀏覽速度都會比較快而且是多線程。此方法也會拒絕搜索引擎蜘蛛收錄站內文件;

采集對策:只能放慢采集速度,或者不采;

建議:做個搜索引擎蜘蛛的IP庫,只允許搜索引擎蜘蛛快速瀏覽站內內容。搜索引擎蜘蛛的IP庫的收集,也不太容易,一個搜索引擎蜘蛛,也不一定只有一個固定的IP地址; 

評論:此方法對防采集比較有效,但卻會影響搜索引擎對其收錄。 

二、用javascript加密內容頁面 

弊端:此方法適用于靜態頁面,但會嚴重影響搜索引擎對其收錄情況,搜索引擎收到到的內容,也都是加密后的內容;

采集對策:建議不采,如非要采,就把解密碼的JS腳本也采下來; 

建議:目前沒有好的改良建議;

評論:建議指望搜索引擎帶流量的站長不要使用此方法。 

三、把內容頁面里的特定標記替換為”特定標記+隱藏版權文字“ 

弊端:此方法弊端不大,僅僅會增加一點點的頁面文件大小,但容易反采集;

采集對策:把采集來的含有隱藏版權文字內容的版權文字替掉,或替換成自己的版權; 

建議:目前沒有好的改良建議;

評論:自己感覺實用價值不大,就算是加上隨機的隱藏文字。 


總結:以上這種采用時間替代ID的方式比只用ID的方式更復雜一些,采集文章會更加困難,當發現采集你的網站比較困難的時候,自然就會選擇其他目標了,當然,對這樣對大部分的小白采集很有用處,對一些采集高手還是可以破解了,不過,真正的采集高手我想也不會來采集你的網站了吧。


標簽:
好看的中文字幕