在Zac的某本書中他說過一句話讓我印象深刻:權(quán)重高的網(wǎng)站轉(zhuǎn)載權(quán)重低網(wǎng)站的文章時,百度往往會默認(rèn)權(quán)重高的網(wǎng)站為原創(chuàng)文章。
未收錄不代表未抓取
確實(shí),為了SEO的發(fā)展,自己辛辛苦苦寫了兩篇原創(chuàng)文章,被一個大型網(wǎng)站抄襲秒收錄,而自己的站點(diǎn)卻不收錄,這是一件非常讓人尷尬的事情,那么真的不收錄,就不是原創(chuàng)了嗎?
很多朋友是這樣認(rèn)為的,自己的文章沒有被收錄,而抄襲者的卻收錄了,所以百度判斷自己抄襲了別人的文章,所以自己權(quán)重也就一直上不來,排名一直沒有。其實(shí)這是一個錯誤的觀點(diǎn),我曾在百度排名規(guī)則的文章中提到,百度收錄是需要經(jīng)過抓取-識別-釋放這三個流程。其中在釋放的流程中,需要判斷整體網(wǎng)站的質(zhì)量,當(dāng)整體網(wǎng)站質(zhì)量過關(guān),收錄相對較快,當(dāng)整體網(wǎng)站信譽(yù)度沒有達(dá)到百度的標(biāo)準(zhǔn),百度將會暫時保留你的文章,不被釋放出來。
不被釋放出來,但是已經(jīng)經(jīng)過了抓取和識別這兩個流程,在這里特別的說一下抓取的流程,當(dāng)網(wǎng)站建立以后,提交到搜索引擎,搜索引擎基本每天都會來抓取,大家可以試著安裝百度云加速后臺可以統(tǒng)計(jì)出抓取的頁面,如果抓取不夠,也可以在百度站長平臺中設(shè)置抓取頻率和sitemap自動推送,這樣抓取的是完全沒有壓力。設(shè)置方法如下:
打開【百度站長平臺】點(diǎn)擊左側(cè)導(dǎo)航【我的網(wǎng)站】-【站點(diǎn)管理】-【添加網(wǎng)站】-輸入網(wǎng)站域名,根據(jù)自身?xiàng)l件驗(yàn)證網(wǎng)站。
然后點(diǎn)擊左側(cè)導(dǎo)航【頁面抓取】-【鏈接管理】-提交方式選擇【sitemap】,然后將自己的網(wǎng)站地圖提交上去,更新時間更具你網(wǎng)站的更新時間來設(shè)置,比如網(wǎng)站每天更新一篇文章,那么就填寫1天,論壇、門戶可能添加的比較多。
另外在把sitemap地圖寫到robots里面,抓取基本是完全沒有問題,那么接下來就進(jìn)入識別系統(tǒng),每一個頁面抓取了,就一定會進(jìn)行識別對比,是否會出現(xiàn)重復(fù),與互聯(lián)網(wǎng)的內(nèi)容重復(fù)度有多少,從而判斷出頁面的原創(chuàng)度。那么在已經(jīng)判斷出原創(chuàng)度的時候,再來談收錄,先收錄誰不代表誰就是原創(chuàng)了!
如何判斷文章的原創(chuàng)度?
并不是你網(wǎng)站有文章,是你自己寫的,就一定會被搜索引擎認(rèn)為這是一篇原創(chuàng)文章,因?yàn)槠渲羞€有很多技術(shù)方面的問題,搜索引擎還未能解決。
記得我曾經(jīng)在一個網(wǎng)站每天更新一篇文章,一篇文章的字?jǐn)?shù)只有100字左右,但是文章頁面非常簡單,簡單到整個頁面沒有JS、CSS、HTML代碼,只有文字,但收錄卻非常好,而有一些網(wǎng)站,用JS、CSS、html代碼把網(wǎng)站修飾的非常漂亮,但是發(fā)布的文章卻不收錄,這讓我開始覺得代碼與原創(chuàng)度有直接關(guān)系。
我忘