結(jié)合設(shè)計(jì)經(jīng)驗(yàn)與營(yíng)銷實(shí)踐,提供有價(jià)值的互聯(lián)網(wǎng)資訊
發(fā)布日期:2016-05-19瀏覽次數(shù):1480 來(lái)源:福州網(wǎng)站建設(shè)
站長(zhǎng)之家(Chinaz.com)注:網(wǎng)站鏈接分析,源于對(duì)Web結(jié)構(gòu)中超鏈接的多維分析,是網(wǎng)站優(yōu)化運(yùn)營(yíng)中不可缺少問(wèn)題診斷方法。百度站長(zhǎng)平臺(tái)也推出其官方的鏈接分析工具。那么,我們?cè)撊绾卫煤冒俣日鹃L(zhǎng)工具的鏈接分析功能,來(lái)定位網(wǎng)站可能存在的SEO問(wèn)題呢?
以下為來(lái)自百度站長(zhǎng)社區(qū)斑竹響1亮2的3名4字的分享:
有一次在社區(qū)里面看到有站長(zhǎng)朋友提問(wèn),說(shuō)百度站長(zhǎng)工具的鏈接分析里,怎么出現(xiàn)了錨文本是@NULL@的數(shù)據(jù),感到非常不明覺(jué)厲。
然后我就試著聯(lián)系了一些平時(shí)經(jīng)常打交道的站長(zhǎng)朋友,問(wèn)了下他們是否關(guān)注過(guò)百度站長(zhǎng)工具中的鏈接分析,是否定期進(jìn)行過(guò)統(tǒng)一分析,當(dāng)出現(xiàn)大量死鏈數(shù)據(jù)時(shí),是否對(duì)問(wèn)題進(jìn)行了定位……結(jié)果發(fā)現(xiàn)有很多站長(zhǎng)朋友,在平時(shí)很少進(jìn)行這樣的分析工作,所以當(dāng)出現(xiàn)問(wèn)題的時(shí)候,就感到不明覺(jué)厲,不由得大罵度娘坑爹。
實(shí)際上,度娘到底坑不坑爹我是不知道啦,不過(guò)我想說(shuō)度娘只是把問(wèn)題反映出來(lái),更多地還需要我們自己去定位問(wèn)題并進(jìn)行處理,才能確保網(wǎng)站不會(huì)因?yàn)樵搯?wèn)題而受到較大程度的影響。
于是,我就有了制作本期專題的打算。
本文首發(fā)于站長(zhǎng)學(xué)院:http://zhanzhang.baidu.com/college/articleinfo?id=838
1、本文的主要內(nèi)容有哪些呢?
(1)查找是否有黑鏈出現(xiàn)——從日志分析,百度蜘蛛抓取了網(wǎng)站的哪些預(yù)期外的頁(yè)面,是否存在黑鏈。(這個(gè)可能要先賣個(gè)關(guān)子,因?yàn)檫@又是個(gè)大工程啦,本期專題會(huì)提到一些)
(2)百度站長(zhǎng)工具外鏈分析——查看是否有垃圾外鏈、黑鏈等,以及鏈向的站內(nèi)什么地方,如何處理。(本期里面也有所涉及)
(3)百度站長(zhǎng)工具鏈接分析——三大死鏈(內(nèi)鏈死鏈、鏈出死鏈、鏈入死鏈),批量下載數(shù)據(jù),合并數(shù)據(jù),excel操作,按邏輯分類,定位問(wèn)題,處理問(wèn)題。(定位和處理,材料不夠,因?yàn)楹枚嘁呀?jīng)處理過(guò)了,沒(méi)有材料了= =|||||)
(4)從分析這些數(shù)據(jù),得到的與SEO效果相關(guān)的其他信息(垃圾搜索引擎、垃圾外鏈帶來(lái)的無(wú)用抓取,浪費(fèi)資源配額,如何拒絕。)
(5)如何自動(dòng)化地使用shell腳本,定位到被百度蜘蛛抓取到的死鏈,并進(jìn)行復(fù)查,然后將確定為死鏈的URL進(jìn)行自動(dòng)化提交。(本期專題內(nèi)容太多,留作下期專題用)
(6)分析工具介紹(firefox設(shè)置,插件,excel,windows命令提示符批處理)
2、本文中主要使用到的工具
(只是結(jié)合例子中,如果有其他相似功能的工具,請(qǐng)結(jié)合自身習(xí)慣使用即可)
【瀏覽器】火狐(Firefox)瀏覽器,版本無(wú)所謂
【插件】:Launch Clipboard
功能:一鍵打開剪切板中存在的URL。(注意URL中只能有英文數(shù)字標(biāo)點(diǎn),如果有中文可能無(wú)法被識(shí)別)。快捷鍵:alt + shift +K(先復(fù)制好單個(gè)或者多個(gè)URL)
設(shè)置:打開選項(xiàng)設(shè)置,選擇好下載文件自動(dòng)保存的位置(我這里選擇了桌面,你也可以單獨(dú)創(chuàng)建一個(gè)文件夾,好對(duì)批量下載的文件進(jìn)行歸類)
【表格處理】:Microsoft Office 2013 Excel
【文本處理】:Notepad++
【批量處理】:Windows自帶命令提示符
一、我們可以先看一下外鏈分析。
分析外鏈數(shù)據(jù)的主要目的是,找出垃圾外鏈,主動(dòng)去封堵垃圾外鏈可能對(duì)網(wǎng)站造成的惡劣影響。最終目標(biāo):
1、找到垃圾外鏈的域名,進(jìn)行防盜鏈處理(針對(duì)來(lái)源為垃圾域名的,直接返回404狀態(tài)碼);
2、處理站內(nèi)可能存在問(wèn)題的頁(yè)面。
這里,我會(huì)重點(diǎn)講解第一點(diǎn);第二點(diǎn)比較簡(jiǎn)單,我會(huì)講解得比較粗略。
1、定位出垃圾域名。
圖注:可以看到這是一個(gè)明顯不正常的趨勢(shì)圖
我們可以下載外鏈數(shù)據(jù),來(lái)進(jìn)行初步分析。
圖注:下載得到的表格文件(csv逗號(hào)分隔符)
但是這樣一份原始數(shù)據(jù),是很難進(jìn)行分析的。因此我們需要按照一定邏輯對(duì)其進(jìn)行分析——就是按照【被鏈接的網(wǎng)頁(yè)url】進(jìn)行分類。
首先,我們可以快速瀏覽一下,進(jìn)行直觀判斷,這些頁(yè)面大部分是什么頁(yè)面呢?
針對(duì)我們網(wǎng)站的情況來(lái)說(shuō),外鏈數(shù)據(jù)分為兩類,正常外鏈與垃圾外鏈。
而垃圾外鏈又分為兩種:站內(nèi)搜索結(jié)果頁(yè)面(垃圾搜索詞)以及被黑客入侵植入的黑鏈(已經(jīng)處理為死鏈)。
我們進(jìn)行數(shù)據(jù)處理的目的有兩個(gè):識(shí)別出哪些是正常外鏈,哪些是垃圾外鏈,并根據(jù)垃圾外鏈的相關(guān)數(shù)據(jù),進(jìn)行一些處理,保護(hù)好網(wǎng)站;并且需要使被垃圾鏈接指向的頁(yè)面,不被搜索引擎抓取(浪費(fèi)抓取資源配額)以及被收錄/索引(保證網(wǎng)站詞庫(kù)不受污染,不為網(wǎng)站帶來(lái)形象與關(guān)鍵詞方面的負(fù)面影響)。
第一步,篩選出網(wǎng)站的搜索結(jié)果頁(yè)面
圖注:篩選數(shù)據(jù)、復(fù)制到新的sheet中,刪除原始sheet中的篩選數(shù)據(jù),來(lái)分類數(shù)據(jù)
還有幾類搜索鏈接格式,都以相同方式進(jìn)行處理。
然后把原始sheet中剩下的數(shù)據(jù)進(jìn)行去重(空白行),得到剩余的鏈接信息。
圖注:對(duì)剩余數(shù)據(jù)進(jìn)行簡(jiǎn)單的去重處理。
然后,我們需要對(duì)黑鏈進(jìn)行篩選。黑鏈的數(shù)據(jù),一般需要先從網(wǎng)站日志中分析得到(這樣是最全面的,為了保證效率,會(huì)需要使用到shell腳本來(lái)自動(dòng)運(yùn)行,但是涉及篇幅過(guò)多,我將在以后的專題中進(jìn)行講解)。
當(dāng)然也可以對(duì)表格中【被鏈接的網(wǎng)頁(yè)url】這一列按照順序排序后,挨著分析得到(自己去打開,同時(shí)黑客會(huì)使用一些特殊手段,妨礙我們?nèi)プR(shí)別真正的會(huì)被搜索引擎識(shí)別到的垃圾內(nèi)容,最常見的情況就是,使用js跳轉(zhuǎn)。這樣我們通過(guò)瀏覽器訪問(wèn)時(shí),會(huì)看到完全不一樣的內(nèi)容,而搜索引擎抓取時(shí),則下載到了垃圾內(nèi)容。)
這時(shí),我們需要使用一款firefox插件【No Script】,旨在屏蔽網(wǎng)站上的js,看到與搜索引擎類似的內(nèi)容。
圖注:屏蔽瀏覽器中java script的插件
另外還有一種不是很靠譜的甄選方法,在搜索引擎里面去搜:【site:域名 博彩】之類的關(guān)鍵詞,把不符合網(wǎng)站預(yù)期的關(guān)鍵詞拿去搜,就可以得到很多鏈接了。(這里需要使用一些方法,把鏈接全都批量導(dǎo)出,在今后的專題中,我會(huì)繼續(xù)講解的)
注:相關(guān)網(wǎng)站建設(shè)技巧閱讀請(qǐng)移步到建站教程頻道。
以上是由福州網(wǎng)站建設(shè)的小編為你分享了"巧用百度站長(zhǎng)平臺(tái)查看SEO外鏈問(wèn)題"文章,如果你在這方面有什么問(wèn)題,隨時(shí)聯(lián)系我們