[培訓seo]百度蜘蛛爬行不存在的路徑!

1、百度是否能抓取CSS樣式表并識別分析?

百度是能夠抓取并分析CSS的。

2、百度5.20大更新,你有什么看法?

簡而言之:我們的系統在更新數據的過程中出了點狀況,問題被及時發現后,已經于5月20日中午修復,目前還有部分內容由于緩存等原因正在更新中,很快就會恢復正常。今后我們會加強相應的保障機制,避免再次出現同類問題。同時也很抱歉讓大家造成一些誤解。

3、百度蜘蛛爬行不存在的路徑?

Baiduspider只抓取能從互聯網上找到的url,如果Baiduspider大量抓取你網站上不存在的url,可能有兩個原因:1)你 網站內有部分網頁指向其他網頁的url格式不正確。2)互聯網上有其他網站指向了你網站內不存在的網頁。另外,Baiduspider抓取到不存在的網 頁,服務器應該返回404錯誤。

4、我在robots.txt中設置了禁止百度收錄我網站的內容,為何還出現在百度搜索結果中?

如果其他網站鏈接了您robots.txt文件中設置的禁止收錄的網頁,那么這些網頁仍然可能會出現在百度的搜索結果中,但您的網頁上的內容不會被抓取、建入索引和顯示,百度搜索結果中展示的僅是其他網站對您相關網頁的描述。

5、新域名在百度下的權重比舊域名高的情況下,將舊域名301重定向到了新域名會有什么影響?或者說百度下的301是將權重替換還是疊加的呢?

將舊域名301重定向到新域名,舊域名的權值會疊加到新域名上。

6、網站的gzip壓縮對網站的收錄和權重有沒有影響?

gzip對收錄和權重沒有影響。對搜索引擎唯一的影響,是抓取速度會快一些。

7、域名A曾經301至域名B ,如果現在又將域名B301回A是否還能保持原來權重?

會,但會有一段時間的考查和權值轉移期。

8、百度的真正外鏈是什么命令,是否無法查詢?

百度目前沒有查詢外鏈的查詢命令,但我們已經計劃在站長平臺中支持外鏈查詢。

9、標題長短對于網站權重的影響有多大?

正如同一個頁面上的導出鏈接越多,每個鏈接獲得的權重越小一樣,title上的關鍵詞越多,單個關鍵詞獲得的權重也會越低。這是很直觀的邏輯。 但是,如果為追求某個關鍵詞的權重,極力壓縮標題長度,那么真正合乎該頁面的搜索需求,又很難被命中。所以,一般性的建議就是,實事求是的將頁面主旨反映 在標題中即可。如果要做長青樹,不要在乎一時一刻的seo效果(那個很累、很煩),把網站的忠實用戶人氣做起來就成了。

10、修改頁面標題(如增加前綴或后綴)是否會影響網站排名?

title是極重要的內容,大幅修改,只會帶來大幅波動,所以請慎重對待網頁標題。

11、修改首頁的description標簽,會不會受到懲罰?

這個肯定是多慮了,我們鼓勵大家通過description來撰寫網站的簡介,只是過于頻繁的修改,可能不會及時反饋在摘要中。

12、更換服務器是否對排名有影響?

原則上是不會的。除非新換的服務器太糟糕,三天兩頭訪問失敗,或者服務器從國內換到國外,這就很可能被和諧。

13、百度對重復內容是如何處理的?

搜索引擎的排序出發點,是用戶的搜索體驗。雖說,很多時候尊重原創和用戶體驗是一致的,但是,畢竟也有一些案例,轉載的體驗會比原創更好,這時原創的排序未必會高于轉載者,但是,原創的應該以另外一種方式被肯定,而不是簡單的被聚合掉。

14、我買了一個老域名,重新建站,權重會繼承嗎?

正常的域名轉手,域名會被當做一個全新的域名看待,前帳一筆勾銷。

15、百度對如何看待nofollow?

如果您不想搜索引擎追蹤此網頁上的鏈接,且不傳遞鏈接的權重,請將此元標記放入網頁的 HEAD 部分:meta name=”robots” content=”nofollow”;如果您不想百度追蹤某一條特定鏈接,百度還支持更精確的控制,請將此標記直接寫在某條鏈接上: a href=”signin.php” rel=”nofollow”>登錄/a

16、修改robots之后多久生效?

不同的站點略有不同,但通常會在幾天內生效。根據筆者的經驗,只要保持外鏈的增長和原創內容的更新,大概是4天對于老站,而新站大概一個星期左右。

17、一個頁面有多個重復的鏈接,并且鏈接文字相同,搜索引擎在傳遞權重時,只傳遞一次權重,還是每個鏈接都要傳遞權重?另外,這幾個重復的鏈接獲得的權重一樣么?

重復的鏈接不會增加鏈接權重

18、百度是否能識別和處理純文本形式的鏈接(非標簽)?

可以,搜索引擎的spider需要及時發現和抓取互聯網上的鏈接,至于鏈接是什么形式,并不重要,也許有一天,我們還可以識別圖片里、語音里、視頻里或是其它形式的鏈接。

19、option標簽里面的鏈接可以被蜘蛛抓到么?

可以提取,效果等同于A標簽。

20、標題過長是否會對百度搜索不利?

這個自然是沒有限制的。很多人喜歡往標題里塞很多關鍵詞,以為那樣就全面開花,但很可能適得其反,這個原理跟在一個頁面上有多個超鏈接一樣。分一杯羹的人越多,每個人所得的羹越少。

21、百度什么時候更新?

沒有“更新前”和“更新后”,百度無時無刻不在更新。

22、假如競爭對手惡意群發我網站鏈接到非法站點,對我網站有影響嗎?

我們有很完善的識別算法,這些行為并不會導致你的網站受到影響。

23、很多人說.info和.hk等域名被降權了,是不是真的?

使用何種后綴的域名,對搜索引擎沒有直接的影響。但.com、.cn、.net等常見的域名后綴更容易記憶,增加用戶的判斷成本。

24、百度建議URL靜態化嗎?還是像Google一樣,不建議URL靜態化?對偽靜態怎樣看待?和真的靜態文件一樣嗎?

對URL的動靜態,沒有歧視政策。

之所以以前有過提倡靜態的說法,是因為很多動態URL,帶了很多參數,而實質上內容是一樣的。這個給spider以及站長都帶來不必要的麻煩。 我們在這上邊花了不少精力。所以,總的原則就是,URL的動靜態無所謂,只是盡可能的避免重復即可。但是動態url也不要動態得太變態,搞幾十個參數,那 會嚇著蜘蛛。醞釀中的sem指南,會有對url優化方面的詳細說明。

25、搜索結果中顯示標題與實際標題不一致?

原因比較復雜,需要針對性分析。主要原因可能是tag title提取失敗,系統只好從其他地方取了一些文本作為標題。這種提取失敗的原因,有網頁設計層面的(比如全是flash或者ajax),也有 robots封禁層面的(某些重要網頁雖然不抓取,但會保留url本身)。還有一些系統異常也會造成類似的現象。如果不符合一般性的預期,這類問題都可以 直接提交至webmaster#baidu.com。會有工程師跟進的。

26、在百度快照里頁面沒有顯現完整,首頁底部(友情鏈接及版權信息那塊)代碼和頁面都沒在快照中出現,那么友情鏈接對其他網站還有用嗎?

這種情況不會影響友情鏈接。另外,我們建議盡量將頁面大小控制在合適范圍內。

27、以前百度顯示網頁體積的時候最大是125K,超過這個范圍快照顯示就不正常,是不是意味著網頁體積大于125K就對搜索引擎的抓取或收錄有影響了?

頁面大小和搜索引擎的抓取之間沒有直接關系。但我們建議網頁(包括代碼在內)不要過大,過大的網頁會有抓取截斷;而內容部分,也不要過大,過大會被索引截斷。當然,抓取截斷的上限,會遠大于索引截斷的上限。

28、Google傾向于說每個網頁的導出鏈接不要超過100為宜,百度有沒有什么建議?

這個暫時沒什么建議。一般情況下,鏈接數量,會影響到這些鏈接從該頁面上所獲得的權重;少就多分一些,多就少分一些。

29、js代碼彈窗是否會影響自然排名?

任何對用戶體驗有增益或者減益的做法,其實會影響到用戶的”投票”行為。而這些投票行為,又會影響搜索引擎對這個網站的評價算法。所以,彈不彈窗并不重要呀,關鍵是這種彈窗會對用戶造成什么樣的影響。

30、百度針對連接上存在不存在有效期的問題,意思上是說,一個鏈接的權重會不會過一段時間后就會沒有了,或者逐漸降低?

如果各位站長要揣摩百度的策略細節,我覺得不如站在用戶的角度,用一種合乎常理的邏輯去做推斷。比方鏈接時效性問題,實際是有利有弊。利在于, 過去的投票,只反映被投票者在過去的價值,不見得能反映現時情況;弊在于,正常投票不大會重復投,過去投過了,現在就可能不投了,但不代表現在對被投票者 的不認可。那么究竟應該怎么做呢?呵呵。我也不清楚。

31、原創內容不能被識別怎么辦?

這個,只能說百度的策略還不是很完善,我們也一直在改進。另外,從用戶體驗角度,有些轉載未必比原創差。比方一篇科技原創博文,被知名門戶網站 的科技頻道轉載。如果這種轉載保留原創者姓名和出處鏈接,實際上對原創者是有利的,因為起到了更好的傳播效果。只是國內的轉載,很多是掐頭去尾,使原創者 比較受傷。

32、百度是否跟蹤JavaScript鏈接?

javascript的解析,是很多搜索引擎正在做的事情;同理,對flash的解析。畢竟有那么多應用javascript或者flash的 網站,其實并沒有意識到,他們的做法給搜索引擎的收錄和索引帶來的麻煩。所以,如果期望不被搜索引擎收錄的話,最直接的手段,還是寫robots文件。

33、鏈接點擊率是否計入排名算法,百度是否有會估算某網頁的某個反向鏈接被點擊次數(例如:從工具條、流量統計等工具得到的部分數據)?比如是否把鏈接的點擊率計入算法之中?是否會利用這點來判斷哪些是隱藏鏈接?或者判斷外鏈的相關性等因素。

我只能說,一切有利于排序改進的因素,都有可能被搜索引擎嘗試應用。

34、為什么蜘蛛每天爬n次,而收錄網頁只有一兩篇?



上一篇:

下一篇:

相關文章

五月丁香网