【站長雜談】采集站SEO怎么優化

114大赢家足球比分 www.888707.live 時間:2018-10-31 09:56   編輯:海瑤seo培訓

站長雜談
【站長雜談】采集站SEO怎么優化

原創好還是采集好?

當然是原創好,因為百度是這么說的,誰叫人家是裁判。

為什么我原創了很多文章,還是不收錄?收錄了沒排名?

一個搜索引擎,它的核心價值是要為用戶提供他/她最需要的結果。搜索引擎是有統計網民需求的,對于網民需求量小或者幾乎沒有需求的內容,即使你是原創也可能被搜索引擎忽略,因為它不想浪費資源在無意義的內容上。

對網民需求量大的內容,收錄應該會比較多、比較快,但是,正因為收錄多,即使你是原創,也可能很難擠進排名。

搜索引擎統計網民需求以什么來標識?

關鍵詞。每一個人搜索一個關鍵詞時,就表明他/她對這個詞相關的內容有需求。而且,使用搜索引擎的人,通常是有問答需求、檢索查詢需求。當然搜索引擎內部肯定有非常龐大的分析系統,對這些需求進行精確的定位,詳見百度指數。比如搜索的關鍵詞是“手機”,很有可能是想要買手機或者查某款的價格,也可能只是想要下載漂亮的壁紙。但是,如果是想要壁紙,就會有更精確的關鍵詞“手機壁紙”,以下拉框或者相關搜索的形式呈現出來。

既然原創好,為什么要采集?

1. 雖然原創好,但只要方法適當,采集的效果并不會比原創差多少,甚至比沒掌握到方法的那些原創好很多。

2. 精力有限,原創很難保證長期大量更新,如果請個編輯,投入產出比可能是負數。

市面上采集器那么多,應該用哪個好?

每個采集器都有它的獨特之處,所謂存在即合理。請根據自己的需求來選擇即可。我的采集器是自己開發的,開發的過程中考慮了以下幾方面,使用其他采集器的也可作參考:

1. 直接提供已分類的海量關鍵詞,這些關鍵詞都是百度已經統計的有網民需求的詞(有百度指數),或者是這些詞的長尾詞,來自百度下拉框或相關搜索。

2. 直接按關鍵詞采集,智能分析網頁正文進行抓取,不需要自己寫采集規則。

3. 抓取到的正文經過規范的標簽清理,段落全部以

標簽呈現,亂碼一律去除。

4. 根據采集到的內容自動配圖,圖片一定是與該內容相關度非常高的。以這種方式代替偽原創,既不影響可讀性,又使文章圖文并茂,做到比原創所提供的信息更豐富。

5. 正文內容中的關鍵詞自動加粗,也可自定義要插入的關鍵詞。但沒有做句子重排、段落重排等影響可讀性的所謂“偽原創”功能。

6. 可直接使用關鍵詞和其相關詞組合作為標題,也可抓取目標網頁標題。

7. 可進行微信文章采集。

8. 不用觸發或者掛機。

9. 集成百度站長平臺主動推送,加快收錄。

不同的網站程序,比如織夢、WordPress、dz、zblog、帝國cms或者其他,對SEO有什么影響?

理論上沒有影響。因為搜索引擎并不知道你是什么程序,或者它可以通過一些規則識別出來,也不可能因為程序本身的不同而影響它的判斷。

那什么會影響SEO呢?答案是模板。因為基本上這些程序都有模板機制,同樣程序可以輸出不同的頁面,不同的程序也可以輸出同樣的頁面,這就是模板。模板確定之后,你的每一個頁面就按照這個框架來輸出,也就是整個html結構已經確定。而這些html,正是搜索引擎要重點關注的,它得從這些html中得到它想要的信息。因此,一套好的模板非常重要。

站長雜談

模板設計應該注意哪些細節?

1. 權重結構順序。整個頁面的html中(注意是html,而不是顯示出來的版面),越靠前的位置,權重越高。由此引申出來,“title”、keyword、description三個標簽,因為最靠前,權重最高。其次通常是導航,也是基本上是最靠上的,權重也非常高。再次就是文章標題和正文。這是根據html的前后來排序的。

2. 因為搜索引擎首先要遵循W3C標準,所以,W3C定義的一些本來就是用來表示重要信息的標簽,權重自然就高,比如,特別是h1,用來表示當前頁面最重要的信息,一般每個頁面只能有一個,其權重估計與title相當,也通常是用來放當前頁面的標題,當然也有為了提高首頁權重,用h1來放置logo或首頁鏈接,都是可以的。另外還有em、strong這樣的標簽,用來表示強調,一般認為strong權重高于標簽,同樣也是加粗作用,但我們認為從SEO的角度看是沒有權重加強的。

3. css或者js代碼對搜索引擎來說通常是無意義的,盡量使用單獨的文件來存放,或者在允許的情況下放到html尾部去

網站結構規劃應該注意哪些問題?

1. URL設計。URL也是可以包含關鍵詞的,比如你的網站是關于電腦的,你的URL中可以包含“PC”,因為它在搜索引擎眼里通常是“電腦”的同義詞。URL不要太長,層次盡量不要超過4層,這個就點到為止。

2. 欄目設計。欄目通常是與導航相關聯的,設計時應該考慮網站整體的主題,用戶可能會對哪些內容感興趣,欄目名稱最好是網站的幾個主關鍵詞,這樣也方便利用導航的權重。

3. 關鍵詞布局。理論上每一個內容頁都應該有它的核心關鍵詞,同一個欄目下的文章,盡可能圍繞欄目關鍵詞展開。一個簡單粗暴的辦法就是直接用欄目關鍵詞的長尾詞。

動態、偽靜態、靜態,這三者哪個好?

這個不能一概而論,推薦使用偽靜態或靜態。這三者的區別,是是否生成靜態文件,以及URL格式是否動態。生成靜態文件,本質上是為了加快訪問速度,減少數據庫查詢,但會不斷增加占用空間;偽靜態只是通過URL重寫修改URL,實際上還是每次都要經過程序運算、查詢數據庫再輸出頁面,對加快訪問速度完全無效。動態與偽靜態的差異只在于URL,帶問號加參數。

所以關注兩個點就好:網站打開速度是否夠快?你是否需要節約服務器空間?

不同的網站程序,數據庫操作的效率可能不同。一般來講,內容頁數量在1萬以內的,頁面打開速度都是比較快的,數據量更大一些,達到5萬、十萬甚至更多,通常就要考慮靜態化了。

有哪些途徑改善訪問速度?

1. 上面已經說到的靜態化。

2. 通常很多網站模板中都有隨機調用文章或者類似的版塊,事實上對數據庫來說,隨機是一項比較重的負擔,在模板中應該盡量減少隨機文章的調用。如果不可避免,可以考慮從數據庫上優化,對有索引的字段排序通常比沒有索引要快很多。

3. 將圖片、js、css等不經常修改的文件,放到專用的靜態服務器上,多個js、或者多個css能合并的盡量合并到一個文件,減少http連接次數。

4. 使用各類云加速產品。對普通網站來說,免費的百度云加速或者360的云加速都還可以。

文章比較多,網站已經開啟靜態,但是每次全站更新都要花很長時間怎么辦?

我的做法是使用緩存機制,這里只提供一個思路,可能需要自己二次開發。

網站設定為偽靜態,每一個請求到達時,程序檢查是否存在對應的緩存html文件,如果該文件的生成時間是多少小時或幾天以前,我們判定它需要更新,這時候執行正常流程,程序查詢數據庫,生成html后,寫入到緩存文件,再輸出到客戶端。

當下一次訪問到達時,比如1分鐘以后又來一個訪問相同頁面,再次檢查緩存文件時間。從時間上可以判斷文件非常新,完全不用更新,則直接讀取文件內容輸出到客戶端。這樣每個頁面都可以實現自動生成,也只有第一個訪客會感受到速度慢,后面的訪客訪問時都相當于是靜態訪問,速度是非??斕?。

站長雜談

如果是獨立服務器,還可以考慮自動檢測服務器負載,如果負載本來就高,那就算判斷出來需要更新,也暫時不更新,改為直接輸出。

圖片是引用遠程網址好還是放在自己服務器好?

這個也是各有優劣。引用遠程網址,可以節約自己的帶寬,但很可能會因為對方服務器緩慢、或刪除資源、或防盜鏈,圖片無法顯示。如果下載到自己服務器,當然一切都自己掌控,但是圖片會非常占用空間,總體上可能比生成靜態所占的空間更大,而且如果訪問量大,圖片是最吃帶寬的。

網站內鏈應該怎樣優化?

內鏈是百度官方推薦的優化手段之一,所以這是一定要做的。通常表現的形式是正文中出現某個關鍵詞,給這個關鍵詞加上一個鏈接,指向另一個正好是這個關鍵詞相關內容的頁面。因此就誕生了一些所謂的優化手法,強行在正文中插入一些關鍵詞和鏈接,以此進行類似互推的操作?;褂械奈頌岣呤滓橙ㄖ?,到處都放上網站名稱,并做上首頁鏈接,以為這樣可以提高目標頁面的權重。但是這些很可能都是適得其反,因為搜索引擎會統計每個鏈接的點擊率。如果放在醒目位置點擊卻很少的鏈接,有可能會判斷為作弊。所以,請只在正文中本來就有的關鍵詞上做內鏈,就可以了。

段落重排、句子重排、同義詞替換這些偽原創手法到底好不好?

不好。因為搜索引擎已經智能,已經不是簡單的數據庫檢索,它會自然語義分析(詳情請搜索“NLP”),凡是語義解析比較困難的句子或者段落,它是可以判斷為可讀性差的,所以我認為這些“偽原創”可能是自作聰明。

評論??榛舊廈揮腥擻?,該要還是不要?

要。評論??樽鍆誹凼鞘慮槭搶纜?,通常真正發言的訪客很少,垃圾評論一大堆,整天和營銷軟件斗智斗勇。這里提供一個我已經實現的方案,對收錄可能有一定幫助(沒有依據的,只是猜測):

保留評論框、但禁止評論。所有評論由自己的網站程序生成。前面提到搜索引擎會自然語義分析,其中有一項重要的能力,就是情感判斷。搜索引擎會計算每條評論的情感值,是positive(積極)還是negative(消極),具體傾向是10%還是90%。如果評論內容表達的是積極情感,則可以給你的正文加分,反之則減分。至于怎樣自動生成積極的評論,就八仙過海各顯神通吧。

這是在網絡社交發展起來后的必然趨勢,用這種方式來反映一個頁面的用戶體驗度。同理還有分享、點贊等,原理類似。

綠蘿卜算法之后,外鏈到底還有沒有用?

有用。參見搜索引擎三定律之相關性定律。既然是定律,就不會改變。誰的內容被引用得多,誰就是權威。在主動推送出現之前,外鏈應該算是蜘蛛認識一個頁面內容的第一渠道。

外鏈一定要錨文本或者裸鏈嗎?

不是。搜索引擎肩負重任,要努力發現真正有價值的東西,排除那些沒價值的東西。所以有可能你直接提交的鏈接沒收錄,在別人地方隨便發個純文本網址,被它發現了,還計算了加分。

除了錨文本和裸鏈,還可以用關鍵詞+網址的形式發純文本。這樣在網址前面的那個關鍵詞是會自動與該網址關聯的。

還有,有些鏈接雖然加了nofollow屬性,但是在百度計算外鏈的時候,還是會計算的。

收錄和索引到底什么關系?

收錄表示蜘蛛來抓取過、分析過。索引表示蜘蛛分析之后,認為內容有一定價值。只有進入索引的內容才有可能出現在搜索結果中,展現給用戶。也就是說只有索引的內容才有機會帶來流量。

二、老鐵SEO:做SEO優化重復的內容與采集站,真的會受到搜索引擎懲罰嗎?

重復的摘抄別人的內容都是114大赢家足球比分行業一直比較關注的大問題,那么重復的內容究竟會不會受到搜索引擎的懲罰呢?其實這些一直都是優化師們經常在一起討論的話題了,這一段百度對采集網站進行了大批量的K站。但是依舊有很多朋友的站點排名依舊很好,面對這么對的采集內容,搜索引擎又是如何進行區分的呢?

搜索引擎到底會不會懲罰采集的內容

首先需要說明的是內容重復與站點采集,因為這兩點是有一定區別的。就當前來講,搜索引擎對于重復內容到是沒有很明顯的打擊現象。那么你也可以這樣理解,搜索引擎一般對于重復的內容是不會進行懲罰的。

很多SEO界的專家在做網站分析的時候都會考慮站點的重復系數的問題,一般都會通過一些站長輔助工具來大概統計一下原文鏈接。

站長雜談

大家一致迷糊的就是文章別被人抄襲后竟然排名比自己的還要高,對此百度官方也曾視圖解決這等類似的問題。在當前的測試階段里,我們可以在最近剛剛推出的熊掌號里面看出一些新的希望。平臺升級后有權限的站長就可以在熊掌號的?;ど∠綠嶠輝茨諶?,其中一個亮點就是文章的發布時間幾乎可以精確到秒來計算。

擁有原創?;さ惱鏡?,提交鏈接一旦被審核通過。那么在移動端的手機搜索上就會立馬加注原創標簽,這樣一來你的原創文章自然就會比轉載的要好的多。

內容采集排名為什么還會那么好呢?

其實采集過來的文章是分為兩種類型的,一些大網站的轉發和整站采集,對于大網站的轉發在最近推出熊掌號后會得到很明顯的改善,為什么百度要給予這些轉發的站點這么好的排名呢?其實這是與站點的權威性和原創比例有一定的關系的,與此同時也是為了把優質的文章更好的展現在搜索引擎里面,這樣一來在傳播信息的角度也是可以理解的。通常大網站的轉發都會帶上原創文章的鏈接,以此給原創站點建立起有好的外鏈關系。

整站采集的話就是顧名思義的大批量的做內容采集,雖然說可以提高一定的信息量,前期收錄還可以。但是采集過來的內容是沒有排名的,這也是當前新聞外鏈還能活下來的主要原因。

颶風算法推出以后,態度已經很明確了是要嚴厲打擊站點采集,采集站點的做法在以后的SEO優化當中怕是真的走不通了。

內容重復的話會不會受到搜索引擎的懲罰呢?

其實對于這個問題百度的官方表述是相當模糊的,清風算法推出以后百度已經開始強調不可過多的優化網站標題,造成關鍵詞堆砌形成排名。其實從側面也就影射出了標題是不可以過多進行重復的。

以前也有很多專家表明使用近義詞或者是一些變相的關鍵詞來作為標題制作多個頁面,一次來遮蓋關鍵詞這種做法目前來講是不提倡去做的,如果是重點最好還是精簡到一篇文章上去會比較好些。因為百度會希望把向相近的問題進行融合。

網站優化是一種戰略布局的大學問,特別是你面對重復內容與站點采集的時候,經常是沒辦法一下子去判定的,因為很多站長都已經處于臨界點的狀態了!

三、熊掌號:SEO重復內容與采集站, 會被懲罰嗎, 答案在這里!

重復內容是SEO行業一直關注的問題,重復內容到底會不會被搜索引擎懲罰,這是一個被經常討論的話題,百度最近對內容采集站點進行大批量的降權,但仍有很朋友發現自己的文章被轉載,排名依然比自己的原創高,那么互聯網上這么多的重復內容,百度是如何對待的呢?  

1、百度到底是否會懲罰重復內容  

這里首先需要明確的是重復內容與采集站點,還是有一定區別的,目前來講,百度對于重復內容并沒有明顯的打擊跡象,也可以這么理解,百度對重復內容是不會懲罰的。  

雖然如此很多SEO專家,在做網站診斷的時候都會討論外部站點重復內容的數量問題,正常來講會通過站長工具來統計是否被附帶原文鏈接!  

這里大家一直糾結的問題:文章被轉發后,排名比自己的高,百度很明確一直在試圖解決這個問題,但仍在測試階段,這點我們可以在最近推出的熊掌號看出希望,有權限的站長,可以在熊掌號下的原創?;ぬ嶠輝茨諶?,其中很特別一點就是文章發布的時間需要精確到秒:  

站長雜談

這是一個很明確的信號,擁有原創?;さ惱鏡?,提交鏈接一旦審核通過,在移動端的搜索展現上就會加注原創標簽,排名自然就會比轉發文章高。  

2、采集內容排名為什么那么高  

這里面的采集內容,應該是一分為二的,主要有下面兩種情況:  

權威站點轉發  

整站采集  

權威站點轉發,在百度推出熊掌號后,會得到明顯的改善,那么百度為什么給予這部分站點的轉發內容很高的排名,這與站點權威度以及原創比例有一定關系,同時為了更好的把優質文章展現在搜索結果頁面,從信息傳播的角度也是可以理解的,并且權威站點的轉發,都會附帶版權鏈接,給新站也是建立友好的外部鏈接。  

整站采集就完全不同了,大批量的采集內容,雖然會保持網站有持續更新的頻率,同時也會發現收錄還不錯,但采集內容幾乎沒有排名,這也是目前新聞外鏈還能存活的一點點理由!  

在百度推出颶風算法后,很明確的態度就是嚴厲打擊惡劣采集站點,看來日后連收錄都會成為泡影。  

 

3、內部重復內容是否會被懲罰  

對于這個問題目前百度表達的相對模糊,在最近推出的清風算法中,百度強調不要過多的優化標題,以關鍵詞堆積等形式提高排名,言外之意,標題不要過于重復。  

早前也有部分SEO專家表明:  

利用近義詞或是變相的關鍵詞作為標題制造多個頁面,來覆蓋關鍵詞目前來講是不被提倡的,盡量精簡到一篇文章中,比如:  

大豆的功效與作用  

大豆的營養價值  

這兩個標題,在多個美食網站你會看到都會有獨立的頁面存在,但就其內容而言,答案幾乎很相近,百度會希望大家把這兩個問題融合在一起,比如:大豆的營養價值,它的功效與作用有哪些?  

總結:SEO是一種策略,特別是面對重復內容與采集內容的時候,有的時候很難判斷,很多站長走在臨界點,如果你有更多關于重復內容的問題,歡迎留言評論!。

以上就是小編為您帶來的“【站長雜談】采集站SEO怎么優化”全部內容,更多內容敬請關注海瑤SEO培訓!

    相關閱讀:

    陜西網站制作

       
云南網站制作

來源:114大赢家足球比分,歡迎分享,(微信/QQ:154899659)

分享至:
{ganrao} 网赚之家 龙王捕鱼破解版 国际象棋吃子规则 捕鱼达人3官方下载 北京赛车pk10注册 德甲积分榜 精准尾数中特 永利棋牌官网手机版 篮球赛事 一头中特免费公开资料 多人玩的棋牌? 兼职网赚论坛 北京麻将124怎么算钱 琼崖麻将系统让你输就输 930好彩十码三期必中特√ 盛世娱乐棋牌