颶風算法2.0——嚴厲打擊惡劣采集行為
百度搜索于2017年7月4日發(fā)布颶風算法,嚴厲打擊惡劣采集問題,并在2018年9月13日公布颶風算法升級為2.0版本。
颶風算法2.0主要打擊以下四類惡劣采集行為:
1.存在大量從其他站點或公眾號等內(nèi)容生產(chǎn)方采集、搬運而來的內(nèi)容,信息未經(jīng)整合,排版混亂,文章可讀性差,有明顯采集痕跡,對用戶無任何增益價值。
問題示例1:文章有明顯采集痕跡
2.存在多段文章拼接的內(nèi)容,文章邏輯性差,無法滿足用戶需求,閱讀體驗差。
問題示例2:文章內(nèi)容拼接
3.站點內(nèi)存在大量采集內(nèi)容,網(wǎng)站自身的內(nèi)容生產(chǎn)力極差。
4.站點內(nèi)存在大量與本站主題無關(guān)的采集內(nèi)容,領(lǐng)域?qū)W⒍炔?,惡意獲取流量。例如:科技網(wǎng)站采集大量娛樂八卦、社會新聞等情況。
問題示例3:學習類站點發(fā)布美食類內(nèi)容
1.2 細雨算法——針對B2B領(lǐng)域的受益行為
2018年6月,百度搜索發(fā)布細雨算法,針對B2B行業(yè)的網(wǎng)站受益問題進行規(guī)范和引導。
細雨算法主要針對以下問題:
1.頁面標題作弊及誤導,主要有下面四類:
(1)非公司官網(wǎng),title中包含“官網(wǎng)”等字樣,誤導搜索用戶認為是官網(wǎng)
問題示例4:
(2)頁面title中堆砌相近關(guān)鍵詞;
問題示例5:
(3)頁面title中穿插火星文字或者特殊符號,影響正常閱讀;
問題示例6:
(4) 頁面title中穿插受益方式。
問題示例7:
2.頁面正文內(nèi)容中存在受益信息,主要包括以下三類問題:
(1)正文內(nèi)容不完整,頻繁穿插變形的受益方式。
具體是指:正文內(nèi)容為無價值內(nèi)容的拼接或者正文內(nèi)容不完整,同時采用“英文字母”、“漢字諧音”、“特殊符合”、“全角符合”等方式代替聯(lián)系方式,穿插在正文內(nèi)容中。
舉例:5992八⑧⑧⑧
舉例:13800138000
問題示例8:
(2)文章的配圖圖片中存在受益聯(lián)系方式。
具體是指:圖片中聯(lián)系方式水印面積較大,嚴重損害瀏覽體驗。
問題示例9:
(3)正文中商品或者服務(wù)信息內(nèi)容為亂采集、拼接而成、排版混亂、用戶從頁面中無法獲得商品或者服務(wù)信息。
問題示例10:
1.3 藍天算法——嚴厲打擊售賣軟文、目錄行為
2016年11月,百度搜索推出藍天算法,持續(xù)打擊新聞類站點售賣軟文、目錄的行為,還用戶一片搜索藍天。被“藍天算法”所覆蓋的站點將會被降低其在百度搜索系統(tǒng)中的評價。
問題示例11:
關(guān)于藍天算法的更多信息請參考:
2016.11.21 百度推出藍天算法,嚴厲打擊新聞類站點售賣目錄
1.4 極光算法——倡導重視落地頁時間規(guī)范
2018年5月底,百度搜索上線極光算法,旨在倡導資源方重視網(wǎng)站落地頁時間規(guī)范。落地頁時間因子是百度搜索判斷網(wǎng)站收錄、展示、排序結(jié)果的重要參考依據(jù)。
為了讓用戶獲得更滿意的搜索瀏覽體驗,百度給予符合落地頁時間因子要求且時效性較高的網(wǎng)頁更多的收錄、展現(xiàn)機會,同時減少不符合規(guī)定的網(wǎng)站的展現(xiàn)機會。
百度搜索落地頁時間因子規(guī)范
一、前言
落地頁時間因子是百度搜索判斷網(wǎng)站收錄、展示、排序結(jié)果的重要參考依據(jù),百度搜索綜合用戶對落地頁中關(guān)于時間因子的實際感受,發(fā)現(xiàn)目前PC端及移動端大量網(wǎng)站落地頁存在頁面時間標注不清、頁面無時間等對用戶瀏覽體驗不友好行為。為了讓搜索用戶獲得更滿意的搜索瀏覽體驗,我們將給予符合落地頁時間因子要求、且時效性較高的網(wǎng)頁更多的收錄和展現(xiàn)機會,同時對不符合的網(wǎng)站減少展現(xiàn)機會。
為了讓百度搜索的重要合作伙伴——優(yōu)質(zhì)站點免遭損失,百度搜索推出《百度搜索落地頁時間因子規(guī)范》,開放對落地頁時間因子的提取規(guī)范,滿足搜索用戶的瀏覽體驗,同時避免站長造成損失,實現(xiàn)共贏。
二、時間因子提交格式:PC和移動端頁面僅支持JSON-LD格式提交時間因子。
*可復(fù)制效果如下:
"pubDate": "2017-06-15T08:00:01",
"upDate": "2017-06-16T01:02:03",
"lrDate": "2017-06-17T09:10:11",
四、頁面提交時間因子規(guī)范:
根據(jù)不同的頁面類型,用戶需要參考的時間不同。以下根據(jù)不同的頁面類型,建議優(yōu)先提交不同的時間。
1、首頁
包含主要網(wǎng)站首頁(如新浪首頁、網(wǎng)易首頁)、分頻道首頁(如新浪體育頻道)等。該類頁面的特征是,具有多種內(nèi)容,多種鏈接,內(nèi)容更新較快,提供最新更新時間即可。
首頁類型 | 頁面樣式舉例 | 建議時間 |
網(wǎng)站首頁 | 新浪首頁、網(wǎng)易首頁、企業(yè)官網(wǎng) | 提供該列表所有內(nèi)容中的最新更新時間(update) |
分頻道首頁 | 新浪體育、網(wǎng)易科技、新浪NBA |
2、列表頁
該類頁面與首頁類似,也是具有多種內(nèi)容,多個鏈接,頁面整體更新較快,需要提供最新更新時間。專題頁是一種特殊的列表頁,一般是對同一事件的優(yōu)質(zhì)內(nèi)容聚合頁面,除更新時間外,專題頁的發(fā)布時間也很重要。
列表頁類型 | 頁面樣式舉例 | 建議時間 |
小說/視頻 封面頁 | 斗破蒼穹、急診科醫(yī)生 | 提供該列表所有內(nèi)容中的最新更新時間(update); 如果有發(fā)布時間,建議補充專題頁發(fā)布時間(pubdate); *更新時間(update)為必填時間 |
搜索/篩選結(jié)果頁 | 58狗糧篩選、京東s8篩選 | |
貼吧/blog/直播等個人首頁 | 直播個人首頁、吧首頁 | |
專題頁 | 十九大專題 |
3、詳情頁
該類頁面主要是內(nèi)容型頁面,包括文章詳情頁、視頻播放頁、小說章節(jié)內(nèi)容詳情頁等,這類頁面在發(fā)布后,大部分更新較少,用戶主要關(guān)注發(fā)布時間。
問答、論壇等具有交互的詳情頁比較特殊,需要提供更多的內(nèi)容,詳見下表。
詳情面類型 | 頁面樣式舉例 | 建議時間 |
文章詳情頁 | 新聞文章、菜譜介紹 | 優(yōu)先提供內(nèi)容的發(fā)布時間(pubdate) 如果內(nèi)容有更新,需補充內(nèi)容更新時間(update) *發(fā)布時間(pubdate)為必填時間;時間精確到分鐘級 |
視頻播放頁 | 急診科醫(yī)生 | |
商品/產(chǎn)品/黃頁/供求頁 | 商品、供求頁 | |
公司介紹頁 | 公司介紹頁面、公司信息 | |
問答詳情頁面 | 有問有答的詳情頁,如:百度知道、知乎問答 | 提供問題發(fā)布時間(pubdate) 第一個用戶可看到的回答時間(update) 最新回答時間(lrDate) *三個時間都為必填時間 |
論壇詳情頁面 | 論壇帖子頁,如,貼吧、天涯等 | 提供帖子發(fā)布時間(pubdate) 第一個用戶可看到的回帖時間(update) 最新回帖時間(lrDate) *三個時間都為必填時間 |






