天蠶在你身邊


不方便打電話(huà)?讓天蠶聯(lián)絡(luò )你

天蠶在你身邊
不方便打電話(huà)?讓天蠶聯(lián)絡(luò )你
什么是網(wǎng)頁(yè)噪音?
在我們?yōu)g覽網(wǎng)頁(yè),從中獲取所需信息的同時(shí),還會(huì )常??匆?jiàn)大量和我們所關(guān)心內容無(wú)關(guān)的“噪音”內容,如網(wǎng)頁(yè)的公共部分、廣告信息、版權信息等,有效的 去除和網(wǎng)頁(yè)主題內容無(wú)關(guān)的噪音內容,提取網(wǎng)頁(yè)的元數據信息,如關(guān)鍵詞、摘要、網(wǎng)頁(yè)內容類(lèi)別等,是Web信息處理的一項重要內容,同時(shí)也是我們做SEO優(yōu)化需要重點(diǎn)處理的部分。
網(wǎng)頁(yè)凈化明確搜索引擎重點(diǎn)分析的區域:在前面的文章當中我分別介紹了什么是網(wǎng)頁(yè)表示模型,網(wǎng)頁(yè)特征項的提取, 我們在進(jìn)行SEO優(yōu)化的時(shí)候,為了給搜索引擎搭建一個(gè)便于理解和分析的頁(yè)面我們需要根據關(guān)鍵詞的相關(guān)算法構建網(wǎng)頁(yè)表示模型,模型的目的是什么呢?一是幫助 搜索引擎更準確的理解我們的網(wǎng)頁(yè),二是能夠幫助它快速的提取出網(wǎng)頁(yè)特征項,三是盡可能的降低網(wǎng)頁(yè)的噪音。這里我給大家舉一個(gè)例子,讓大家再深入的理解一下 這個(gè)噪音問(wèn)題跟我們搜索優(yōu)化的關(guān)系,當我們建設好一個(gè)網(wǎng)站,通常情況下會(huì )有導航區域,也許左側還會(huì )有一些公共相關(guān)的區域。
我們每個(gè)頁(yè)面都是這樣的,大家思考一下,當搜索引擎來(lái)抓取和分析我們網(wǎng)站的時(shí)候,這樣的公共部分會(huì )不會(huì )再繼續分析了,會(huì )不會(huì )重點(diǎn)分析了,我可以明確 的告訴大家公共區域可能不分析也不會(huì )做重點(diǎn)分析了,這樣就相當于去除了噪音,而搜索引擎真正重點(diǎn)分析的區域就是那些你實(shí)實(shí)在在的內容了,如果我們把這個(gè)內 容理解成為一個(gè)變量,那么你的每一個(gè)頁(yè)面的“內容”這個(gè)變量就都要五花八門(mén),盡量不要和其它頁(yè)面有太多相似的部分,所以我們要注意頁(yè)面的比例問(wèn)題,如果你 的“公共變量”大于了“內容”變量,顯然這個(gè)頁(yè)面不太健康,搜索引擎會(huì )認為你的頁(yè)面相似度太高,不予重視,不重視就是不會(huì )有高權重,如果你的每個(gè)頁(yè)面都如此,那么你的整個(gè)網(wǎng)站權重大降,排名就不會(huì )好,嚴重的甚至被降權,被K。
如何加深一下你對網(wǎng)頁(yè)凈化和消重的理解:網(wǎng)頁(yè)凈化和消重是大規模搜索引擎系統預處理環(huán)節的重要組成部分。所謂網(wǎng)頁(yè)凈化(noise reduction)就是識別和清除網(wǎng)頁(yè)內的噪音內容(如廣告、版權信息等),并提取網(wǎng)頁(yè)的主題以及和主題相關(guān)的內容;消重(replicas or near-replicas detection)是指去除所搜集網(wǎng)頁(yè)集合中主題內容重復的網(wǎng)頁(yè)。建索引一般是在消重后的網(wǎng)頁(yè)集上進(jìn)行的,這樣就可以保證用戶(hù)在查詢(xún)時(shí)不會(huì )出現大量?jì)热葜貜偷木W(wǎng)頁(yè)。
當我們?yōu)g覽Web,從中獲取所需信息的同時(shí),還會(huì )常??匆?jiàn)大量和我們所關(guān)心內容無(wú)關(guān)的導航條、廣告信息、版權信息以及調查問(wèn)卷等,我們稱(chēng)之為“噪 音”內容。有時(shí)候,我們可能從這些噪音內容中得到一些意外的驚喜;另一些時(shí)候,我們可能不喜歡這些東西消耗人類(lèi)寶貴的注意力資源。同時(shí),噪音內容往往會(huì )導致相互鏈接的網(wǎng)頁(yè)常常并無(wú)內容相關(guān)性。
重慶網(wǎng)絡(luò )公司
地址:重慶市渝中區上清寺鑫隆達B座28-8
郵編:400015
電話(huà):023-63612462
EMAIL:cnjl_net@163.com