国产精品一区二区三区久久久_这里精品_91新地址_91看片看淫黄大片_夜夜骑狠狠干_亚洲成人精品一区

<b>搜索引擎的HITS算法原理分析</b>

作者:caiji 來源:未知 2013-04-22 23:14:28 閱讀 我要評論 直達(dá)商品

  3、 HITS算法對網(wǎng)頁集結(jié)的拓展也會導(dǎo)致新的問題呈現(xiàn),因為是對搜索結(jié)不美觀進(jìn)行再次生成,所以在對換集進(jìn)行擴展的時辰不成避免的要增添良多頁面,有時這些頁面是和搜索結(jié)不美觀中網(wǎng)頁有著些許的關(guān)系,只不外是被集結(jié)中的網(wǎng)頁引用了,所以一旦搜索結(jié)不美觀中存在年夜量的這樣網(wǎng)頁的話,那么經(jīng)由過程HITS算法的來的結(jié)不美觀就會使得我們基于主題的發(fā)芽變寬泛了,也就是說我們可能得不到切確的搜索結(jié)不美觀了。

  1、 T中都是和集結(jié)中網(wǎng)頁相關(guān)的頁面

  首先,我們知道HITS算法是基于主題發(fā)芽的搜索引擎算法,所以當(dāng)用戶向搜索引擎提交主題發(fā)芽時,搜索引擎按照用戶的檢索詞進(jìn)行關(guān)頭詞匹配發(fā)芽,同時返回若干項與主題高度相關(guān)的網(wǎng)頁集結(jié)S,在這些相關(guān)性的網(wǎng)頁集結(jié)中,網(wǎng)頁之間會有年夜量和網(wǎng)頁相關(guān)的鏈接,所以此時搜索引擎算法HITS算法就按照網(wǎng)頁上鏈接的特點將網(wǎng)頁集結(jié)S進(jìn)行拓展,即將集結(jié)網(wǎng)頁上的鏈接,網(wǎng)頁引用的鏈接,和被其他頁面的引用的鏈接都插手到該集結(jié)中,形成一個新的集結(jié)T,同時我們對換集T的要求是:

  剖析鏈接是常見的搜索引擎剖析網(wǎng)頁結(jié)構(gòu)的一種體例,一般是搜索引擎按攝影關(guān)的鏈接剖析算法,然后對與網(wǎng)頁相關(guān)的外鏈和內(nèi)鏈進(jìn)行具體的數(shù)據(jù)清算和剖析,而且按照這些鏈接的特點,再對網(wǎng)頁進(jìn)行一個評分和排序,當(dāng)就用戶搜索某個關(guān)頭辭書時辰,搜索引擎就會對與該關(guān)頭詞相關(guān)主題的網(wǎng)頁中的這些鏈接進(jìn)行一個合理剖析,然后排序,最后就獲得了排名的結(jié)構(gòu),在本文中,筆者要跟凱旅談判的主題是HITS,而HITS算法是鏈接剖析算法中斗勁有代表性的一種。

  2、 T中的集結(jié)頁面都要于主題高度相關(guān)

  3、 T中要包含年夜量的HUB頁面和Authority頁面

I 操作: 搜索引擎算法hits算法淺析(1) O操作:hits算法剖析(2)

 

  在體味了HITS算法的焦點思惟之后,我們需要體味的就是若何按照該算法所給出的思惟進(jìn)行計較網(wǎng)頁集結(jié)中的網(wǎng)頁的權(quán)重來對搜索結(jié)不美觀進(jìn)行排序,那么下面筆者經(jīng)由過程http://www.gscpp.net這個網(wǎng)站的操作體例對HITS算法進(jìn)行進(jìn)一步的剖解:我們可以將拓展出來的網(wǎng)頁集結(jié)T看做一個集結(jié)矩陣,同時將中的所有HUB網(wǎng)頁看做為極點集A,將集結(jié)中包含的所有權(quán)威型的網(wǎng)頁看做是極點集B,其中A中的網(wǎng)頁到B中的網(wǎng)頁的超鏈接為邊集E,形成一個二分有向圖SG=(A,B,E)。對HUB集結(jié)A中的任一個極點a,用h(a)暗示網(wǎng)頁a的Hub值,對B中的極點b,用a(b)暗示網(wǎng)頁的Authority值。起頭時h(a)=a(b)=1,對b執(zhí)行I操作改削它的a(b),對a執(zhí)行O操作改削它的h(a),然后規(guī)范化a(b),h(a),如斯不竭的一再計較下面的操作I,O,直到a(b),h(a)收斂。(證實此算神通斂可見 )

  剖析:年夜以上算法思惟中我們可以切磋出良多問題,

  HITS算法在應(yīng)用中,一般都是操作HUB頁(網(wǎng)頁中良多鏈接,而且都是指向權(quán)威的頁面,一般都是導(dǎo)航或者目錄網(wǎng)頁)和Authority(就是被年夜量鏈接指向的網(wǎng)頁,也就是權(quán)威型的網(wǎng)頁)頁面之間指向鏈接的互相增強關(guān)系來對網(wǎng)頁給以分值計較,也就是說該算法的實施過程中是將搜索引擎年夜互聯(lián)網(wǎng)上抓去到全數(shù)網(wǎng)頁分為HUB頁面和Authority頁面,在搜索引擎看來,好的Hub網(wǎng)頁應(yīng)該是指向良多的權(quán)威型的網(wǎng)頁,而權(quán)威值高的網(wǎng)頁應(yīng)該是擁有良多指向Hub網(wǎng)頁的鏈接,所以我們由此而得出了HITS算法的焦點思惟:

  1、 好比如不美觀用戶向搜索引擎提交發(fā)芽主題之后,搜索引擎要想為用戶供給精準(zhǔn)的搜索結(jié)不美觀時就必需對搜索結(jié)不美觀進(jìn)行拓展,而巨匠單的搜索結(jié)不美觀進(jìn)行豐碩拓展時需要年夜量的時刻去剖析,延遲了用戶請求的響應(yīng)時刻,所以對搜索引擎來說不能在最短的時刻內(nèi)為用戶供給搜索結(jié)不美觀就證實該算法是失蹤敗的、不科學(xué)的。

  2、 一個網(wǎng)頁中包含了良多鏈接,好比導(dǎo)航鏈接、廣告鏈接、以及軌范自動生成的鏈接,而這些鏈接的存在勢必會對搜索結(jié)不美觀發(fā)生影響,在HITS算法中將搜索結(jié)不美觀中呈現(xiàn)的網(wǎng)頁鏈接都進(jìn)行了剖析,所以在搜索結(jié)不美觀中可能會呈現(xiàn)這些無效鏈接引用的網(wǎng)頁。

  4、 HITS算法是基于主題發(fā)芽的,也就是說返回的結(jié)不美觀是按照關(guān)頭詞完全匹配的,注重的是與主題高度相關(guān)的主社區(qū),而對于那些有著不太相關(guān)的鏈接是很少能夠顧及到的,所以很輕易在搜索結(jié)不美觀中導(dǎo)致主題漂移問題,然而這個問題該算法且則也無法解決,這點事最年夜的不足。文章來自廣州網(wǎng)站培植,網(wǎng)站培植流程:http://www.gscpp.net/site/2.html轉(zhuǎn)載必需保留鏈接!


  推薦閱讀

  <b>優(yōu)化如何有效的提升網(wǎng)站粘度的三大技巧詳解</b>

第一,尋找精準(zhǔn)的方針人群也就是方針客戶 。這一點很是了然,也很是輕易理解,我的網(wǎng)站目的是什么,想要獲得哪些客戶的信賴和撐持,想吸引哪些高質(zhì)量的訪客都是我們要思考和考慮的問題,一般對于人群定向方面筆者建議>>>詳細(xì)閱讀


本文標(biāo)題:<b>搜索引擎的HITS算法原理分析</b>

地址:http://www.oumuer.cn/a/34/20130422/266534.html

頂一下

樂購科技部分新聞及文章轉(zhuǎn)載自互聯(lián)網(wǎng),供讀者交流和學(xué)習(xí),若有涉及作者版權(quán)等問題請及時與我們聯(lián)系,以便更正、刪除或按規(guī)定辦理。感謝所有提供資訊的網(wǎng)站,歡迎各類媒體與樂購科技進(jìn)行文章共享合作。

網(wǎng)友點評
我的評論: 人參與評論
驗證碼: 匿名回答
網(wǎng)友評論(點擊查看更多條評論)
友情提示: 登錄后發(fā)表評論,可以直接從評論中的用戶名進(jìn)入您的個人空間,讓更多網(wǎng)友認(rèn)識您。
自媒體專欄

評論

熱度

主站蜘蛛池模板: 超级乱淫片国语对白免费视频 | 国产精品久久久久国产a级 日韩在线二区 | 国产精品中文字幕在线 | 天天影视网色香欲综合网无拦截 | 免费国产一区二区 | 99热在线精品播放 | 成人片免费看 | 98久久久 | 成人精品二区 | 欧美一性一交 | 欧美高清成人 | 国产精品成人国产乱一区 | 国产激情 | 亚洲91精品| 狠狠久久伊人中文字幕 | 中文成人无字幕乱码精品 | 久在线视频 | 精品久久一区二区三区 | 欧美一区二区三区成人 | 91精品国产综合久久久久久丝袜 | 成人午夜影院 | 一区视频| 日韩一区二区在线观看视频 | 国产毛片精品 | 搡女人真爽免费午夜网站 | www.亚洲区| 成全视频免费观看在线看黑人 | 精品一区二区三区四区五区 | 欧美区 日韩区 | 亚洲第一成年免费网站 | 国产九九九 | 久久久xxxx | 亚洲性视屏 | 欧洲精品久久久 | 欧美精品成人一区二区三区四区 | 国产超碰人人模人人爽人人添 | 久久欧美精品 | 亚洲一区二区三区 | 永久精品| 欧美精品在线不卡 | 黄色a三级 |