您的位置:網(wǎng)站首頁(yè) > 優(yōu)秀論文 > 正文
網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘
作者:張敬來(lái)源:http://www.zzqkw.com日期:2013-05-15人氣:972
網(wǎng)絡(luò)結(jié)構(gòu)挖掘是從Web文檔結(jié)構(gòu)、WWW的組織結(jié)構(gòu)和鏈接關(guān)系中推導(dǎo)的。網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘的目的是尋找Web和頁(yè)面的結(jié)構(gòu)及其蘊(yùn)含在這些結(jié)構(gòu)中的有用模式,然后對(duì)其鏈接進(jìn)行合理的分類,通過(guò)不同網(wǎng)頁(yè)的關(guān)聯(lián)有助于用戶找到所需信息的相關(guān)資源,并且可以通過(guò)瀏覽特定的網(wǎng)頁(yè)從中獲取最新的動(dòng)態(tài)信息。還可以發(fā)現(xiàn)Web文檔本身固有的結(jié)構(gòu),此種結(jié)構(gòu)既可以擁有用戶的瀏覽,也可以對(duì)網(wǎng)頁(yè)進(jìn)行比較。
1.網(wǎng)絡(luò)信息用法挖掘
通過(guò)網(wǎng)絡(luò)信息用法挖掘,可以充分的了解用戶的網(wǎng)絡(luò)數(shù)據(jù)實(shí)際意義。網(wǎng)絡(luò)信息內(nèi)容挖掘和網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘主要是針對(duì)原始數(shù)據(jù)的,而網(wǎng)絡(luò)信息用法挖掘主要是針對(duì)用戶和網(wǎng)絡(luò)交互的過(guò)程中產(chǎn)生的數(shù)據(jù)。這些數(shù)據(jù)類型包括很多:用戶對(duì)網(wǎng)絡(luò)服務(wù)器的訪問(wèn)記錄、瀏覽器日志記錄、用戶的個(gè)人信息、用戶額交易信息等等。運(yùn)用網(wǎng)絡(luò)信息用法挖掘技術(shù)能夠有效的從服務(wù)器以及瀏覽器端的日志記錄中發(fā)現(xiàn)隱藏在網(wǎng)絡(luò)數(shù)據(jù)中的一些無(wú)法通過(guò)索引獲取的模式信息,還可以了解用戶對(duì)網(wǎng)絡(luò)系統(tǒng)的訪問(wèn)模式以及在網(wǎng)絡(luò)上所進(jìn)行的行為模式,從而對(duì)其作出預(yù)測(cè)性分析。
2.網(wǎng)絡(luò)新挖掘在信息檢索中的應(yīng)用
網(wǎng)絡(luò)信息挖掘的作用除了體現(xiàn)在具有很大權(quán)威的網(wǎng)頁(yè)的生成上外,還可以通過(guò)Web的組織結(jié)構(gòu)和鏈接關(guān)系中發(fā)現(xiàn)一些其他類型的知識(shí)。網(wǎng)絡(luò)信息挖掘可以通過(guò)挖掘web的結(jié)構(gòu)信息揭示蘊(yùn)含在web內(nèi)容之外的許多隱含的有用信息,例如web頁(yè)面上的U不僅可以反映頁(yè)面的類型,還可以在一定程度上反映頁(yè)面間信息的存儲(chǔ)位置和不同信息內(nèi)容的層次關(guān)系以及通過(guò)分析網(wǎng)頁(yè)的URL來(lái)分析這種層次關(guān)系。根據(jù)上述原理已有很多人提出了與web頁(yè)面URL有關(guān)的啟發(fā)式規(guī)則,并將其應(yīng)用于尋找個(gè)人主頁(yè)上。因此,利用網(wǎng)絡(luò)信息挖掘可以很快的尋找個(gè)人主頁(yè)和與其相似的網(wǎng)頁(yè)。除此之外,web的信息挖掘還可以對(duì)web頁(yè)進(jìn)行合理的分類,預(yù)測(cè)用戶的鏈接使用及鏈接屬性的可視化,對(duì)各個(gè)企業(yè)搜索引擎索引的web頁(yè)數(shù)量進(jìn)行統(tǒng)計(jì)分析等。它也可以揭示文檔結(jié)構(gòu)信息中的有用模式,有助于從多個(gè)維度和層面提供檢索途徑。
3.結(jié)語(yǔ)
因?yàn)樾畔r(shí)代的發(fā)展,促使網(wǎng)絡(luò)信息挖掘成為網(wǎng)絡(luò)信息處理領(lǐng)域中的一項(xiàng)新技術(shù),它可以使用戶通過(guò)大量網(wǎng)絡(luò)信息中,得到數(shù)據(jù)對(duì)象間的內(nèi)在特性,并根據(jù)數(shù)據(jù)間的關(guān)聯(lián)在網(wǎng)絡(luò)資源中進(jìn)行有目的獲取相應(yīng)的信息。目前網(wǎng)絡(luò)信息挖掘是數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)時(shí)代網(wǎng)絡(luò)信息處理中的一項(xiàng)非常重要的應(yīng)用,同時(shí)也是今后網(wǎng)絡(luò)領(lǐng)域中的一項(xiàng)嶄新的研究課題。隨著網(wǎng)絡(luò)的快速發(fā)展和不斷的普及,網(wǎng)絡(luò)信息資源不但來(lái)源途徑更加廣泛而且內(nèi)容也越來(lái)越豐富,但如何分析和利用這些無(wú)以計(jì)數(shù)的網(wǎng)絡(luò)數(shù)據(jù)是當(dāng)前比較突出的一個(gè)問(wèn)題。網(wǎng)絡(luò)信息挖掘在實(shí)際工作中具有重要的實(shí)踐意義和非常廣闊的應(yīng)用前景。
欄目分類
熱門排行
推薦信息
- 面向職業(yè)技能大賽的無(wú)線網(wǎng)絡(luò)課程教學(xué)改革
- 網(wǎng)絡(luò)安全等級(jí)保護(hù)中tomcat整改的探討
- 探析微博環(huán)境下網(wǎng)紅的現(xiàn)狀及轉(zhuǎn)型之路——以美食博主李子柒為例
- 大數(shù)據(jù)時(shí)代人工智能在網(wǎng)絡(luò)管理中的應(yīng)用研究
- 新媒體環(huán)境下網(wǎng)絡(luò)輿論的形成機(jī)制研究
- 淺析網(wǎng)絡(luò)謠言的傳播機(jī)制——基于王鳳雅事件的案例分析
- 我國(guó)互聯(lián)網(wǎng)金融監(jiān)管的若干思考
- 淺析網(wǎng)絡(luò)傳播中議題的儀式化
- 試論網(wǎng)絡(luò)直播的風(fēng)險(xiǎn)與治理
- 新媒介語(yǔ)境下的網(wǎng)絡(luò)輿論分析——基于內(nèi)容分析方法
期刊知識(shí)
- 喜報(bào)!《中國(guó)博物館》入選CSSCI擴(kuò)展版來(lái)源期刊(最新CSSCI南大核心期刊目錄2025-2026版)!新入選!
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 2023JCR影響因子正式公布!
- 國(guó)內(nèi)核心期刊分級(jí)情況概覽及說(shuō)明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個(gè)很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問(wèn)題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個(gè)知識(shí)點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評(píng)職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級(jí)黨報(bào)?是否有什么說(shuō)據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報(bào)?