優(yōu)勝?gòu)倪x擇開(kāi)始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測(cè) 我要投稿 合法期刊查詢

網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘

作者:張敬來(lái)源:http://www.zzqkw.com日期:2013-05-15人氣:972
網(wǎng)絡(luò)結(jié)構(gòu)挖掘是從Web文檔結(jié)構(gòu)、WWW的組織結(jié)構(gòu)和鏈接關(guān)系中推導(dǎo)的。網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘的目的是尋找Web和頁(yè)面的結(jié)構(gòu)及其蘊(yùn)含在這些結(jié)構(gòu)中的有用模式,然后對(duì)其鏈接進(jìn)行合理的分類,通過(guò)不同網(wǎng)頁(yè)的關(guān)聯(lián)有助于用戶找到所需信息的相關(guān)資源,并且可以通過(guò)瀏覽特定的網(wǎng)頁(yè)從中獲取最新的動(dòng)態(tài)信息。還可以發(fā)現(xiàn)Web文檔本身固有的結(jié)構(gòu),此種結(jié)構(gòu)既可以擁有用戶的瀏覽,也可以對(duì)網(wǎng)頁(yè)進(jìn)行比較。 1.網(wǎng)絡(luò)信息用法挖掘 通過(guò)網(wǎng)絡(luò)信息用法挖掘,可以充分的了解用戶的網(wǎng)絡(luò)數(shù)據(jù)實(shí)際意義。網(wǎng)絡(luò)信息內(nèi)容挖掘和網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘主要是針對(duì)原始數(shù)據(jù)的,而網(wǎng)絡(luò)信息用法挖掘主要是針對(duì)用戶和網(wǎng)絡(luò)交互的過(guò)程中產(chǎn)生的數(shù)據(jù)。這些數(shù)據(jù)類型包括很多:用戶對(duì)網(wǎng)絡(luò)服務(wù)器的訪問(wèn)記錄、瀏覽器日志記錄、用戶的個(gè)人信息、用戶額交易信息等等。運(yùn)用網(wǎng)絡(luò)信息用法挖掘技術(shù)能夠有效的從服務(wù)器以及瀏覽器端的日志記錄中發(fā)現(xiàn)隱藏在網(wǎng)絡(luò)數(shù)據(jù)中的一些無(wú)法通過(guò)索引獲取的模式信息,還可以了解用戶對(duì)網(wǎng)絡(luò)系統(tǒng)的訪問(wèn)模式以及在網(wǎng)絡(luò)上所進(jìn)行的行為模式,從而對(duì)其作出預(yù)測(cè)性分析。 2.網(wǎng)絡(luò)新挖掘在信息檢索中的應(yīng)用 網(wǎng)絡(luò)信息挖掘的作用除了體現(xiàn)在具有很大權(quán)威的網(wǎng)頁(yè)的生成上外,還可以通過(guò)Web的組織結(jié)構(gòu)和鏈接關(guān)系中發(fā)現(xiàn)一些其他類型的知識(shí)。網(wǎng)絡(luò)信息挖掘可以通過(guò)挖掘web的結(jié)構(gòu)信息揭示蘊(yùn)含在web內(nèi)容之外的許多隱含的有用信息,例如web頁(yè)面上的U不僅可以反映頁(yè)面的類型,還可以在一定程度上反映頁(yè)面間信息的存儲(chǔ)位置和不同信息內(nèi)容的層次關(guān)系以及通過(guò)分析網(wǎng)頁(yè)的URL來(lái)分析這種層次關(guān)系。根據(jù)上述原理已有很多人提出了與web頁(yè)面URL有關(guān)的啟發(fā)式規(guī)則,并將其應(yīng)用于尋找個(gè)人主頁(yè)上。因此,利用網(wǎng)絡(luò)信息挖掘可以很快的尋找個(gè)人主頁(yè)和與其相似的網(wǎng)頁(yè)。除此之外,web的信息挖掘還可以對(duì)web頁(yè)進(jìn)行合理的分類,預(yù)測(cè)用戶的鏈接使用及鏈接屬性的可視化,對(duì)各個(gè)企業(yè)搜索引擎索引的web頁(yè)數(shù)量進(jìn)行統(tǒng)計(jì)分析等。它也可以揭示文檔結(jié)構(gòu)信息中的有用模式,有助于從多個(gè)維度和層面提供檢索途徑。 3.結(jié)語(yǔ) 因?yàn)樾畔r(shí)代的發(fā)展,促使網(wǎng)絡(luò)信息挖掘成為網(wǎng)絡(luò)信息處理領(lǐng)域中的一項(xiàng)新技術(shù),它可以使用戶通過(guò)大量網(wǎng)絡(luò)信息中,得到數(shù)據(jù)對(duì)象間的內(nèi)在特性,并根據(jù)數(shù)據(jù)間的關(guān)聯(lián)在網(wǎng)絡(luò)資源中進(jìn)行有目的獲取相應(yīng)的信息。目前網(wǎng)絡(luò)信息挖掘是數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)時(shí)代網(wǎng)絡(luò)信息處理中的一項(xiàng)非常重要的應(yīng)用,同時(shí)也是今后網(wǎng)絡(luò)領(lǐng)域中的一項(xiàng)嶄新的研究課題。隨著網(wǎng)絡(luò)的快速發(fā)展和不斷的普及,網(wǎng)絡(luò)信息資源不但來(lái)源途徑更加廣泛而且內(nèi)容也越來(lái)越豐富,但如何分析和利用這些無(wú)以計(jì)數(shù)的網(wǎng)絡(luò)數(shù)據(jù)是當(dāng)前比較突出的一個(gè)問(wèn)題。網(wǎng)絡(luò)信息挖掘在實(shí)際工作中具有重要的實(shí)踐意義和非常廣闊的應(yīng)用前景。

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過(guò)郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號(hào)中州期刊聯(lián)盟 ICP備案號(hào):豫ICP備2020036848

【免責(zé)聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請(qǐng)及時(shí)告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

法律顧問(wèn):北京京師(新鄉(xiāng))律師事務(wù)所

關(guān)注”中州期刊聯(lián)盟”公眾號(hào)
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院?jiǎn)挝话l(fā)核心?

掃描關(guān)注公眾號(hào)

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言