范文為教學(xué)中作為模范的文章,也常常用來(lái)指寫(xiě)作的模板。常常用于文秘寫(xiě)作的參考,也可以作為演講材料編寫(xiě)前的參考。范文怎么寫(xiě)才能發(fā)揮它最大的作用呢?這里我整理了一些優(yōu)秀的范文,希望對(duì)大家有所幫助,下面我們就來(lái)了解一下吧。
數(shù)據(jù)挖掘論文篇一
數(shù)據(jù)挖掘的概念和應(yīng)用已經(jīng)滲透到社會(huì)生活和工業(yè)生產(chǎn)的各個(gè)領(lǐng)域。作為數(shù)據(jù)挖掘的實(shí)踐者,本人在讀數(shù)學(xué)專業(yè)的同時(shí),也興趣盎然地涉足了數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域。在一次數(shù)據(jù)挖掘課程中,我完成了一篇論文,能讓我對(duì)數(shù)據(jù)挖掘這個(gè)領(lǐng)域有更深入的認(rèn)識(shí)和體驗(yàn)。這篇論文讓我深入了解了數(shù)據(jù)挖掘的思路,技術(shù)和應(yīng)用,并且讓我體會(huì)到寫(xiě)論文不僅僅是理論知識(shí),更需要實(shí)踐的動(dòng)手能力,思維的掌握能力,和成果演示的表達(dá)能力。在這篇心得體會(huì)中,我想分享我的經(jīng)驗(yàn),和大家一起探究數(shù)據(jù)挖掘的獨(dú)特之處。
第一段:學(xué)習(xí)數(shù)據(jù)挖掘的信念
數(shù)據(jù)挖掘作為一個(gè)復(fù)雜的技術(shù)領(lǐng)域,它的研究對(duì)象可以是已有的數(shù)據(jù)集合,經(jīng)修正的數(shù)據(jù)對(duì)象或者真實(shí)的數(shù)據(jù)。要想在這個(gè)領(lǐng)域獲得成功,首先需要有學(xué)習(xí)數(shù)據(jù)挖掘的信念。學(xué)習(xí)數(shù)據(jù)挖掘,不僅需要具有信息學(xué)、數(shù)學(xué)、統(tǒng)計(jì)、計(jì)算機(jī)等領(lǐng)域的基本素養(yǎng),還要具備探索、創(chuàng)新、思維、推理能力等本質(zhì)要素。當(dāng)我們深入學(xué)習(xí)數(shù)據(jù)挖掘技術(shù)時(shí),我們不僅需要明``確各項(xiàng)技術(shù)特征,還需要全面了解不同類型的數(shù)據(jù)分析流程。
第二段:學(xué)習(xí)數(shù)據(jù)挖掘的方法
一般來(lái)說(shuō),學(xué)習(xí)數(shù)據(jù)挖掘的方法包括:學(xué)習(xí)關(guān)于數(shù)據(jù)挖掘的各種知識(shí)點(diǎn)、探索分享“開(kāi)源”資源、通過(guò)訓(xùn)練理論模型以及掌握不同實(shí)際應(yīng)用場(chǎng)景下的數(shù)據(jù)挖掘流程等。這些方法都非常必要,同時(shí)也大大豐富了我們的數(shù)據(jù)挖掘知識(shí)儲(chǔ)備。
第三段:論文的核心內(nèi)容
在畢業(yè)論文寫(xiě)作之中,我寫(xiě)了一篇關(guān)于“基于樹(shù)模型的數(shù)據(jù)挖掘方法研究與應(yīng)用”的論文。本文利用樹(shù)形神經(jīng)網(wǎng)絡(luò)模型,并通過(guò)對(duì)數(shù)據(jù)源進(jìn)行預(yù)處理和特征選擇,把語(yǔ)音呼叫數(shù)據(jù)與樣本數(shù)據(jù)進(jìn)行匹配,并提出了樹(shù)形神經(jīng)網(wǎng)絡(luò)模型的性能檢驗(yàn)。同時(shí),本文探討了該模型的實(shí)際應(yīng)用場(chǎng)景以及對(duì)未來(lái)語(yǔ)音識(shí)別的發(fā)展具有重要的參考價(jià)值。該論文的相關(guān)資料、數(shù)據(jù)等都經(jīng)過(guò)了極為詳盡的研究和討論。通過(guò)數(shù)據(jù)挖掘的方法,該論文配備有附錄和數(shù)據(jù)模型的詳細(xì)數(shù)據(jù)分析。
第四段:論文的收獲
通過(guò)這篇論文的寫(xiě)作,我除了掌握數(shù)據(jù)挖掘的基本技能,如預(yù)處理、分析等,更重要的是鍛煉了自己的學(xué)習(xí)能力、團(tuán)隊(duì)溝通協(xié)作能力和美術(shù)設(shè)計(jì)等多方面的能力。通過(guò)論文的撰寫(xiě)和演示,我更加深入地認(rèn)識(shí)了數(shù)據(jù)挖掘應(yīng)用的深度、挑戰(zhàn)和前景。
第五段:未來(lái)展望
在未來(lái)的學(xué)習(xí)和工作中,我希望能夠不斷強(qiáng)化自己數(shù)據(jù)挖掘領(lǐng)域方面的知識(shí)儲(chǔ)備,加速自身的魅力和資質(zhì)提升,成為引領(lǐng)行業(yè)的新一代人才,并在日后的實(shí)踐中不斷總結(jié)經(jīng)驗(yàn),挖掘新的理論問(wèn)題,依托技術(shù)優(yōu)勢(shì)和網(wǎng)絡(luò)平臺(tái),推動(dòng)數(shù)據(jù)挖掘與科技創(chuàng)新的合理發(fā)展,并為行業(yè)的創(chuàng)新與發(fā)展做出重要的貢獻(xiàn)。
數(shù)據(jù)挖掘論文篇二
數(shù)據(jù)挖掘技術(shù)在金融業(yè)、醫(yī)療保健業(yè)、市場(chǎng)業(yè)、零售業(yè)和制造業(yè)等很多領(lǐng)域都得到了很好的應(yīng)用。針對(duì)交通安全領(lǐng)域中交通事故數(shù)據(jù)利用率低的現(xiàn)狀,可以通過(guò)數(shù)據(jù)挖掘?qū)ο嚓P(guān)交通事故數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從而發(fā)現(xiàn)其中的關(guān)聯(lián),這對(duì)提升交通安全水平具有非常重要的意義。
數(shù)據(jù)挖掘(datamining)即對(duì)大量數(shù)據(jù)進(jìn)行有效的分類統(tǒng)計(jì),從而整理出有規(guī)律的、有價(jià)值的、潛在的未知信息。一般來(lái)講,這些數(shù)據(jù)存在極大的隨機(jī)性和不完全性,其包括各行各業(yè)各個(gè)方面的數(shù)據(jù)。數(shù)據(jù)挖掘是一個(gè)結(jié)合了數(shù)據(jù)庫(kù)、人工智能、機(jī)器學(xué)習(xí)的學(xué)科,涉及統(tǒng)計(jì)數(shù)據(jù)和技術(shù)理論等領(lǐng)域。
關(guān)聯(lián)分析作為數(shù)據(jù)挖掘中的重要組成部分,其主要作用就是通過(guò)數(shù)據(jù)之間的相互關(guān)聯(lián)從而發(fā)現(xiàn)數(shù)據(jù)集中某種未知的聯(lián)系。關(guān)聯(lián)分析最初是在20世紀(jì)90年代初被提出來(lái)的,一直備受關(guān)注。已被廣泛應(yīng)用于各行各業(yè),包括醫(yī)療體檢、電子商務(wù)、商業(yè)金融等各個(gè)領(lǐng)域。關(guān)聯(lián)規(guī)則的挖掘一般可分成兩個(gè)步驟[1]:
(1)找出頻繁項(xiàng)集,不小于最小支持度的項(xiàng)集;
(2)生成強(qiáng)關(guān)聯(lián)規(guī)則,不小于最小置信度的關(guān)聯(lián)規(guī)則。相對(duì)于生成強(qiáng)關(guān)聯(lián)規(guī)則,找出頻繁項(xiàng)集這一步比較麻煩。l等人在1994年提出的apriori算法是生成頻繁項(xiàng)集的經(jīng)典算法[2]。apriori算法使用了level-wise搜索的迭代方法,即用k-項(xiàng)集探索(k+1)-項(xiàng)集。apriori算法在整體上可分為兩個(gè)部分。
(1)發(fā)現(xiàn)頻集。這個(gè)部分是最重要的,開(kāi)銷相繼產(chǎn)生了各種各樣的頻集算法,專門(mén)用于發(fā)現(xiàn)頻集,以降低其復(fù)雜度、提高發(fā)現(xiàn)頻集的效率。
(2)利用所獲得的頻繁項(xiàng)集各種算法主要致力產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。當(dāng)然頻集構(gòu)成的聯(lián)規(guī)則未必是強(qiáng)關(guān)聯(lián)規(guī)則,還要檢驗(yàn)構(gòu)成的關(guān)聯(lián)規(guī)則的支持度和支持度是否超過(guò)它們的閾值。apriori算法找出頻繁項(xiàng)集分為兩步:連接和剪枝。
(1)連接。集合lk-1為頻繁k-1項(xiàng)集的集合,它通過(guò)與自身連接就可以生成候選k項(xiàng)集的集合,記作ck。
(2)剪枝。頻繁k項(xiàng)集的集合lk是ck的子集。剪枝首先利用apriori算法的性質(zhì)(頻繁項(xiàng)集的所有非空子集都是頻繁的,如果不滿足這個(gè)條件,就從候選集合ck中刪除)對(duì)ck進(jìn)行壓縮;然后,通過(guò)掃描所有的事務(wù),確定壓縮后ck中的每個(gè)候選的支持度;最后與設(shè)定的最小支持度進(jìn)行比較,如果支持度不小于最小支持度,則認(rèn)為該候選項(xiàng)是頻繁的。目前,在互聯(lián)網(wǎng)技術(shù)及科學(xué)技術(shù)的快速發(fā)展下,人工智能、機(jī)器識(shí)別等技術(shù)興起,關(guān)聯(lián)分析也被越來(lái)越多應(yīng)用其中,并在不斷發(fā)展中提出了大量的改進(jìn)算法。
近年來(lái),我國(guó)越來(lái)越多的學(xué)者將數(shù)據(jù)挖掘關(guān)聯(lián)分析應(yīng)用于道路交通事故的研究中,主要是分析道路、車輛、行人以及環(huán)境等因素與交通事故之間的某種聯(lián)系。pande和abdel-aty[3]通過(guò)關(guān)聯(lián)分析研究了美國(guó)佛羅里達(dá)州20xx年非交叉口發(fā)生的道路交通事故,重點(diǎn)分析了各個(gè)不同的影響因素與交通事故之間的內(nèi)在聯(lián)系,通過(guò)研究得出如下結(jié)論,道路照明條件不足是引發(fā)道路交通事故的主要因素,除此之外,還發(fā)現(xiàn)天氣惡劣的環(huán)境下道路彎道的直線段也極易發(fā)生交通事故。graves[4]利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則對(duì)歐洲道路交通事故進(jìn)行了分析,主要研究了交通事故與道路設(shè)施狀況之間的關(guān)聯(lián),通過(guò)研究發(fā)現(xiàn)了易導(dǎo)致交通事故發(fā)生的各個(gè)道路設(shè)施狀況因素,此研究為歐洲路面建設(shè)及投資提供了強(qiáng)大的決策支持。我國(guó)學(xué)者董立巖在研究道路交通事故數(shù)據(jù)的文獻(xiàn)中,將粗糙集與關(guān)聯(lián)分析進(jìn)行了融合,提出了基于偏好信息的決策規(guī)則簡(jiǎn)約算法并將其應(yīng)用其中,通過(guò)分析發(fā)現(xiàn)了道路交通事故的未知規(guī)律。王艷玲通過(guò)關(guān)聯(lián)分析中的因子關(guān)聯(lián)樹(shù)模型重點(diǎn)分析了影響道路交通事故最重要的因子,發(fā)現(xiàn)在道路交通事故常見(jiàn)的誘因人、車、路及環(huán)境中對(duì)事故影響最大的因子是環(huán)境。許卉瑩等利用關(guān)聯(lián)分析、聚類分析以及決策樹(shù)分析三種數(shù)據(jù)挖掘技術(shù)對(duì)道路交通事故數(shù)據(jù)進(jìn)行分析,最終得出了科學(xué)的道路交通事故預(yù)防和交通安全管理決策依據(jù)。尚威等在研究中,對(duì)大量的道路交通數(shù)據(jù)進(jìn)行了有效整合,并在此基礎(chǔ)上按照交通事故相關(guān)因素的不同特點(diǎn)整理出與事故發(fā)生有關(guān)的字段數(shù)據(jù),形成新的事故數(shù)據(jù)記錄表,然后再根據(jù)多維關(guān)聯(lián)規(guī)則對(duì)記錄的相關(guān)數(shù)據(jù)進(jìn)行分析,從而發(fā)現(xiàn)了事故誘導(dǎo)因素記錄字段值和事故結(jié)果字段值組成的道路交通事故頻繁字段的組合。張聽(tīng)等在充分掌握聚類數(shù)據(jù)挖掘理論與方法的基礎(chǔ)上,提出了多目標(biāo)聚類分析框架和一個(gè)啟發(fā)式的聚類算法k-wanmi,并將其用在道路交通事故的聚類研究中對(duì)不同權(quán)重的屬性進(jìn)行了多目標(biāo)分析。同樣,許宏科也利用該方法對(duì)公路隧道交通流數(shù)據(jù)進(jìn)行了聚類分析,其在研究中不僅明確了隧道交通流的峰值規(guī)律,而且還根據(jù)這種規(guī)律制訂了隧道監(jiān)控設(shè)備的不同控制方案,對(duì)提高隧道交通安全的水平做了極大的貢獻(xiàn)。徐磊和方源敏在研究中,提出了由簡(jiǎn)化信息熵構(gòu)造的改進(jìn)c4.5決策樹(shù)算法,并將其應(yīng)用在交通事故數(shù)據(jù)的研究中,對(duì)交通數(shù)據(jù)進(jìn)行了正確分類,發(fā)現(xiàn)了一些隱藏的規(guī)則和知識(shí),為交通管理提供了依據(jù)。劉軍、艾力斯木吐拉、馬曉松運(yùn)用多維關(guān)聯(lián)規(guī)則分析交通事故記錄,從而找到導(dǎo)致交通事故發(fā)生次數(shù)多的主要原因,并且指導(dǎo)相關(guān)部門(mén)作出相應(yīng)的決策。楊希剛運(yùn)用關(guān)聯(lián)規(guī)則為現(xiàn)實(shí)中的交通事故的預(yù)防提供依據(jù)。吉林大學(xué)的吳昊等人,基于關(guān)聯(lián)規(guī)則的理論基礎(chǔ),定義了公路交通事故屬性模型,并結(jié)合改進(jìn)后的apriori算法,分析了交通事故歷史數(shù)據(jù)信息,為有關(guān)單位和用戶尋找道路黑點(diǎn)(即事故多發(fā)點(diǎn))提供了技術(shù)支援和決策幫助。
通過(guò)數(shù)據(jù)挖掘中的關(guān)聯(lián)分析方法雖然能夠?qū)Φ缆方煌ㄊ鹿实南嚓P(guān)因素進(jìn)行清晰的分析,但是目前在這一方面的研究仍有不足之處。因?yàn)殛P(guān)聯(lián)分析在道路交通事故的研究中往往只能片面發(fā)現(xiàn)某一種或幾種因素影響交通事故的規(guī)律,很難將所有影響因素結(jié)合起來(lái)進(jìn)行全面系統(tǒng)的分析。然而道路交通事故的發(fā)生通常都是由相應(yīng)因素導(dǎo)致,而后事故當(dāng)事人意識(shí)到危險(xiǎn)源的存在并采取措施,直到事故發(fā)生的連續(xù)過(guò)程,整體來(lái)看體現(xiàn)了時(shí)序性。也就是說(shuō),道路交通事故是受到一系列按照時(shí)間先后順序排列的影響因素組合共同作用而發(fā)生的,從整體的角度出發(fā)研究事故發(fā)生機(jī)理更加科學(xué)。
數(shù)據(jù)挖掘論文篇三
古典文學(xué)中常見(jiàn)論文這個(gè)詞,當(dāng)代,論文常用來(lái)指進(jìn)行各個(gè)學(xué)術(shù)領(lǐng)域的研究和描述學(xué)術(shù)研究成果的文章,簡(jiǎn)稱為論文。以下就是由編為您提供的。
阿里巴巴成功上市,使馬云一時(shí)間家喻戶曉,同時(shí)讓更多人看到了電商發(fā)展的無(wú)限潛力和廣闊空間。電子商務(wù)是一門(mén)交叉性概念,其涉及理論知識(shí)和領(lǐng)域極為豐富,譬如:管理學(xué)、法學(xué)、經(jīng)濟(jì)學(xué)以及互聯(lián)網(wǎng)技術(shù)等多種領(lǐng)域,是一系列綜合性極強(qiáng)的活動(dòng)。信息技術(shù)的進(jìn)步和社會(huì)商業(yè)的發(fā)展使得經(jīng)濟(jì)數(shù)字化、競(jìng)爭(zhēng)全球化、貿(mào)易自由化的趨勢(shì)不斷加強(qiáng)。有關(guān)電子商務(wù)各類的研究如雨后春筍層出不窮,其中物聯(lián)網(wǎng)技術(shù)作為其發(fā)展的重要支撐不可忽視。為進(jìn)一步了解近年來(lái)我國(guó)基于物聯(lián)網(wǎng)的電商發(fā)展研究熱點(diǎn),筆者通過(guò)對(duì)cnki收錄的相關(guān)文獻(xiàn)的進(jìn)行計(jì)量分析就此展開(kāi)研究。
物聯(lián)網(wǎng)作為一種新興技術(shù),自20世紀(jì)90年代由美國(guó)麻省理工學(xué)院首次提出以來(lái),其技術(shù)實(shí)現(xiàn)及應(yīng)用引起國(guó)內(nèi)外學(xué)術(shù)界學(xué)者廣泛關(guān)注。物聯(lián)網(wǎng)起初是基于物流系統(tǒng)提出的,以射頻識(shí)別技術(shù)作為條碼識(shí)別的替代品,實(shí)現(xiàn)對(duì)物流系統(tǒng)進(jìn)行智能化管理。
在研究物聯(lián)網(wǎng)技術(shù)在電子商務(wù)應(yīng)用中,rfid功不可沒(méi)。rfid(radio frequency identification)技術(shù)作為物聯(lián)網(wǎng)的重要技術(shù),又稱電子標(biāo)簽、無(wú)線射頻識(shí)別,是一種通信技術(shù),可通過(guò)無(wú)線電訊號(hào)識(shí)別特定目標(biāo)并讀寫(xiě)相關(guān)數(shù)據(jù),而無(wú)需識(shí)別系統(tǒng)與特定目標(biāo)之間建立機(jī)械或光學(xué)接觸。電子商務(wù)利用物聯(lián)網(wǎng)技術(shù)通過(guò)把人、財(cái)、物、商店等實(shí)體聯(lián)結(jié)起來(lái)并在網(wǎng)絡(luò)環(huán)境下進(jìn)行交互。在實(shí)現(xiàn)交互時(shí),一個(gè)關(guān)鍵技術(shù)就是利用rfid技術(shù)給各個(gè)實(shí)體標(biāo)注獨(dú)一無(wú)二的標(biāo)簽從而將不同實(shí)體加以區(qū)分。物聯(lián)網(wǎng)技術(shù)不僅承擔(dān)著標(biāo)注實(shí)體角色而且在記錄生產(chǎn)過(guò)程、跟蹤物流以及防偽查詢等方面發(fā)揮著重要作用。
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和經(jīng)濟(jì)全球化浪潮的推動(dòng),電子商務(wù)問(wèn)題及物聯(lián)網(wǎng)技術(shù)成為國(guó)內(nèi)外學(xué)術(shù)界普遍研究熱點(diǎn)。國(guó)內(nèi)學(xué)者就電子商務(wù)發(fā)展進(jìn)程中涉及到的主要環(huán)節(jié)并結(jié)合物聯(lián)網(wǎng)技術(shù)作出相關(guān)研究,并在其研究的基礎(chǔ)之上根據(jù)我國(guó)電子商務(wù)發(fā)展?fàn)顩r提出了針對(duì)性建議,這些環(huán)節(jié)主要包括基礎(chǔ)設(shè)施建設(shè)、支付環(huán)境、信用環(huán)境以及發(fā)展環(huán)境的改善等等。
國(guó)內(nèi)對(duì)電子商務(wù)的研究熱度頗高,然而對(duì)物聯(lián)網(wǎng)技術(shù)下電子商務(wù)的研究相對(duì)匱乏。2017年4月,我們?cè)赾nki上以“主題=電子商務(wù)”為檢索式進(jìn)行檢索,查得相關(guān)記錄83605條;以“主題=‘物聯(lián)網(wǎng)’+‘電子商務(wù)’”為檢索式得到609條記錄,通過(guò)篩選共112篇文獻(xiàn)與本文研究相關(guān)。在112篇文章中,98篇為非基金文獻(xiàn),基金文獻(xiàn)僅占1/8。據(jù)調(diào)查,近年來(lái)我國(guó)基于物聯(lián)網(wǎng)技術(shù)對(duì)電子商務(wù)研究集中在物聯(lián)網(wǎng)技術(shù)在各行業(yè)電子商務(wù)中的應(yīng)用、物聯(lián)網(wǎng)對(duì)電商的影響以及基于物聯(lián)網(wǎng)技術(shù)新型模式的研討等方面。因此,圍繞物聯(lián)網(wǎng)環(huán)境下電子商務(wù)發(fā)展動(dòng)向及趨勢(shì)并進(jìn)行相關(guān)比較分析對(duì)把握電子商務(wù)發(fā)展中關(guān)鍵問(wèn)題具有極強(qiáng)的現(xiàn)實(shí)意義和指導(dǎo)意義。
數(shù)據(jù)挖掘論文篇四
摘要:人類利用圖書(shū)館產(chǎn)生信息活動(dòng)時(shí)所表現(xiàn)出的最基礎(chǔ)、最平常、最通用的一種關(guān)系,便是用戶資源和圖書(shū)館之間的關(guān)系。從這種關(guān)系出發(fā),分析嫁接起這一簡(jiǎn)單聯(lián)系的規(guī)律,便是數(shù)據(jù)挖掘技術(shù)。本文認(rèn)為對(duì)圖書(shū)館用戶資源分析研究應(yīng)以數(shù)據(jù)挖掘技術(shù)為邏輯起點(diǎn),從云計(jì)算、信息共享、數(shù)據(jù)排查、智能搜索、大數(shù)據(jù)存儲(chǔ)等對(duì)圖書(shū)館用戶資源進(jìn)行整合和建設(shè)。應(yīng)對(duì)信息資源日益豐富的這天,數(shù)據(jù)挖掘技術(shù)對(duì)管理圖書(shū)館信息資源技術(shù)帶給了巨大便利。
關(guān)鍵詞:數(shù)據(jù)挖掘;用戶資源
數(shù)據(jù)挖掘,即數(shù)據(jù)系統(tǒng)中的信息發(fā)現(xiàn)。隨著計(jì)算機(jī)技術(shù),個(gè)性是云計(jì)算、大數(shù)據(jù)記憶技術(shù)的快速發(fā)展,傳統(tǒng)的手動(dòng)查找信息模式被大數(shù)據(jù)智能檢索替代。數(shù)據(jù)挖掘技術(shù)廣泛應(yīng)用于市場(chǎng)、工業(yè)、金融行業(yè)、科學(xué)界、互聯(lián)網(wǎng)行業(yè)以及醫(yī)療業(yè)。數(shù)據(jù)挖掘技術(shù)在圖書(shū)館的應(yīng)用,能夠?qū)⒑A康挠脩糍Y源進(jìn)行聚類、關(guān)聯(lián)、整合,能夠?qū)τ脩羲阉饔涗?、圖書(shū)流通記錄、用戶借閱信息等數(shù)據(jù)進(jìn)行精確預(yù)判,發(fā)現(xiàn)一些隱蔽的聯(lián)系,為圖書(shū)館采購(gòu)圖書(shū)、淘汰文獻(xiàn)資料帶給科學(xué)推薦,也能夠?yàn)橛脩魩Ыo個(gè)性化訂閱服務(wù),創(chuàng)新用戶服務(wù)模式,為圖書(shū)館建設(shè)整個(gè)信息網(wǎng)絡(luò)帶給有力支撐。
1大數(shù)據(jù)下的圖書(shū)館用戶資源特征
圖書(shū)館用戶資源是透過(guò)數(shù)字技術(shù)進(jìn)行組織和管理的:(1)經(jīng)過(guò)數(shù)據(jù)關(guān)聯(lián)分析,把數(shù)據(jù)庫(kù)中存在的兩個(gè)或兩個(gè)以上用戶之間的相同性提取出來(lái),提高支持度和說(shuō)服力;(2)把用戶信息按照相似性歸納成幾個(gè)類別,建立宏觀概念,發(fā)現(xiàn)其間的相互關(guān)系;其次定義這些相互關(guān)系,概念產(chǎn)生以后,即等同于這些相互關(guān)系的整體信息,用于建構(gòu)分類規(guī)則或者數(shù)據(jù)模型;其次利用以上數(shù)據(jù)找出變化規(guī)律,對(duì)此規(guī)律進(jìn)行模型化處理,并由數(shù)據(jù)模型對(duì)未知信息進(jìn)行預(yù)判;(3)把用戶資源進(jìn)行時(shí)序排序,檢索出高重復(fù)率的模型;(4)進(jìn)行偏差比對(duì),檢查數(shù)據(jù)之中的異常狀況。圖書(shū)館利用超多的用戶訪問(wèn)信息獲取用戶興趣,發(fā)現(xiàn)用戶群體,為不同的群體定制信息,還能夠建立一個(gè)共享信息平臺(tái),讓不同用戶建立網(wǎng)絡(luò)交流。
1.1數(shù)據(jù)量大并且分布更廣
大數(shù)據(jù)形勢(shì)下,圖書(shū)館能夠獲取的用戶資源不僅僅限于用戶個(gè)人信息和搜索記錄,也包括檔案、學(xué)術(shù)研究、教學(xué)模式、用戶評(píng)價(jià)和反饋等,數(shù)據(jù)豐富。同時(shí),數(shù)據(jù)分布廣泛,在互聯(lián)網(wǎng)時(shí)代,可從圖書(shū)館應(yīng)用系統(tǒng)、數(shù)據(jù)系統(tǒng)記錄以及各種網(wǎng)頁(yè)、移動(dòng)終端的信息獲取,顯示出用戶資源的分散性。
1.2數(shù)據(jù)資料多元化,形式靈活化
數(shù)據(jù)系統(tǒng)里的存儲(chǔ)方式不同,服務(wù)器不同,系統(tǒng)開(kāi)發(fā)平臺(tái)不同,致使許多用戶資源無(wú)法交流互換。圖書(shū)館用戶資源有半模型化、模型化和非模型化之分。傳統(tǒng)的圖書(shū)館用戶資源中,用戶只是圖書(shū)資源的使用者,與圖書(shū)館之間只是點(diǎn)對(duì)點(diǎn)單線互動(dòng),用戶之間不存在交流,而在大數(shù)據(jù)網(wǎng)絡(luò)平臺(tái)下,用戶之間能夠建立資料共享互動(dòng)平臺(tái),使得用戶資源的資料更加多元化。
2圖書(shū)館用戶資源利用
2.1有助于利用數(shù)據(jù)挖掘技術(shù)建立用戶資源圖書(shū)館
用戶資源圖書(shū)館具備信息量大的特點(diǎn),用戶可獲得各方各面的信息,且從服務(wù)的個(gè)性化和全方位化而言,圖書(shū)館可根據(jù)社會(huì)熱點(diǎn)或用戶需求定制服務(wù)。一方面,建立用戶資源圖書(shū)館,使各類用戶信息在同一界面統(tǒng)一呈現(xiàn),方便用戶的選取和檢索。另一方面,利用數(shù)據(jù)挖掘技術(shù)建立的用戶資源圖書(shū)館,服務(wù)器眾多,具有較強(qiáng)的計(jì)算潛力和存儲(chǔ)潛力,擁有較高的數(shù)據(jù)處理潛力,能同時(shí)容納多數(shù)用戶。因數(shù)據(jù)量大所導(dǎo)致的硬件費(fèi)用和后期運(yùn)行費(fèi)用劇增,可透過(guò)構(gòu)建用戶資源圖書(shū)館平臺(tái)以及應(yīng)用服務(wù)得到解決。為應(yīng)付不斷提高的用戶資源存儲(chǔ)方面的壓為,目前亟需的就是投入超多資金以擴(kuò)容存儲(chǔ)設(shè)備,無(wú)疑,建立用戶資源平臺(tái)能夠解決此問(wèn)題。
2.2加速圖書(shū)館資源的數(shù)字化
強(qiáng)大的互聯(lián)網(wǎng)呈現(xiàn)功能和用戶信息保存的可靠性功能,用戶資源存儲(chǔ)的復(fù)雜性問(wèn)題可得到很好的解決。其次,數(shù)據(jù)挖掘技術(shù)對(duì)于資源整合方面具有優(yōu)勢(shì),透過(guò)分布式的存儲(chǔ)模式整合超多信息資源帶給給用戶檢索。不同的數(shù)據(jù)之間的互相操作以及全方位的互聯(lián)網(wǎng)服務(wù)得以實(shí)現(xiàn),很好的解決了資源重復(fù)建設(shè)的問(wèn)題。因此,利用數(shù)據(jù)挖掘使得圖書(shū)館資源數(shù)字化具備可行性。從這個(gè)好處上來(lái)看,資源的館藏?cái)?shù)字化將會(huì)加快發(fā)展,而不只是圖書(shū)書(shū)目的劇增。
2.3降低人力資源成本,使圖書(shū)館各類資源得以整合和優(yōu)化
隨著各類用戶資源利用步伐的加快,加之依靠因特網(wǎng)的用戶對(duì)服務(wù)的可行性和效率性要求更高,超多不同體系的服務(wù)器布置在機(jī)房,系統(tǒng)維護(hù)人員的壓力也相應(yīng)増大。透過(guò)數(shù)據(jù)挖掘技術(shù),可有效進(jìn)行資源整合和優(yōu)化,無(wú)需透過(guò)人力進(jìn)行。
2.4有利于分析用戶心理和提升用戶體驗(yàn)
數(shù)據(jù)挖掘技術(shù)能夠利用用戶資源計(jì)算出用戶模型,這是研究用戶需求、偏好、行為的一種常規(guī)方式,一般認(rèn)為用戶模型是對(duì)用戶在某段時(shí)間內(nèi)相對(duì)穩(wěn)定的信息需求的記錄。用戶模型反過(guò)來(lái)對(duì)獲取用戶資源有十分重要的作用,建構(gòu)用戶模型,能夠使圖書(shū)館更加精深、準(zhǔn)確地掌握當(dāng)前用戶資源。透過(guò)對(duì)用戶資源的處理來(lái)預(yù)測(cè)用戶需求,進(jìn)而到達(dá)持續(xù)提高服務(wù)質(zhì)量和用戶滿意度的目的。一方面,預(yù)判用戶心理是利用圖書(shū)館用戶資源更加深入的表現(xiàn)。隨著用戶環(huán)境與圖書(shū)館環(huán)境的不斷變化,這種預(yù)判力覆蓋范圍已經(jīng)不單單是用戶信息行為的某個(gè)過(guò)程或某幾個(gè)過(guò)程,相反,用戶心理能夠?qū)τ脩粜枨蟮膹?qiáng)弱、層次、方向產(chǎn)生極為重要的影響,同時(shí)也能夠?qū)Λ@取用戶資源全部過(guò)程產(chǎn)生重要影響。另一方面,最先研究用戶體驗(yàn)研究當(dāng)屬企業(yè)營(yíng)銷活動(dòng),主要用來(lái)研究用戶與企業(yè)、產(chǎn)品或服務(wù)之間的互動(dòng)。數(shù)據(jù)挖掘技術(shù)能夠更精準(zhǔn)預(yù)測(cè)用戶的實(shí)際感受,透過(guò)研究用戶情感體驗(yàn)與用戶行為動(dòng)作,提高用戶的滿意度,滿足用戶需求。
3結(jié)語(yǔ)
在數(shù)據(jù)大爆發(fā)時(shí)代,重視圖書(shū)館用戶資源,透過(guò)多渠道、多方式匯聚用戶資源,采用數(shù)據(jù)挖掘、數(shù)據(jù)歸檔分析等技術(shù),掌握用戶資源特征,有助于圖書(shū)館精準(zhǔn)定位用戶群體,對(duì)調(diào)整圖書(shū)館運(yùn)營(yíng)策略有重要前置作用,更能創(chuàng)新圖書(shū)館服務(wù)的資料和形式,實(shí)現(xiàn)圖書(shū)館資源的有效利用。
參考文獻(xiàn)
[1]陳文偉等.數(shù)據(jù)挖掘技術(shù)[m].北京:北京工業(yè)出版社,2002.
[2]郭崇慧等.北京數(shù)據(jù)挖掘教程[m].北京:清華大學(xué)出版社,2005.
[3]徐永麗等.網(wǎng)絡(luò)環(huán)境中用戶信息需求障礙分析[j].圖書(shū)館理論與實(shí)踐,2004.
數(shù)據(jù)挖掘論文篇五
題目:大數(shù)據(jù)挖掘在智游應(yīng)用中的探究
摘要:大數(shù)據(jù)和智游都是當(dāng)下的熱點(diǎn),沒(méi)有大數(shù)據(jù)的智游無(wú)從談“智慧”,數(shù)據(jù)挖掘是大數(shù)據(jù)應(yīng)用于智游的核心,文章探究了在智游應(yīng)用中,目前大數(shù)據(jù)挖掘存在的幾個(gè)問(wèn)題。
關(guān)鍵詞:大數(shù)據(jù);智游;數(shù)據(jù)挖掘;
1引言
隨著人民生活水平的進(jìn)一步提高,旅游消費(fèi)的需求進(jìn)一步上升,在云計(jì)算、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及移動(dòng)智能終端等信息通訊技術(shù)的飛速發(fā)展下,智游應(yīng)運(yùn)而生。大數(shù)據(jù)作為當(dāng)下的熱點(diǎn)已經(jīng)成了智游發(fā)展的有力支撐,沒(méi)有大數(shù)據(jù)提供的有利信息,智游無(wú)法變得“智慧”。
2大數(shù)據(jù)與智游
旅游業(yè)是信息密、綜合性強(qiáng)、信息依存度高的產(chǎn)業(yè)[1],這讓其與大數(shù)據(jù)自然產(chǎn)生了交匯。,江蘇省鎮(zhèn)江市首先提出“智游”的概念,雖然至今國(guó)內(nèi)外對(duì)于智游還沒(méi)有一個(gè)統(tǒng)一的學(xué)術(shù)定義,但在與大數(shù)據(jù)相關(guān)的描述中,有學(xué)者從大數(shù)據(jù)挖掘在智游中的作用出發(fā),把智游描述為:通過(guò)充分收集和管理所有類型和來(lái)源的旅游數(shù)據(jù),并深入挖掘這些數(shù)據(jù)的潛在重要價(jià)值信息,然后利用這些信息為相關(guān)部門(mén)或?qū)ο筇峁┓?wù)[2]。這一定義充分肯定了在發(fā)展智游中,大數(shù)據(jù)挖掘所起的至關(guān)重要的作用,指出了在智游的過(guò)程中,數(shù)據(jù)的收集、儲(chǔ)存、管理都是為數(shù)據(jù)挖掘服務(wù),智游最終所需要的是利用挖掘所得的有用信息。
3大數(shù)據(jù)挖掘在智游中存在的問(wèn)題
,我國(guó)提出用十年時(shí)間基本實(shí)現(xiàn)智游的目標(biāo)[3],過(guò)去幾年,國(guó)家旅游局的相關(guān)動(dòng)作均為了實(shí)現(xiàn)這一目標(biāo)。但是,在借助大數(shù)據(jù)推動(dòng)智游的可持續(xù)性發(fā)展中,大數(shù)據(jù)所產(chǎn)生的價(jià)值卻亟待提高,原因之一就是在收集、儲(chǔ)存了大量數(shù)據(jù)后,對(duì)它們深入挖掘不夠,沒(méi)有發(fā)掘出數(shù)據(jù)更多的價(jià)值。
3.1信息化建設(shè)
智游的發(fā)展離不開(kāi)移動(dòng)網(wǎng)絡(luò)、物聯(lián)網(wǎng)、云平臺(tái)。隨著大數(shù)據(jù)的不斷發(fā)展,國(guó)內(nèi)許多景區(qū)已經(jīng)實(shí)現(xiàn)wi—fi覆蓋,部分景區(qū)也已實(shí)現(xiàn)人與人、人與物、人與景點(diǎn)之間的實(shí)時(shí)互動(dòng),多省市已建有旅游產(chǎn)業(yè)監(jiān)測(cè)平臺(tái)或旅游大數(shù)據(jù)中心以及數(shù)據(jù)可視化平臺(tái),從中進(jìn)行數(shù)據(jù)統(tǒng)計(jì)、行為分析、監(jiān)控預(yù)警、服務(wù)質(zhì)量監(jiān)督等。通過(guò)這些平臺(tái),已基本能掌握跟游客和景點(diǎn)相關(guān)的數(shù)據(jù),可以實(shí)現(xiàn)更好旅游監(jiān)控、產(chǎn)業(yè)宏觀監(jiān)控,對(duì)該地的旅游管理和推廣都能發(fā)揮重要作用。
但從智慧化的發(fā)展來(lái)看,我國(guó)的信息化建設(shè)還需加強(qiáng)。雖然通訊網(wǎng)絡(luò)已基本能保證,但是大部分景區(qū)還無(wú)法實(shí)現(xiàn)對(duì)景區(qū)全面、透徹、及時(shí)的感知,更為困難的是對(duì)平臺(tái)的建設(shè)。在數(shù)據(jù)共享平臺(tái)的建設(shè)上,除了必備的硬件設(shè)施,大數(shù)據(jù)實(shí)驗(yàn)平臺(tái)還涉及大量部門(mén),如政府管理部門(mén)、氣象部門(mén)、交通、電子商務(wù)、旅行社、旅游網(wǎng)站等。如此多的部門(mén)相關(guān)聯(lián),要想建立一個(gè)完整全面的大數(shù)據(jù)實(shí)驗(yàn)平臺(tái),難度可想而知。
3.2大數(shù)據(jù)挖掘方法
大數(shù)據(jù)時(shí)代缺的不是數(shù)據(jù),而是方法。大數(shù)據(jù)在旅游行業(yè)的應(yīng)用前景非常廣闊,但是面對(duì)大量的數(shù)據(jù),不懂如何收集有用的數(shù)據(jù)、不懂如何對(duì)數(shù)據(jù)進(jìn)行挖掘和利用,那么“大數(shù)據(jù)”猶如礦山之中的廢石。旅游行業(yè)所涉及的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),通過(guò)云計(jì)算技術(shù),對(duì)數(shù)據(jù)的收集、存儲(chǔ)都較為容易,但對(duì)數(shù)據(jù)的挖掘分析則還在不斷探索中。大數(shù)據(jù)的挖掘常用的方法有關(guān)聯(lián)分析,相似度分析,距離分析,聚類分析等等,這些方法從不同的角度對(duì)數(shù)據(jù)進(jìn)行挖掘。其中,相關(guān)性分析方法通過(guò)關(guān)聯(lián)多個(gè)數(shù)據(jù)來(lái)源,挖掘數(shù)據(jù)價(jià)值。但針對(duì)旅游數(shù)據(jù),采用這些方法挖掘數(shù)據(jù)的價(jià)值信息,難度也很大,因?yàn)槁糜螖?shù)據(jù)中冗余數(shù)據(jù)很多,數(shù)據(jù)存在形式很復(fù)雜。在旅游非結(jié)構(gòu)化數(shù)據(jù)中,一張圖片、一個(gè)天氣變化、一次輿情評(píng)價(jià)等都將會(huì)對(duì)游客的旅行計(jì)劃帶來(lái)影響。對(duì)這些數(shù)據(jù)完全挖掘分析,對(duì)游客“行前、行中、行后”大數(shù)據(jù)的實(shí)時(shí)性挖掘都是很大的挑戰(zhàn)。
3.3數(shù)據(jù)安全
,數(shù)據(jù)安全事件屢見(jiàn)不鮮,伴著大數(shù)據(jù)而來(lái)的數(shù)據(jù)安全問(wèn)題日益凸顯出來(lái)。在大數(shù)據(jù)時(shí)代,無(wú)處不在的數(shù)據(jù)收集技術(shù)使我們的個(gè)人信息在所關(guān)聯(lián)的數(shù)據(jù)中心留下痕跡,如何保證這些信息被合法合理使用,讓數(shù)據(jù)“可用不可見(jiàn)”[4],這是亟待解決的問(wèn)題。同時(shí),在大數(shù)據(jù)資源的開(kāi)放性和共享性下,個(gè)人隱私和公民權(quán)益受到嚴(yán)重威脅。這一矛盾的存在使數(shù)據(jù)共享程度與數(shù)據(jù)挖掘程度成反比。此外,經(jīng)過(guò)大數(shù)據(jù)技術(shù)的分析、挖掘,個(gè)人隱私更易被發(fā)現(xiàn)和暴露,從而可能引發(fā)一系列社會(huì)問(wèn)題。
大數(shù)據(jù)背景下的旅游數(shù)據(jù)當(dāng)然也避免不了數(shù)據(jù)的安全問(wèn)題。如果游客“吃、住、行、游、娛、購(gòu)”的數(shù)據(jù)被放入數(shù)據(jù)庫(kù),被完全共享、挖掘、分析,那游客的人身財(cái)產(chǎn)安全將會(huì)受到嚴(yán)重影響,最終降低旅游體驗(yàn)。所以,數(shù)據(jù)的安全管理是進(jìn)行大數(shù)據(jù)挖掘的前提。
3.4大數(shù)據(jù)人才
大數(shù)據(jù)背景下的智游離不開(kāi)人才的創(chuàng)新活動(dòng)及技術(shù)支持,然而與專業(yè)相銜接的大數(shù)據(jù)人才培養(yǎng)未能及時(shí)跟上行業(yè)需求,加之創(chuàng)新型人才的外流,以及數(shù)據(jù)統(tǒng)計(jì)未來(lái)3~5年大數(shù)據(jù)行業(yè)將面臨全球性的人才荒,國(guó)內(nèi)智游的構(gòu)建還缺乏大量人才。
4解決思路
在信息化建設(shè)上,加大政府投入,加強(qiáng)基礎(chǔ)設(shè)施建設(shè),整合結(jié)構(gòu)化數(shù)據(jù),抓取非結(jié)構(gòu)化數(shù)據(jù),打通各數(shù)據(jù)壁壘,建設(shè)旅游大數(shù)據(jù)實(shí)驗(yàn)平臺(tái);在挖掘方法上,對(duì)旅游大數(shù)據(jù)實(shí)時(shí)性數(shù)據(jù)的挖掘應(yīng)該被放在重要位置;在數(shù)據(jù)安全上,從加強(qiáng)大數(shù)據(jù)安全立法、監(jiān)管執(zhí)法及強(qiáng)化技術(shù)手段建設(shè)等幾個(gè)方面著手,提升大數(shù)據(jù)環(huán)境下數(shù)據(jù)安全保護(hù)水平。加強(qiáng)人才的培養(yǎng)與引進(jìn),加強(qiáng)產(chǎn)學(xué)研合作,培養(yǎng)智游大數(shù)據(jù)人才。
參考文獻(xiàn)
數(shù)據(jù)挖掘論文篇六
:數(shù)據(jù)挖掘是一種特殊的數(shù)據(jù)分析過(guò)程,其不僅在功能上具有多樣性,同時(shí)還具有著自動(dòng)化、智能化處理以及抽象化分析判斷的特點(diǎn),對(duì)于計(jì)算機(jī)犯罪案件中的信息取證有著非常大的幫助。本文結(jié)合數(shù)據(jù)挖掘技術(shù)的概念與功能,對(duì)其在計(jì)算機(jī)犯罪取證中的應(yīng)用進(jìn)行了分析。
:數(shù)據(jù)挖掘技術(shù);計(jì)算機(jī);犯罪取證
隨著信息技術(shù)與互聯(lián)網(wǎng)的不斷普及,計(jì)算機(jī)犯罪案件變得越來(lái)越多,同時(shí)由于計(jì)算機(jī)犯罪的隱蔽性、復(fù)雜性特點(diǎn),案件偵破工作也具有著相當(dāng)?shù)碾y度,而數(shù)據(jù)挖掘技術(shù)不僅能夠?qū)τ?jì)算機(jī)犯罪案件中的原始數(shù)據(jù)進(jìn)行分析并提取出有效信息,同時(shí)還能夠?qū)崿F(xiàn)與其他案件的對(duì)比,而這些對(duì)于計(jì)算機(jī)犯罪案件的偵破都是十分有利的。
1.1數(shù)據(jù)挖掘技術(shù)的概念
數(shù)據(jù)挖掘技術(shù)是針對(duì)當(dāng)前信息時(shí)代下海量的網(wǎng)絡(luò)數(shù)據(jù)信息而言的,簡(jiǎn)單來(lái)說(shuō),就是從大量的、不完全的、有噪聲的、模糊的隨機(jī)數(shù)據(jù)中對(duì)潛在的有效知識(shí)進(jìn)行自動(dòng)提取,從而為判斷決策提供有利的信息支持。同時(shí),從數(shù)據(jù)挖掘所能夠的得到的知識(shí)來(lái)看,主要可以分為廣義型知識(shí)、分類型知識(shí)、關(guān)聯(lián)性知識(shí)、預(yù)測(cè)性知識(shí)以及離型知識(shí)幾種。
1.2數(shù)據(jù)挖掘技術(shù)的功能
根據(jù)數(shù)據(jù)挖掘技術(shù)所能夠提取的不同類型知識(shí),數(shù)據(jù)挖掘技術(shù)也可以在此基礎(chǔ)上進(jìn)行功能分類,如關(guān)聯(lián)分析、聚類分析、孤立點(diǎn)分析、時(shí)間序列分析以及分類預(yù)測(cè)等都是數(shù)據(jù)挖掘技術(shù)的重要功能之一,而其中又以關(guān)聯(lián)分析與分類預(yù)測(cè)最為主要。大量的數(shù)據(jù)中存在著多個(gè)項(xiàng)集,各個(gè)項(xiàng)集之間的取值往往存在著一定的規(guī)律性,而關(guān)聯(lián)分析則正是利用這一點(diǎn),對(duì)各項(xiàng)集之間的關(guān)聯(lián)關(guān)系進(jìn)行挖掘,找到數(shù)據(jù)間隱藏的關(guān)聯(lián)網(wǎng),主要算法有fp-growth算法、apriori算法等。在計(jì)算機(jī)犯罪取證中,可以先對(duì)犯罪案件中的特征與行為進(jìn)行深度的挖掘,從而明確其中所存在的聯(lián)系,同時(shí),在獲得審計(jì)數(shù)據(jù)后,就可以對(duì)其中的審計(jì)信息進(jìn)行整理并中存入到數(shù)據(jù)庫(kù)中進(jìn)行再次分析,從而達(dá)到案件樹(shù)立的效果,這樣,就能夠清晰的判斷出案件中的行為是否具有犯罪特征[1]。而分類分析則是對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行分類整理,以明確所獲得數(shù)據(jù)中的相關(guān)性的一種數(shù)據(jù)挖掘功能。在分類分析的過(guò)程中,已知數(shù)據(jù)會(huì)被分為不同的數(shù)據(jù)組,并按照具體的數(shù)據(jù)屬性進(jìn)行明確分類,之后再通過(guò)對(duì)分組中數(shù)據(jù)屬性的具體分析,最終就可以得到數(shù)據(jù)屬性模型。在計(jì)算機(jī)犯罪案件中,可以將按照這種數(shù)據(jù)分類、分析的方法得到案件的數(shù)據(jù)屬性模型,之后將這一數(shù)據(jù)屬性模型與其他案件的數(shù)據(jù)屬性模型進(jìn)行對(duì)比,這樣就能夠判斷嫌疑人是否在作案動(dòng)機(jī)、發(fā)生規(guī)律以及具體特征等方面與其他案件模型相符,也就是說(shuō),一旦這一案件的數(shù)據(jù)模型屬性與其他案件的數(shù)據(jù)模型屬性大多相符,那么這些數(shù)據(jù)就可以被確定為犯罪證據(jù)。此外,在不同案件間的共性與差異的基礎(chǔ)上,分類分析還可以實(shí)現(xiàn)對(duì)于未知數(shù)據(jù)信息或類似數(shù)據(jù)信息的有效預(yù)測(cè),這對(duì)于計(jì)算機(jī)犯罪案件的處理也是很有幫助的。此外,數(shù)據(jù)挖掘分類預(yù)測(cè)功能的實(shí)現(xiàn)主要依賴決策樹(shù)、支持向量機(jī)、vsm、logisitic回歸、樸素貝葉斯等幾種,這些算法各有優(yōu)劣,在實(shí)際應(yīng)用中需要根據(jù)案件的實(shí)際情況進(jìn)行選擇,例如支持向量機(jī)具有很高的分類正確率,因此適合用于特征為線性不可分的案件,而決策樹(shù)更容易理解與解釋。
對(duì)于數(shù)據(jù)挖掘技術(shù),目前的計(jì)算機(jī)犯罪取證工作并未形成一個(gè)明確而統(tǒng)一的應(yīng)用步驟,因此,我們可以根據(jù)數(shù)據(jù)挖掘技術(shù)的特征與具體功能,對(duì)數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)犯罪取證中的應(yīng)用提供一個(gè)較為可行的具體思路[2]。首先,當(dāng)案件發(fā)生后,一般能夠獲取到海量的原始數(shù)據(jù),面對(duì)這些數(shù)據(jù),可以利用fp-growth算法、apriori算法等算法進(jìn)行關(guān)聯(lián)分析,找到案件相關(guān)的潛在有用信息,如犯罪嫌疑人的犯罪動(dòng)機(jī)、案發(fā)時(shí)間、作案嫌疑人的基本信息等等。在獲取這些基本信息后,雖然能夠?qū)Π讣幕咎卣饔幸欢ǖ牧私猓缸锵右扇藚s難以通過(guò)這些簡(jiǎn)單的信息進(jìn)行確定,因此還需利用決策樹(shù)、支持向量機(jī)等算法進(jìn)行分類預(yù)測(cè)分析,通過(guò)對(duì)原始信息的準(zhǔn)確分類,可以得到案件的犯罪行為模式(數(shù)據(jù)屬性模型),而通過(guò)與其他案件犯罪行為模式的對(duì)比,就能夠?qū)Ψ缸锵右扇说木唧w特征進(jìn)行進(jìn)一步的預(yù)測(cè),如經(jīng)常活動(dòng)的場(chǎng)所、行為習(xí)慣、分布區(qū)域等,從而縮小犯罪嫌疑人的鎖定范圍,為案件偵破工作帶來(lái)巨大幫助。此外,在計(jì)算機(jī)犯罪案件處理完畢后,所建立的嫌疑人犯罪行為模式以及通過(guò)關(guān)聯(lián)分析、分類預(yù)測(cè)分析得到的案件信息仍具有著很高的利用價(jià)值,因此不僅需要將這些信息存入到專門(mén)的數(shù)據(jù)庫(kù)中,同時(shí)還要根據(jù)案件的結(jié)果對(duì)數(shù)據(jù)進(jìn)行再次分析與修正,并做好犯罪行為模式的分類與標(biāo)記工作,為之后的案件偵破工作提供更加豐富、詳細(xì)的數(shù)據(jù)參考。
總而言之,數(shù)據(jù)挖掘技術(shù)自計(jì)算機(jī)犯罪取證中的應(yīng)用是借助以各種算法為基礎(chǔ)的關(guān)聯(lián)、分類預(yù)測(cè)功能來(lái)實(shí)現(xiàn)的,而隨著技術(shù)的不斷提升以及數(shù)據(jù)庫(kù)中的犯罪行為模式會(huì)不斷得到完善,在未來(lái)數(shù)據(jù)挖掘技術(shù)所能夠起到的作用也必將越來(lái)越大。
作者:周永杰 單位:河南警察學(xué)院信息安全系
數(shù)據(jù)挖掘論文篇七
數(shù)據(jù)挖掘技術(shù)在各行業(yè)都有廣泛運(yùn)用,是一種新興信息技術(shù)。而在線考試系統(tǒng)中存在著很多的數(shù)據(jù)信息,數(shù)據(jù)挖掘技在在線考試系統(tǒng)有著重要的意義,和良好的應(yīng)用前景,從而在眾多技術(shù)中脫穎而出。本文從對(duì)數(shù)據(jù)挖掘技術(shù)的初步了解,簡(jiǎn)述數(shù)據(jù)挖掘技術(shù)在在線考試系統(tǒng)中成績(jī)分析,以及配合成績(jī)分析,完善教學(xué)。
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的快速發(fā)展,計(jì)算機(jī)輔助教育的不斷普及,在線考試是一種利用網(wǎng)絡(luò)技術(shù)的重要輔助教育手段,其改革有著重要的意義。數(shù)據(jù)挖掘技術(shù)作為一種新興的信息技術(shù),其包括了人工智能、數(shù)據(jù)庫(kù)、統(tǒng)計(jì)學(xué)等學(xué)科的內(nèi)容,是一門(mén)綜合性的技術(shù)。這種技術(shù)的主要特點(diǎn)是對(duì)數(shù)據(jù)庫(kù)中大量的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換和分析,從中提取出能夠?qū)處熡凶饔玫年P(guān)鍵性數(shù)據(jù)。將其運(yùn)用于在線考試系統(tǒng)中,能夠很好的處理在線考試中涉及到的數(shù)據(jù),讓在線考試的實(shí)用性和高效性得到進(jìn)一步的增強(qiáng),幫助教師更加快速、完整的統(tǒng)計(jì)考試信息,完善教學(xué)。
數(shù)據(jù)挖掘技術(shù)是從大量數(shù)據(jù)中"挖掘"出對(duì)使用者有用的知識(shí),即從大量的、隨機(jī)的、有噪聲的、模糊的、不完全的實(shí)際應(yīng)用數(shù)據(jù)中,"挖掘"出隱含在其中但人們事先卻不知道的,而又是對(duì)人們潛在有用的信息與知識(shí)的整個(gè)過(guò)程。
目前主要的商業(yè)數(shù)據(jù)挖掘系統(tǒng)有sas公司的enterpriseminer,spss公司的clementine,sybas公司的warehousestudio,minersgi公司的mineset,rulequestresearch公司的see5,ibm公司的intelligent,還有coverstory,knowledgediscovery,quest,explora,dbminer,workbench等。
2.1數(shù)據(jù)分類
數(shù)據(jù)挖掘技術(shù)通過(guò)對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分析,把數(shù)據(jù)按照相似性歸納成若干類別,然后做出分類,并能夠?yàn)槊恳粋€(gè)類別都做出一個(gè)準(zhǔn)確的描述,挖掘出分類的規(guī)則或建立一個(gè)分類模型。
2.2數(shù)據(jù)關(guān)聯(lián)分析
數(shù)據(jù)庫(kù)中的數(shù)據(jù)關(guān)聯(lián)是一項(xiàng)非常重要,并可以發(fā)現(xiàn)的知識(shí)。數(shù)據(jù)關(guān)聯(lián)就是兩組或兩組以上的數(shù)據(jù)之間有著某種規(guī)律性的聯(lián)系。數(shù)據(jù)關(guān)聯(lián)分析的作用就是找出數(shù)據(jù)庫(kù)中隱藏的聯(lián)系,從中得到一些對(duì)學(xué)校教學(xué)工作管理者有用的信息。就像是在購(gòu)物中,就可以通過(guò)顧客的購(gòu)買(mǎi)物品的聯(lián)系,從中得到顧客的購(gòu)買(mǎi)習(xí)慣。
2.3預(yù)測(cè)
預(yù)測(cè)是根據(jù)已經(jīng)得到的數(shù)據(jù),從而對(duì)未來(lái)的情況做出一個(gè)可能性的分析。數(shù)據(jù)挖掘技術(shù)能自動(dòng)在大型的數(shù)據(jù)庫(kù)中做出一個(gè)較為準(zhǔn)確的分析。就像是在市場(chǎng)投資中,可以通過(guò)各種商品促銷的數(shù)據(jù)來(lái)做出一個(gè)未來(lái)商品的促銷走勢(shì)。從而在投資中得到最大的回報(bào)。
數(shù)據(jù)挖掘技術(shù)融合了多個(gè)學(xué)科、多個(gè)領(lǐng)域的知識(shí)與技術(shù),因此數(shù)據(jù)挖掘的方法也呈現(xiàn)出很多種類的形式。就目前的統(tǒng)計(jì)分析類的數(shù)據(jù)挖掘技術(shù)的角度來(lái)講,光統(tǒng)計(jì)分析技術(shù)中所用到的數(shù)據(jù)挖掘模型就回歸分析、邏輯回歸分析、有線性分析、非線性分析、單變量分析、多變量分析、最近鄰算法、最近序列分析、聚類分析和時(shí)間序列分析等多種方法。數(shù)據(jù)挖掘技術(shù)利用這些方法對(duì)那些異常形式的數(shù)據(jù)進(jìn)行檢查,然后通過(guò)各種數(shù)據(jù)模型和統(tǒng)計(jì)模型對(duì)這些數(shù)據(jù)來(lái)進(jìn)行解釋,并從這些數(shù)據(jù)中找出隱藏在其中的商業(yè)機(jī)會(huì)和市場(chǎng)規(guī)律。另外還有知識(shí)發(fā)現(xiàn)類數(shù)據(jù)挖掘技術(shù),這種和統(tǒng)計(jì)分析類的數(shù)據(jù)挖掘技術(shù)完全不同,其中包括了支持向量機(jī)、人工神經(jīng)元網(wǎng)絡(luò)、遺傳算法、決策樹(shù)、粗糙集、關(guān)聯(lián)順序和規(guī)則發(fā)現(xiàn)等多種方法。
4.1運(yùn)用關(guān)聯(lián)規(guī)則分析教師的年齡對(duì)學(xué)生考試成績(jī)的影響
數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)分析在教學(xué)分析中,是一種使用頻繁,行之有效的方法,它能挖掘出大量數(shù)據(jù)中項(xiàng)集之間之間有意義的關(guān)聯(lián)聯(lián)系,幫助知道教師的教學(xué)過(guò)程。例如在如今的一些高職院校中,就往往會(huì)把學(xué)生的英語(yǔ)四六級(jí)過(guò)級(jí)率,計(jì)算機(jī)等級(jí)等,以這些為依據(jù)來(lái)評(píng)價(jià)教師的教學(xué)效果。將數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則運(yùn)用于考試的成績(jī)分析當(dāng)中,就能夠挖掘出一些對(duì)學(xué)生過(guò)級(jí)率產(chǎn)生影響的因素,對(duì)教師的教學(xué)過(guò)程進(jìn)行重要的指導(dǎo),讓教師的教學(xué)效率更高,作用更強(qiáng)。
還可以通過(guò)關(guān)聯(lián)規(guī)則算法,先設(shè)定一個(gè)最小可信度和支持度,得到初步的關(guān)聯(lián)規(guī)則,根據(jù)相關(guān)規(guī)則,分析出教師的組成結(jié)構(gòu)和過(guò)級(jí)率的影響,從來(lái)進(jìn)行教師隊(duì)伍的結(jié)構(gòu)調(diào)整,讓教師隊(duì)伍更加合理。
4.2采用分類算法探討對(duì)考試成績(jī)有影響的因素
數(shù)據(jù)挖掘技術(shù)中的分類算法就是對(duì)一組對(duì)象或一個(gè)事件進(jìn)行歸類,然后通過(guò)這些數(shù)據(jù),可以進(jìn)行分類模型的建立和未來(lái)的預(yù)測(cè)。分類算法可以進(jìn)行考試中得到的數(shù)據(jù)進(jìn)行分類,然后通過(guò)學(xué)生的一些基本情況進(jìn)行探討一些對(duì)考試成績(jī)有影響的因素。分類算法可以用一下步驟實(shí)施:
4.2.1數(shù)據(jù)采集
這種方法首先要進(jìn)行數(shù)據(jù)采集,需要這幾方面的數(shù)據(jù),學(xué)生基本信息(姓名、性別、學(xué)號(hào)、籍貫、所屬院系、專業(yè)、班級(jí)等)、學(xué)生調(diào)查信息(比如學(xué)習(xí)前的知識(shí)掌握情況、學(xué)習(xí)興趣、課堂學(xué)習(xí)效果、課后復(fù)習(xí)時(shí)間量等)、成績(jī)(學(xué)生平常學(xué)習(xí)成績(jī),平??荚嚦煽?jī),各種大型考試成績(jī)等)、學(xué)生多次考試中出現(xiàn)的易錯(cuò)點(diǎn)(本次考試中出現(xiàn)的易錯(cuò)點(diǎn),以往考試中出現(xiàn)的易錯(cuò)點(diǎn))
4.2.2數(shù)據(jù)預(yù)處理
(1)數(shù)據(jù)集成。把數(shù)據(jù)采集過(guò)程中得到的多種信息,利用數(shù)據(jù)挖掘技術(shù)中的數(shù)據(jù)庫(kù)技術(shù)生產(chǎn)相應(yīng)的學(xué)生考試成績(jī)分析基本數(shù)據(jù)庫(kù)。(2)數(shù)據(jù)清理。在學(xué)生成績(jī)分析數(shù)據(jù)庫(kù)中,肯定會(huì)出現(xiàn)一些情況缺失,對(duì)于這些空缺處,就需要使用數(shù)據(jù)清理技術(shù)來(lái)進(jìn)行這些數(shù)據(jù)庫(kù)中數(shù)據(jù)的填補(bǔ)遺漏。例如,可以采用忽略元組的方法來(lái)刪除那些沒(méi)有參加考試的學(xué)生考試數(shù)據(jù)已經(jīng)在學(xué)生填寫(xiě)的調(diào)查數(shù)據(jù)中村中的空缺項(xiàng)。(3)數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換主要功能是進(jìn)行進(jìn)行數(shù)據(jù)的離散化操作。在這個(gè)過(guò)程中可以根據(jù)實(shí)際需要進(jìn)行分類,比如把考試成績(jī)從0~59的分到較差的一類,將60到80分為中等類,81到100分為優(yōu)秀等。(4)數(shù)據(jù)消減。數(shù)據(jù)消減的功能就是把所需挖掘的數(shù)據(jù)庫(kù),在消減的過(guò)程又不能影響到最終的數(shù)據(jù)挖掘結(jié)果。比如在分析學(xué)生的基本學(xué)習(xí)情況的影響因素情況中,學(xué)生信息表中中出現(xiàn)的字段很多,可以選擇性的刪除班別、籍貫等引述,形成一份新的學(xué)生基本成績(jī)分析數(shù)據(jù)表。
4.2.3利用數(shù)據(jù)挖掘技術(shù),得出結(jié)論
通過(guò)數(shù)據(jù)挖掘技術(shù)在在線考試中的應(yīng)用,得出這些學(xué)生數(shù)據(jù)的相關(guān)分析,比如說(shuō)學(xué)生考試中的易錯(cuò)點(diǎn)在什么地方,學(xué)生考試成績(jī)的自身原因,學(xué)生考試成績(jī)的環(huán)境原因,教師隊(duì)伍的搭配情況等等,從中得出如何調(diào)整學(xué)校教學(xué)資源,教師的教學(xué)方案調(diào)整等等,從而完善學(xué)校對(duì)學(xué)生的教學(xué)。
數(shù)據(jù)挖掘技術(shù)在社會(huì)各行各業(yè)中都有一定程度的使用,基于其在數(shù)據(jù)組織、分析能力、知識(shí)發(fā)現(xiàn)和信息深層次挖掘的能力,在使用中取得了顯著的成效,但數(shù)據(jù)挖掘技術(shù)中還存在著一些問(wèn)題,例如數(shù)據(jù)的挖掘算法、預(yù)處理、可視化問(wèn)題、模式識(shí)別和解釋等等。對(duì)于這些問(wèn)題,學(xué)校教學(xué)管理工作者要清醒的認(rèn)識(shí),在在線考試系統(tǒng)中對(duì)數(shù)據(jù)挖掘信息做出合理的使用,讓數(shù)字挖掘技術(shù)在在線考試系統(tǒng)中能夠更加有效的發(fā)揮其長(zhǎng)處,避免其在在線考試系統(tǒng)中的的缺陷。
[1]胡玉榮?;诖植诩碚摰臄?shù)據(jù)挖掘技術(shù)在高校學(xué)生成績(jī)分析中的作用[j]。荊門(mén)職業(yè)技術(shù)學(xué)院學(xué)報(bào),20xx,12(22):12.
[2][加]韓家煒,堪博(kamberm.)。數(shù)據(jù)挖掘:概念與技術(shù)(第2版)[m]范明,譯。北京:機(jī)械工業(yè)出版社,20xx.
[3]王潔?!对诰€考試系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)》[j]。山西師范大學(xué)學(xué)報(bào),20xx(2)。
[4]王長(zhǎng)娥。數(shù)據(jù)挖掘技術(shù)在教育中的應(yīng)用[j]。計(jì)算機(jī)與信息技術(shù),20xx(11)
數(shù)據(jù)挖掘論文篇八
摘要:主要通過(guò)對(duì)數(shù)據(jù)挖掘技術(shù)的探討,對(duì)職教多年累積的教學(xué)數(shù)據(jù)運(yùn)用分類、決策樹(shù)、關(guān)聯(lián)規(guī)則等技術(shù)進(jìn)行分析,從分析的結(jié)果中發(fā)現(xiàn)有價(jià)值的數(shù)據(jù)模式,科學(xué)合理地實(shí)現(xiàn)教學(xué)評(píng)估,讓教學(xué)管理者能夠從中發(fā)現(xiàn)教學(xué)活動(dòng)中存在的主要問(wèn)題以便及時(shí)改進(jìn),進(jìn)而輔助管理者決策做好教學(xué)管理。
關(guān)鍵詞:教學(xué)評(píng)估;數(shù)據(jù)挖掘;教學(xué)評(píng)估體系;層次分析法
1概述
近年來(lái)國(guó)家對(duì)中等職業(yè)教育的發(fā)展高度重視,在政策扶持與職教工作者的努力下,職業(yè)教育獲得了蓬勃的發(fā)展。如何提高教學(xué)質(zhì)量、培養(yǎng)合格的高技術(shù)人才成為職教工作者研究的課題。各種調(diào)查研究結(jié)果表明:加強(qiáng)師資隊(duì)伍的建設(shè),強(qiáng)化教師教學(xué)評(píng)估對(duì)教學(xué)質(zhì)量的提高尤為重要。
所謂教學(xué)評(píng)估,就是運(yùn)用系統(tǒng)科學(xué)的方法對(duì)教學(xué)活動(dòng)或教育行為的價(jià)值、效果作出科學(xué)的判斷過(guò)程。教學(xué)評(píng)估方式要靈活多樣,要多途徑、多方位、多形式的發(fā)揮評(píng)估的導(dǎo)學(xué)作用,以鼓勵(lì)評(píng)估為主,充分發(fā)揮評(píng)估的激勵(lì)功能,促進(jìn)教學(xué)的健康發(fā)展。
在中等職業(yè)學(xué)校多年的教育教學(xué)工作中積累了大量的教務(wù)管理數(shù)據(jù)、教師檔案數(shù)據(jù)等,怎樣從龐雜大量的數(shù)據(jù)中挖掘出有效提高教學(xué)質(zhì)量的關(guān)鍵因素是個(gè)難題。數(shù)據(jù)挖掘技術(shù)卻可以從人工智能的角度很好地解決這一課題。通過(guò)數(shù)據(jù)挖掘技術(shù),得到隱藏在教學(xué)數(shù)據(jù)背后的有用信息,在一定程度上為教學(xué)部門(mén)提供決策支持信息促使更好地開(kāi)展教學(xué)工作,提高教學(xué)質(zhì)量和教學(xué)管理水平,使之能在功能上更加清晰地認(rèn)識(shí)教師教與學(xué)生學(xué)的關(guān)系及促進(jìn)教育教學(xué)改革。
2數(shù)據(jù)挖掘技術(shù)
2.1數(shù)據(jù)挖掘的含義
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘應(yīng)該更正確地命名為“從數(shù)據(jù)中挖掘知識(shí)”。即數(shù)據(jù)挖掘是對(duì)巨大的數(shù)據(jù)集進(jìn)行尋找和分析的計(jì)算機(jī)輔助處理過(guò)程,在這一過(guò)程中顯現(xiàn)先前未曾發(fā)現(xiàn)的模式,然后從這些數(shù)據(jù)中發(fā)掘某些內(nèi)涵信息,包括描述過(guò)去和預(yù)測(cè)未來(lái)趨勢(shì)的信息。人工智能領(lǐng)域習(xí)慣稱知識(shí)發(fā)現(xiàn),而數(shù)據(jù)庫(kù)領(lǐng)域習(xí)慣將其稱為數(shù)據(jù)挖掘。
2.2數(shù)據(jù)挖掘的基本過(guò)程
數(shù)據(jù)挖掘過(guò)程包括對(duì)問(wèn)題的理解和提出、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評(píng)估、知識(shí)表示等過(guò)程,以上的過(guò)程不是一次完成的,其中某些步驟或者全過(guò)程可能要反復(fù)進(jìn)行。對(duì)問(wèn)題的理解和提出在開(kāi)始數(shù)據(jù)挖掘之前,最基礎(chǔ)的工作就是理解數(shù)據(jù)和實(shí)際的業(yè)務(wù)問(wèn)題,在這個(gè)基礎(chǔ)之上提出問(wèn)題,對(duì)目標(biāo)作出明確的定義。
2.3數(shù)據(jù)挖掘常用的算法
2.3.1分類分析方法:是通過(guò)分析訓(xùn)練集中的數(shù)據(jù),為每個(gè)類別做出準(zhǔn)確的描述或建立分析模型或挖掘出分類規(guī)則,以便以后利用這個(gè)分類規(guī)則對(duì)其它數(shù)據(jù)庫(kù)中的記錄進(jìn)行分類的方法。2.3.2決策樹(shù)算法:是一種常用于分類、預(yù)測(cè)模型的算法,它通過(guò)將大量數(shù)據(jù)有目的的分類,從而找到一些有價(jià)值的、潛在的信息。它的主要優(yōu)點(diǎn)是描述簡(jiǎn)單,分類速度快,特別適合大規(guī)模的數(shù)據(jù)處理。2.3.3聚類算法:聚類分析處理的數(shù)據(jù)對(duì)象的類是未知的。聚類分析就是將對(duì)象集合分組為由類似的對(duì)象組成的多個(gè)簇的過(guò)程。在同一個(gè)簇內(nèi)的對(duì)象之間具有較高的相似度,而不同簇內(nèi)的對(duì)象差別較大。2.3.4關(guān)聯(lián)規(guī)則算法:側(cè)重于確定數(shù)據(jù)中不同領(lǐng)域之間的關(guān)系,即尋找給定數(shù)據(jù)集中的有趣聯(lián)系。提取描述數(shù)據(jù)庫(kù)中數(shù)據(jù)項(xiàng)之間所存在的潛在關(guān)系的規(guī)則,找出滿足給定支持度和置信度閾值的多個(gè)域之間的依賴關(guān)系。
在以上各種算法的研究中,比較有影響的是關(guān)聯(lián)規(guī)則算法。
3教學(xué)評(píng)估體系
評(píng)價(jià)指標(biāo)體系是教學(xué)評(píng)估的基礎(chǔ)和依據(jù),對(duì)評(píng)估起著導(dǎo)向作用,因此制定一個(gè)科學(xué)全面的評(píng)價(jià)指標(biāo)體系就成為改革、完善評(píng)價(jià)的首要目標(biāo)。評(píng)價(jià)指標(biāo)應(yīng)以指導(dǎo)教學(xué)實(shí)踐為目的,通過(guò)評(píng)價(jià)使教師明確教學(xué)過(guò)程中應(yīng)該肯定的和需要改進(jìn)的地方;以及給出設(shè)計(jì)評(píng)價(jià)指標(biāo)的導(dǎo)向問(wèn)題。
3.1教學(xué)評(píng)估體系的構(gòu)建方法
層次分析法(簡(jiǎn)稱ahp法)是美國(guó)運(yùn)籌學(xué)家t·l·saaty教授在20世紀(jì)70年代初期提出的一種簡(jiǎn)便、靈活而又實(shí)用的多準(zhǔn)則決策的系統(tǒng)分析方法,其原理是把一個(gè)復(fù)雜問(wèn)題分解、轉(zhuǎn)化為定量分析的方法。它需要建立關(guān)于系統(tǒng)屬性的各因素多級(jí)遞階結(jié)構(gòu),然后對(duì)每一層次上的因素逐一進(jìn)行比較,得到判斷矩陣,通過(guò)計(jì)算判斷矩陣的特征值和特征向量,得到其關(guān)于上一層因素的相對(duì)權(quán)重,并可自上而下地用上一層次因素的相對(duì)權(quán)重加權(quán)求和,求出各層次因素關(guān)于系統(tǒng)整體屬性(總目標(biāo)層)的綜合重要度。
3.2構(gòu)建教學(xué)評(píng)估指標(biāo)體系的作用
3.2.1構(gòu)建的教學(xué)評(píng)估指標(biāo),作為挖掘庫(kù)選擇教學(xué)信息屬性的依據(jù)。
3.2.2通過(guò)ahp方法,能篩選出用來(lái)評(píng)價(jià)教學(xué)質(zhì)量的相關(guān)重要屬性,從而入選為挖掘庫(kù)字段,這樣就減去了挖掘庫(kù)中對(duì)于挖掘目標(biāo)來(lái)說(shuō)影響較小的屬性,進(jìn)而大大減少了挖掘的工作量,提高挖掘效率。3.2.3通過(guò)構(gòu)建教學(xué)評(píng)估指標(biāo),減少了挖掘?qū)ο蟮淖侄危瑥亩苊庖蛲诰蜃侄芜^(guò)多,導(dǎo)致建立的決策樹(shù)過(guò)大,出現(xiàn)過(guò)度擬合挖掘?qū)ο?,進(jìn)而造成挖掘規(guī)則不具有很好的評(píng)價(jià)效果的現(xiàn)象。3.2.4提高教學(xué)質(zhì)量評(píng)估實(shí)施工作的效率。
4數(shù)據(jù)挖掘在教學(xué)評(píng)估中的應(yīng)用
4.1學(xué)習(xí)效果評(píng)價(jià)學(xué)習(xí)評(píng)價(jià)是教育工作者的重要職責(zé)之一。評(píng)價(jià)學(xué)生的學(xué)習(xí)情況,既對(duì)學(xué)生起到信息反饋和激發(fā)學(xué)習(xí)動(dòng)機(jī)的作用,又是檢查課程計(jì)劃、教學(xué)程序以至教學(xué)目的的手段,也是考查學(xué)生個(gè)別差異、便于因材施教的途徑。評(píng)價(jià)要遵循“評(píng)價(jià)內(nèi)容要全面、評(píng)價(jià)方式要多元化、評(píng)價(jià)次數(shù)要多次化,注重自評(píng)與互評(píng)的有機(jī)結(jié)合”的原則。利用數(shù)據(jù)挖掘工具,對(duì)教師業(yè)務(wù)檔案數(shù)據(jù)庫(kù)、行為記錄數(shù)據(jù)庫(kù)、獎(jiǎng)勵(lì)處罰數(shù)據(jù)庫(kù)等進(jìn)行分析處理,可以即時(shí)得到教師教學(xué)的評(píng)價(jià)結(jié)果,對(duì)教學(xué)過(guò)程出現(xiàn)的問(wèn)題進(jìn)行及時(shí)指正。
另外,這種系統(tǒng)還能夠克服教師主觀評(píng)價(jià)的不公正、不客觀的弱點(diǎn),減輕教師的工作量。
4.2課堂教學(xué)評(píng)價(jià)
課堂教學(xué)評(píng)價(jià)不僅對(duì)教學(xué)起著調(diào)節(jié)、控制、指導(dǎo)和推動(dòng)作用,而且有很強(qiáng)的導(dǎo)向性,是學(xué)校教學(xué)管理的重要組成部分,是評(píng)價(jià)教學(xué)工作成績(jī)的主要手段。實(shí)現(xiàn)對(duì)任課教師及教學(xué)組織工作效果做出評(píng)價(jià),但是更重要的目的是總結(jié)優(yōu)秀的教學(xué)經(jīng)驗(yàn),為教學(xué)質(zhì)量的穩(wěn)定提高制定科學(xué)的規(guī)范。學(xué)校每學(xué)期都要搞課堂教學(xué)評(píng)價(jià)調(diào)查,積累了大量的數(shù)據(jù)。利用數(shù)據(jù)挖掘技術(shù),從教學(xué)評(píng)價(jià)數(shù)據(jù)中進(jìn)行數(shù)據(jù)挖掘,將關(guān)聯(lián)規(guī)則應(yīng)用于教師教學(xué)評(píng)估系統(tǒng)中,探討教學(xué)效果的好壞與老師的年齡、職稱、學(xué)歷之間的聯(lián)系;確定教師的教學(xué)內(nèi)容的范圍和深度是否合適,選擇的教學(xué)媒體是否適合所選的教學(xué)內(nèi)容和教學(xué)對(duì)象;講解的時(shí)間是否恰到好處;教學(xué)策略是否得當(dāng)?shù)取亩梢约皶r(shí)地將挖掘出的規(guī)則信息反饋給教師。管理部門(mén)據(jù)此能合理配置班級(jí)的上課教師,使學(xué)生能夠較好地保持良好的學(xué)習(xí)態(tài)度,從而為教學(xué)部門(mén)提供了決策支持信息,促使教學(xué)工作更好地開(kāi)展。
結(jié)束語(yǔ)
數(shù)據(jù)挖掘作為一種工具,其技術(shù)日趨成熟,在許多領(lǐng)域取得了廣泛的應(yīng)用。在教育領(lǐng)域里,隨著數(shù)據(jù)的不斷累積,把數(shù)據(jù)挖掘技術(shù)應(yīng)用到教學(xué)評(píng)價(jià)系統(tǒng)中,讓領(lǐng)導(dǎo)者能夠從中發(fā)現(xiàn)教師教學(xué)活動(dòng)中的主要問(wèn)題,以便及時(shí)改進(jìn),進(jìn)而輔助領(lǐng)導(dǎo)決策做好學(xué)校管理,提高學(xué)校管理能力和水平,同時(shí)通過(guò)建立有效的教學(xué)激勵(lì)機(jī)制來(lái)達(dá)到提高教學(xué)質(zhì)量的目的。這一研究對(duì)發(fā)展中的職業(yè)教育教學(xué)管理提出了很好的建議,為教學(xué)管理工作的計(jì)算機(jī)輔助決策增添了新的內(nèi)容。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于中職教學(xué)評(píng)估,設(shè)計(jì)開(kāi)發(fā)一套行之有效的課堂教學(xué)評(píng)價(jià)系統(tǒng),是下一步要做的工作,必將有力推動(dòng)職業(yè)教育的快速發(fā)展。
數(shù)據(jù)挖掘論文篇九
前言
近些年來(lái),已經(jīng)有越來(lái)越多的企業(yè)把通信、網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)應(yīng)用引入企業(yè)的日常管理工作和業(yè)務(wù)開(kāi)發(fā)處理當(dāng)中,企業(yè)的各類信息化程度也在不斷提高?,F(xiàn)代科技信息技術(shù)的廣泛應(yīng)用已經(jīng)顯著的提高了企業(yè)的工作效率和經(jīng)濟(jì)效益。但是,在使用信息技術(shù)給企業(yè)帶來(lái)的方便、快捷的同時(shí),也不斷的出現(xiàn)了新的問(wèn)題和需求。企業(yè)經(jīng)過(guò)多年積累了大量的歷史數(shù)據(jù),這些數(shù)據(jù)對(duì)企業(yè)當(dāng)前的日常經(jīng)營(yíng)活動(dòng)幾乎沒(méi)有任何的使用價(jià)值,成了留之無(wú)用棄之可惜的累贅。而且儲(chǔ)藏這些歷史數(shù)據(jù)會(huì)對(duì)企業(yè)造成很大的困難和費(fèi)用開(kāi)銷。為此數(shù)據(jù)挖掘技術(shù)應(yīng)用在網(wǎng)絡(luò)營(yíng)銷中勢(shì)在必行,全面細(xì)致的分析數(shù)據(jù)庫(kù)資源并從中提取有價(jià)值的信息來(lái)對(duì)商業(yè)決策進(jìn)行支持,從而來(lái)控制運(yùn)營(yíng)成本、提高經(jīng)濟(jì)效益。本文將從網(wǎng)絡(luò)營(yíng)銷中數(shù)據(jù)挖掘技術(shù)的幾個(gè)應(yīng)用進(jìn)行探討和分析。
1客戶關(guān)系管理
客戶關(guān)系管理在網(wǎng)絡(luò)營(yíng)銷,商業(yè)競(jìng)爭(zhēng)是一家以客戶為中心的競(jìng)技狀態(tài)的客戶,留住客戶,擴(kuò)大客戶基礎(chǔ),建立密切的客戶關(guān)系,客戶需求分析和創(chuàng)造客戶需求等,是非常關(guān)鍵的營(yíng)銷問(wèn)題??蛻絷P(guān)系管理,營(yíng)銷和信息技術(shù)領(lǐng)域是一個(gè)新概念,這在90年代初,軟件產(chǎn)品在上世紀(jì)90年代后期出現(xiàn)的誕生。目前,在國(guó)內(nèi)和國(guó)外的此類產(chǎn)品的研究和發(fā)展階段。然而,繼續(xù)與數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)的進(jìn)步和發(fā)展,客戶關(guān)系管理,也是對(duì)實(shí)際應(yīng)用階段。crm的目標(biāo)是管理者與客戶的互動(dòng),提升客戶價(jià)值,提高客戶滿意度,提高客戶的忠誠(chéng)度,還發(fā)現(xiàn),市場(chǎng)營(yíng)銷和銷售渠道,然后尋找新客戶,提高客戶的利潤(rùn)貢獻(xiàn)率的最終目的是為了推動(dòng)社會(huì)和經(jīng)濟(jì)效益??蛻絷P(guān)系管理的目的,應(yīng)用是改善企業(yè)與客戶的關(guān)系,它是企業(yè)和服務(wù)本質(zhì)管理和協(xié)調(diào),以滿足客戶的需求,企業(yè)政策支持這項(xiàng)工作,并聯(lián)系客戶服務(wù)加強(qiáng)管理,提高客戶滿意度和品牌忠誠(chéng)度。
然而,數(shù)據(jù)挖掘可以應(yīng)用到很多方面的crm和不同階段,包括以下內(nèi)容:
(1)“一對(duì)一”營(yíng)銷的內(nèi)部工作人員認(rèn)識(shí)到,客戶是在這個(gè)領(lǐng)域的企業(yè),而不是貿(mào)易發(fā)展生存的關(guān)鍵。與每一個(gè)客戶接觸的過(guò)程,也是了解客戶的進(jìn)程,而且也讓客戶了解業(yè)務(wù)流程。
(2)企業(yè)與客戶之間的銷售應(yīng)該是一種商業(yè)關(guān)系不斷向前發(fā)展??蛻艉蜖I(yíng)銷公司成立這種方式,而且有許多方法可以使這種與客戶的關(guān)系,往往以改善包括:延長(zhǎng)時(shí)間,客戶關(guān)系和維護(hù)客戶關(guān)系,以進(jìn)一步加強(qiáng)相互交往過(guò)程中,公司可以在對(duì)方取得聯(lián)系更多的利潤(rùn)。
(3)客戶對(duì)客戶盈利能力分析。我們的客戶盈利能力是非常不同的,如果你不明白客戶盈利能力,很難制定有效的營(yíng)銷策略,以獲取最有價(jià)值的客戶,或進(jìn)一步提高客戶的忠誠(chéng)度的價(jià)值。數(shù)據(jù)挖掘技術(shù)可以用來(lái)預(yù)測(cè)客戶在市場(chǎng)條件變化不同的盈利能力。它可以找到所有這些行為和使用模型來(lái)預(yù)測(cè)客戶行為模式的客戶交易盈利水平或新客戶找到高利潤(rùn)。
(4)在所有部門(mén)維護(hù)客戶關(guān)系的競(jìng)爭(zhēng)日趨激烈,企業(yè)獲得新客戶的成本上升,因此,保持現(xiàn)有客戶的關(guān)系變得越來(lái)越重要。對(duì)于企業(yè)客戶可分為三大類:沒(méi)有價(jià)值或者低價(jià)值的客戶,不容易失去寶貴的客戶,并不斷尋找更多的優(yōu)惠,更有價(jià)值的服務(wù)給客戶。前兩個(gè)類型的`客戶,客戶關(guān)系管理,現(xiàn)代化,然而,最具潛力的市場(chǎng)活動(dòng),是第三個(gè)層次的用戶,而且還特別需求和營(yíng)銷工具,以保護(hù)客戶,可以減緩企業(yè)經(jīng)營(yíng)成本,而且還獲得了寶貴的客戶。數(shù)據(jù)挖掘還可以發(fā)現(xiàn),由于客戶流失,該公司能夠滿足這些客戶的需要,采取適當(dāng)措施,保持銷售。
(5)客戶訪問(wèn)企業(yè)業(yè)務(wù)系統(tǒng)資源,包括能夠獲得新客戶的關(guān)鍵指標(biāo)。為了提供這些新的資源,包括企業(yè)搜索客戶誰(shuí)不知道該產(chǎn)品的客戶,可能是競(jìng)爭(zhēng)對(duì)手,服務(wù)客戶。這些細(xì)分客戶,潛在客戶可以幫助企業(yè)完成檢查。
2企業(yè)經(jīng)營(yíng)定位
通過(guò)挖掘客戶的有關(guān)數(shù)據(jù),可以對(duì)客戶進(jìn)行分類,找出其相同點(diǎn)和不同點(diǎn),以便為客戶提供個(gè)性化的產(chǎn)品和服務(wù),使企業(yè)和客戶之間能夠通過(guò)網(wǎng)絡(luò)進(jìn)行有效的溝通和信息交流。例如,關(guān)聯(lián)分析,客戶在購(gòu)買(mǎi)某種商品時(shí),有可能會(huì)連帶著購(gòu)買(mǎi)其他的相關(guān)產(chǎn)品,這樣購(gòu)買(mǎi)的某種商品和連帶購(gòu)買(mǎi)的其他相關(guān)產(chǎn)品之間就存在著某種關(guān)聯(lián),企業(yè)可以針對(duì)這種關(guān)聯(lián)進(jìn)行分析,分析出規(guī)律,已制定有效的營(yíng)銷策略來(lái)長(zhǎng)效的起到吸引客戶連帶消費(fèi),購(gòu)買(mǎi)其他產(chǎn)品的營(yíng)銷策略。它能夠智能化地從大量的數(shù)據(jù)中提取出有用的信息和知識(shí),為企業(yè)的管理人員提供決策支持。數(shù)據(jù)挖掘技術(shù)使數(shù)據(jù)庫(kù)技術(shù)進(jìn)入了一個(gè)更高級(jí)的階段,它不僅能對(duì)過(guò)去的數(shù)據(jù)進(jìn)行查詢和遍歷,并且能夠找出過(guò)去數(shù)據(jù)之間的潛在聯(lián)系,從而促進(jìn)信息的傳遞。
客戶群體的劃分也會(huì)用到數(shù)據(jù)挖掘,沒(méi)有基于數(shù)據(jù)挖掘的客戶劃分,就沒(méi)有真正的差異化、個(gè)性化營(yíng)銷,就沒(méi)有現(xiàn)代營(yíng)銷的根本。做為企業(yè)的領(lǐng)導(dǎo)者,不管你的企業(yè)是賣產(chǎn)品的還是賣服務(wù),第一個(gè)應(yīng)該準(zhǔn)確把握的商業(yè)問(wèn)題就是你的目標(biāo)客戶群體,他們是誰(shuí),有什么特點(diǎn)和行為模式,有那些獨(dú)特的喜好可以作為營(yíng)銷的突破口,有多大的多長(zhǎng)久的贏利價(jià)值。這些問(wèn)題是你整個(gè)商業(yè)運(yùn)做的核心和基礎(chǔ),不了解你的客戶,下面的路就根本別指望能走下去了。數(shù)據(jù)挖掘營(yíng)銷應(yīng)用中的客戶群體劃分可以科學(xué)有效的解決這個(gè)問(wèn)題,也能給企業(yè)找到一個(gè)合理的營(yíng)銷定位。
3客戶信用風(fēng)險(xiǎn)控制
數(shù)據(jù)挖掘技術(shù)在90年代開(kāi)始應(yīng)用于信用評(píng)估與風(fēng)險(xiǎn)分析中。企業(yè)在進(jìn)行網(wǎng)絡(luò)營(yíng)銷的過(guò)程中會(huì)受到各種各樣的來(lái)自買(mǎi)方的信用風(fēng)險(xiǎn)的威脅,隨著市場(chǎng)競(jìng)爭(zhēng)的加劇,貿(mào)易信用已經(jīng)成為企業(yè)成功開(kāi)發(fā)客戶和加強(qiáng)客戶關(guān)系的重要條件??蛻粜庞霉芾碇饕撬鸭瘍?chǔ)存客戶信息,因?yàn)榭蛻艏仁瞧髽I(yè)最大的財(cái)富來(lái)源,也是風(fēng)險(xiǎn)的主要來(lái)源。為了讓企業(yè)在這方面更少的受到威脅,可以利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)企業(yè)經(jīng)常面臨的詐騙行為或延付貨款行為,進(jìn)而進(jìn)行回避。同時(shí)盡可能把客戶信用風(fēng)險(xiǎn)控制在交易發(fā)生之前是成功信用管理的根本。因此,充分獲取客戶的詳細(xì)資料并做出安全的決策非常重要。
客戶信用風(fēng)險(xiǎn)管理應(yīng)用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì):
(3)數(shù)據(jù)挖掘技術(shù)也可以適應(yīng)各種形式的數(shù)據(jù),數(shù)據(jù)挖掘可以是連續(xù)的數(shù)據(jù),離散數(shù)據(jù),而其他形式的數(shù)據(jù)處理,以便在更大的靈活性,在選擇指標(biāo)時(shí),更加符合客觀實(shí)際的信用風(fēng)險(xiǎn)模型。
為現(xiàn)代信用風(fēng)險(xiǎn)管理方法有兩個(gè):第一是所謂的指數(shù)法,其基礎(chǔ)是信用相關(guān)業(yè)務(wù)的某些特性來(lái)企業(yè)信用評(píng)估;第二類是所謂的結(jié)構(gòu)化方法,根據(jù)歷史數(shù)據(jù)和市場(chǎng)數(shù)據(jù)模擬在企業(yè)資產(chǎn)價(jià)值變化的動(dòng)態(tài)持續(xù)的過(guò)程,然后確定其企業(yè)信用的位置。
4在網(wǎng)絡(luò)營(yíng)銷中進(jìn)行數(shù)據(jù)挖掘的優(yōu)勢(shì)
網(wǎng)絡(luò)營(yíng)銷作為適應(yīng)網(wǎng)絡(luò)經(jīng)濟(jì)時(shí)代的網(wǎng)絡(luò)虛擬市場(chǎng)的新?tīng)I(yíng)銷理論,是市場(chǎng)營(yíng)銷理念在新時(shí)期的發(fā)展和應(yīng)用。它能夠智能化地從大量的數(shù)據(jù)中提取出有用的信息和知識(shí),為企業(yè)的管理人員提供決策支持。數(shù)據(jù)挖掘技術(shù)使數(shù)據(jù)庫(kù)技術(shù)進(jìn)入了一個(gè)更高級(jí)的階段,它不僅能對(duì)過(guò)去的數(shù)據(jù)進(jìn)行查詢和遍歷,并且能夠找出過(guò)去數(shù)據(jù)之間的潛在聯(lián)系,從而促進(jìn)信息的傳遞。
1.維護(hù)原有客戶,挖掘潛在新客戶
網(wǎng)絡(luò)營(yíng)銷中銷售商可以通過(guò)客戶的訪問(wèn)記錄來(lái)挖掘出客戶的潛在信息,跟據(jù)客戶的興趣與需求向客戶有針對(duì)性的做個(gè)性化的推薦,制定出客戶滿意的產(chǎn)品服務(wù)。在做好維護(hù)原有老客戶的基礎(chǔ)上,通過(guò)對(duì)數(shù)據(jù)的挖掘,利用分類技術(shù),也可以尋找出潛在的客戶,通過(guò)對(duì)web日志的挖掘,可以對(duì)已經(jīng)存在的訪問(wèn)者進(jìn)行分類,根據(jù)這種精細(xì)的分類,還可以找到潛在的新客戶。
2.制定營(yíng)銷策略,優(yōu)化促銷活動(dòng)
對(duì)于保留的商品訪問(wèn)記錄和銷售記錄進(jìn)行挖掘,可以發(fā)現(xiàn)客戶的訪問(wèn)規(guī)律,了解客戶消費(fèi)的生命周期,起伏規(guī)律,結(jié)合市場(chǎng)形勢(shì)的變化,針對(duì)不同的商品和客戶群制定不同的營(yíng)銷策略,保證促銷活動(dòng)針對(duì)客戶群有的放矢,收到意想不到的效果。
3.降低運(yùn)營(yíng)成本,提高競(jìng)爭(zhēng)力
網(wǎng)絡(luò)營(yíng)銷的管理者可以通過(guò)數(shù)據(jù)挖掘發(fā)現(xiàn)市場(chǎng)反饋的可靠信息,預(yù)測(cè)客戶未來(lái)的購(gòu)買(mǎi)行為,有針對(duì)性的進(jìn)行營(yíng)銷活動(dòng),還可以根據(jù)產(chǎn)品訪問(wèn)者的瀏覽習(xí)慣來(lái)覺(jué)定產(chǎn)品廣告的位置,使廣告有針對(duì)性的起到宣傳的效果。從而提高廣告的投資回報(bào)率,從而能降低運(yùn)營(yíng)成本,提高且的核心競(jìng)爭(zhēng)力。
4.對(duì)客戶進(jìn)行個(gè)性化推薦
根據(jù)客戶采礦活動(dòng)對(duì)網(wǎng)絡(luò)規(guī)則,有針對(duì)性的網(wǎng)絡(luò)營(yíng)銷平臺(tái),提供“個(gè)性化”服務(wù)。個(gè)性化服務(wù)是在服務(wù)策略和服務(wù)內(nèi)容的不同客戶的不同,其本質(zhì)是客戶為中心的web服務(wù)的需求。它通過(guò)收集和分析客戶資料,以了解客戶的利益和購(gòu)買(mǎi)行為,然后采取主動(dòng),以達(dá)到建議的服務(wù)。
5.完善網(wǎng)絡(luò)營(yíng)銷網(wǎng)站的設(shè)計(jì)
參考文獻(xiàn)
1馮英健著,《網(wǎng)絡(luò)營(yíng)銷基礎(chǔ)與實(shí)踐》,清華大學(xué)出版社,1月第1版
2.,and.sky-shairoh,esinknowledgediscoveryanddatamining.aaai/mitpress,menlopark,ca.:
數(shù)據(jù)挖掘論文篇十
摘要:在國(guó)家電網(wǎng)公司信息化工程的建設(shè)過(guò)程中,積累了大量的文本數(shù)據(jù)。如何挖掘文本數(shù)據(jù)中蘊(yùn)含的有價(jià)值信息將成為電力企業(yè)大數(shù)據(jù)挖掘方向研究的重點(diǎn)對(duì)象。文章結(jié)合電力行業(yè)目前的數(shù)據(jù)現(xiàn)狀,使用文本挖掘的方法對(duì)電力設(shè)備檢修資金投入工作效能場(chǎng)景進(jìn)行挖掘,對(duì)生產(chǎn)信息管理系統(tǒng)中報(bào)缺單數(shù)據(jù)進(jìn)行文本聚類,實(shí)現(xiàn)對(duì)缺陷的細(xì)分。實(shí)踐表明,該方法可以得出各類別的缺陷特征,從而證明了文本挖掘在電力行業(yè)的可用性。
關(guān)鍵詞:電力設(shè)備檢修;文本數(shù)據(jù);文本挖掘;大數(shù)據(jù)挖掘
隨著信息化的快速發(fā)展,國(guó)家電網(wǎng)公司各專業(yè)積累的數(shù)據(jù)量越來(lái)越龐大。龐大數(shù)據(jù)的背后,由于數(shù)據(jù)結(jié)構(gòu)和存儲(chǔ)方式的多樣化以及電力系統(tǒng)內(nèi)部不同專業(yè)從業(yè)者的知識(shí)面層次不齊等,其中被利用的數(shù)據(jù)只占少量的部分,造成大量的有價(jià)值數(shù)據(jù)被浪費(fèi)。在被浪費(fèi)的數(shù)據(jù)中,以文本形式存在的數(shù)據(jù)占很大比重,如何從比較復(fù)雜的文本數(shù)據(jù)中獲得需要的數(shù)據(jù)受到國(guó)家電網(wǎng)公司的普遍關(guān)注。國(guó)家電網(wǎng)公司經(jīng)過(guò)sg186、三集五大等大型信息化工程的建設(shè),積累了海量的業(yè)務(wù)數(shù)據(jù),其中包括大量的文本數(shù)據(jù)。目前,國(guó)家電網(wǎng)公司對(duì)業(yè)務(wù)數(shù)據(jù)的利用主要集中在結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計(jì)和分析,這些方法無(wú)法直接應(yīng)用在非結(jié)構(gòu)化文本數(shù)據(jù)中,更無(wú)法對(duì)其中隱含的價(jià)值規(guī)律進(jìn)行深度分析挖掘。針對(duì)非結(jié)構(gòu)化文本數(shù)據(jù)量不斷增大、業(yè)務(wù)應(yīng)用范圍不斷擴(kuò)大這一現(xiàn)狀,為了提升國(guó)家電網(wǎng)公司企業(yè)運(yùn)營(yíng)管理精益化水平,需要進(jìn)一步挖掘非結(jié)構(gòu)化數(shù)據(jù)中潛在的數(shù)據(jù)價(jià)值。因此,開(kāi)展電力大數(shù)據(jù)文本數(shù)據(jù)挖掘技術(shù)應(yīng)用場(chǎng)景和一般流程的研究顯得尤為重要[1]。
1非結(jié)構(gòu)化數(shù)據(jù)概述
與結(jié)構(gòu)化數(shù)據(jù)(能夠用二維表結(jié)構(gòu)遵循一定的邏輯語(yǔ)法進(jìn)行體現(xiàn)的數(shù)據(jù))相比,非結(jié)構(gòu)化數(shù)據(jù)不能在數(shù)據(jù)庫(kù)中采用二維結(jié)構(gòu)邏輯形式來(lái)表示,這些形式主要有word文檔、文本、圖片、標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言下的子集xml、html、excel報(bào)表、ppt、audio、video、jpg、bmp等。半結(jié)構(gòu)化數(shù)據(jù)處于完全結(jié)構(gòu)化數(shù)據(jù)(邏輯型、關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù))和完全無(wú)結(jié)構(gòu)化數(shù)據(jù)(bmp、jpg、video文件)中間,它一般的功能是對(duì)系統(tǒng)文件的描述,如系統(tǒng)應(yīng)用幫助模塊,有一定的邏輯結(jié)構(gòu),同時(shí)也包含數(shù)據(jù)格式,兩者相融在一起,比較均衡,沒(méi)有明顯的界限[2]。進(jìn)入21世紀(jì)后,網(wǎng)絡(luò)技術(shù)飛速發(fā)展,特別是內(nèi)聯(lián)網(wǎng)和因特網(wǎng)技術(shù)取得突飛猛進(jìn)的發(fā)展,各類非結(jié)構(gòu)數(shù)據(jù)類型格式日益增多,以往的數(shù)據(jù)庫(kù)主要用于管理結(jié)構(gòu)化數(shù)據(jù),對(duì)于非結(jié)構(gòu)化數(shù)據(jù)的管理稍顯乏力,為了適應(yīng)非結(jié)構(gòu)數(shù)據(jù)的迅猛發(fā)展,數(shù)據(jù)庫(kù)的革新勢(shì)在必行,在內(nèi)聯(lián)網(wǎng)和因特網(wǎng)技術(shù)的基礎(chǔ)上,對(duì)數(shù)據(jù)庫(kù)的內(nèi)在結(jié)構(gòu)進(jìn)行改進(jìn)和創(chuàng)新,使其能夠兼容和處電力信息與通信技術(shù)第14卷第1期8電力大數(shù)據(jù)技術(shù)理非結(jié)構(gòu)數(shù)據(jù)形式。北京國(guó)信貝斯是我國(guó)非結(jié)構(gòu)化數(shù)據(jù)庫(kù)開(kāi)發(fā)和設(shè)計(jì)的領(lǐng)軍者,其旗下開(kāi)發(fā)的ibase數(shù)據(jù)庫(kù)能夠兼容和處理目前市面上存在的各種文件名、格式、多媒體信息,能夠基于內(nèi)聯(lián)網(wǎng)和互聯(lián)網(wǎng)對(duì)海量信息進(jìn)行搜索、管理,技術(shù)已經(jīng)達(dá)到全球領(lǐng)先水平。
2文本挖掘技術(shù)
2.1文本挖掘
文本挖掘的對(duì)象是用自然語(yǔ)言描述的語(yǔ)句、論文、web頁(yè)面等非結(jié)構(gòu)化文本信息,這類信息無(wú)法使用結(jié)構(gòu)化數(shù)據(jù)的挖掘方法進(jìn)行處理;文本挖掘指通過(guò)對(duì)單個(gè)詞語(yǔ)和語(yǔ)法的精準(zhǔn)分析,通過(guò)分析結(jié)構(gòu)在海量的非結(jié)構(gòu)化數(shù)據(jù)中檢索意思相近的詞語(yǔ)、句子或者信息[3]。
2.2文本挖掘流程
挖掘流程如圖1所示。圖1挖掘流程fig.1miningprocedure1)文本預(yù)處理:把與任務(wù)直接關(guān)聯(lián)的信息文本轉(zhuǎn)化成可以讓文本挖掘工具處理的形式,這個(gè)過(guò)程分3步:分段;預(yù)讀文本,把文本特征展現(xiàn)出來(lái);特征抽取。2)文本挖掘:完成文本特征抽取后,通過(guò)智能機(jī)器檢索工具識(shí)別符合主題目標(biāo)的文段信息,在海量信息或者用戶指定的數(shù)據(jù)域中搜索與文本預(yù)處理后得出的文本特征相符或相近的數(shù)據(jù)信息,然后通過(guò)進(jìn)一步識(shí)別和判斷,達(dá)到精確檢索的目的,這是一個(gè)非常復(fù)雜的過(guò)程,縱跨了多個(gè)學(xué)科,包括智能技術(shù)、信息技術(shù)、智能識(shí)別技術(shù)、非結(jié)構(gòu)數(shù)據(jù)庫(kù)技術(shù)、可視化技術(shù)、預(yù)處理技術(shù)、讀碼技術(shù)等。3)模式評(píng)估:模式評(píng)估是用戶根據(jù)自己的需求主題設(shè)置符合自己需求主題或目標(biāo)的模式,把挖掘到的文本或信息與自己設(shè)置的模式進(jìn)行匹配,如果發(fā)現(xiàn)符合主題要求,則存儲(chǔ)該數(shù)據(jù)和模式以方便用戶調(diào)用,如果不符合,則跳轉(zhuǎn)回原來(lái)的環(huán)節(jié)進(jìn)行重新檢索,然后進(jìn)行下一個(gè)匹配過(guò)程的模式評(píng)估。
2.3文本挖掘技術(shù)分析
解決非結(jié)構(gòu)化文本挖掘問(wèn)題,現(xiàn)階段主要有2種方法:一是探索新型的數(shù)據(jù)挖掘算法以準(zhǔn)確挖掘出相應(yīng)的非結(jié)構(gòu)化數(shù)據(jù)信息,基于數(shù)據(jù)本身所體現(xiàn)的復(fù)雜特性,使得算法的實(shí)施愈加困難;二是把非結(jié)構(gòu)化問(wèn)題直接轉(zhuǎn)換成結(jié)構(gòu)化,通過(guò)實(shí)施相應(yīng)的數(shù)據(jù)挖掘技術(shù)達(dá)到挖掘目的。而在語(yǔ)義關(guān)系方面,就要應(yīng)用到特定的語(yǔ)言處理成果完成分析過(guò)程。下文是根據(jù)文本挖掘的大致流程來(lái)介紹其所用到的相關(guān)技術(shù)。
2.3.1數(shù)據(jù)預(yù)處理技術(shù)
文本數(shù)據(jù)預(yù)處理技術(shù)大致可分為分詞技術(shù)、特征表示以及特征提取法。1)分詞技術(shù)主要有兩大類:一種為針對(duì)詞庫(kù)的分詞算法;另一種為針對(duì)無(wú)詞典的分詞技術(shù)。前者主要包含正向最大/小匹配和反向匹配等。而后者的基礎(chǔ)思路為:在統(tǒng)計(jì)詞頻的基礎(chǔ)上,把原文中緊密相連的2個(gè)字當(dāng)作一個(gè)詞來(lái)統(tǒng)計(jì)其出現(xiàn)的次數(shù),若頻率較高,就有可能是一個(gè)詞,當(dāng)該頻率達(dá)到了預(yù)設(shè)閾值,就可把其當(dāng)作一個(gè)詞來(lái)進(jìn)行索引。2)特征表示通常是把對(duì)應(yīng)的特征項(xiàng)作為本文的標(biāo)示,在進(jìn)行文本挖掘時(shí)只需要處理相對(duì)應(yīng)的特征項(xiàng),就能完成非結(jié)構(gòu)化的文本處理,直接實(shí)現(xiàn)結(jié)構(gòu)化轉(zhuǎn)換目的。特征表示的建立過(guò)程實(shí)際上就是挖掘模型的建立過(guò)程,其模型可分為多種類型,如向量空間模型與概率型等[5]。3)特征提取法通常是建立起特定的評(píng)價(jià)函數(shù),以此評(píng)價(jià)完所有特征,然后把這些特征依照評(píng)價(jià)值的高低順序進(jìn)行排列,將評(píng)價(jià)值最高項(xiàng)作為優(yōu)選項(xiàng)。在實(shí)際文本處理過(guò)程中所應(yīng)用的評(píng)價(jià)函數(shù)主要包括信息增益、互信息以及詞頻等。
2.3.2挖掘常用技術(shù)
從文本挖掘技術(shù)的研究和應(yīng)用情況來(lái)看,在現(xiàn)有的文本挖掘技術(shù)類別中應(yīng)用較為廣泛的主要包括文本分類、自動(dòng)文摘以及文本聚類[4-5]。1)文本分類。文本分類是給機(jī)器添加相應(yīng)的分類模型,當(dāng)用戶閱讀文本時(shí)能夠更為便捷,在搜索文本信息時(shí),能夠在所設(shè)定的搜索范圍內(nèi)快速和準(zhǔn)確的獲取。用于文本分類的算法較多,主要有決策樹(shù)、貝葉斯分類、支持向量機(jī)(svm)、向量空間模型(vectorspacemodel,vsm)、邏輯回歸(logisticregression,lr)以及神經(jīng)網(wǎng)絡(luò)等。2)自動(dòng)文摘。自動(dòng)文摘是通過(guò)計(jì)算機(jī)技術(shù)智能的把原文的中心內(nèi)容濃縮成簡(jiǎn)短、連續(xù)的文字段落,以此來(lái)盡可能地降低用戶閱讀的文本信息量。3)文本聚類。文本聚類與文本分類的作用大抵相同,所實(shí)施的過(guò)程有所區(qū)別。文本聚類是將內(nèi)容相近的文本歸到同個(gè)類別,盡可能地區(qū)分內(nèi)容不同的文本。其標(biāo)準(zhǔn)通??梢砸勒瘴谋緦傩曰蛘呶谋緝?nèi)容來(lái)進(jìn)行聚類。聚類方法大致可分為平面劃分法與層次聚類法。另外,除了上述常用的文本挖掘技術(shù),許多研究還涉及關(guān)聯(lián)分析、分布預(yù)測(cè)分析和結(jié)構(gòu)分析等。
2.3.3文本挖掘系統(tǒng)模式評(píng)估方法
數(shù)據(jù)挖掘系統(tǒng)的評(píng)估是至關(guān)重要的,現(xiàn)在已有大量的研究來(lái)衡量這一標(biāo)準(zhǔn),以下是公認(rèn)的評(píng)估方法。1)查全率和查準(zhǔn)率。查全率代表實(shí)際被檢出的文本的百分比;查準(zhǔn)率是所檢索到的.實(shí)際文本與查詢相關(guān)文本的百分比。2)冗余度和放射性。冗余度表示信息抽取中冗余的程度;放射性表示一個(gè)系統(tǒng)在抽取事實(shí)不斷增多時(shí)產(chǎn)生錯(cuò)誤的趨勢(shì)。最低的冗余度和放射性是系統(tǒng)追求的最終目標(biāo)。3)雙盲測(cè)試。先用機(jī)器生成一組輸出結(jié)果,再由相關(guān)專家產(chǎn)生一組輸出結(jié)果,然后混合2組輸出結(jié)果,這種混合后的輸出集再交給另一些相關(guān)專家進(jìn)行驗(yàn)證,讓他們給予準(zhǔn)確性方面的評(píng)估。
3電力行業(yè)文本挖掘可研究實(shí)例
文本挖掘技術(shù)在國(guó)內(nèi)電力行業(yè)屬于新興的前沿領(lǐng)域,對(duì)從業(yè)人員的素質(zhì)要求相對(duì)比較高。由于現(xiàn)階段知識(shí)和技術(shù)層面上匱乏,國(guó)家電網(wǎng)幾乎沒(méi)有關(guān)于此方面的項(xiàng)目實(shí)施。本節(jié)通過(guò)2個(gè)電力運(yùn)營(yíng)監(jiān)測(cè)業(yè)務(wù)的應(yīng)用需求,初步探討文本挖掘的建模過(guò)程。
3.1電力運(yùn)營(yíng)監(jiān)測(cè)業(yè)務(wù)應(yīng)用需求
1)檢修資金投入工作效能分析場(chǎng)景分析。大檢修和技改是保障電網(wǎng)安全的重要工作。由于運(yùn)檢業(yè)務(wù)系統(tǒng)的數(shù)據(jù)質(zhì)量問(wèn)題,通過(guò)對(duì)量化數(shù)據(jù)的統(tǒng)計(jì),無(wú)法準(zhǔn)確掌握大修、技改資金投入的工作效能情況。但設(shè)備的實(shí)際運(yùn)行狀態(tài)可以通過(guò)文本類故障記錄、運(yùn)行日志等進(jìn)行反映,因此,采用文本挖掘技術(shù)對(duì)檢修工作效能進(jìn)行分析與可視化展現(xiàn),同時(shí)結(jié)合傳統(tǒng)的統(tǒng)計(jì)方法,實(shí)現(xiàn)對(duì)大修技改資金投入工作效能的分析和監(jiān)測(cè)。例如,可以通過(guò)分析歷年的故障記錄信息,反映出每年主要故障變化情況,進(jìn)而結(jié)合每年大修技改資金投入情況,分析資金投入是否與預(yù)期目標(biāo)相一致。2)家族缺陷識(shí)別分析。家族缺陷是指同一廠家生產(chǎn)的同一型號(hào)、同一批次的設(shè)備在運(yùn)行過(guò)程中出現(xiàn)了相同或相似的缺陷。家族缺陷識(shí)別分析是通過(guò)對(duì)運(yùn)行記錄、故障記錄等設(shè)備運(yùn)行文本信息的挖掘和可視化分析,對(duì)設(shè)備家族缺陷進(jìn)行識(shí)別。該場(chǎng)景既可以輔助基層業(yè)務(wù)人員對(duì)家族缺陷進(jìn)行準(zhǔn)確判斷,同時(shí)可以作為一種輔助手段為總部專家判定家族缺陷提供參考,從而實(shí)現(xiàn)對(duì)家族缺陷辨識(shí)方式的優(yōu)化,并基于此為檢修計(jì)劃制定、廠商評(píng)價(jià)、采購(gòu)建議等提供決策支撐。
3.2文本分析建模過(guò)程
第1步:將原始的非結(jié)構(gòu)化數(shù)據(jù)源轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),分析文本集合中各個(gè)文本之間共同出現(xiàn)的模式;匯總與家族缺陷相關(guān)的所有文檔,形成原始數(shù)據(jù)源的集合。第2步:對(duì)原始數(shù)據(jù)源的集合進(jìn)行分詞處理,建立特征集,使用詞頻/逆文檔頻率(termfrequency-inversedocumentfrequency,tf/idf)權(quán)值計(jì)算方法得到各個(gè)點(diǎn)的維度權(quán)值,判斷關(guān)鍵字的詞頻,例如“主變1號(hào)”運(yùn)行記錄中多次出現(xiàn),但在故障記錄中很少出現(xiàn),那么認(rèn)為“主變1號(hào)”有很好的類別區(qū)分能力。第3步:對(duì)分詞后的文檔建立索引,匯總所有文檔的索引形成索引庫(kù),并對(duì)索引庫(kù)排序。第4步:文檔向量化;構(gòu)建向量空間模型,將文檔表達(dá)為一個(gè)矢量,看作向量空間中的一個(gè)點(diǎn);實(shí)際分析過(guò)程中對(duì)多維數(shù)據(jù)首先將其降低維度,降低維度后得到一個(gè)三維空間模型,文檔向量化生成文檔特征詞對(duì)應(yīng)表、文檔相似度表。第5步:結(jié)合業(yè)務(wù)實(shí)際,對(duì)相似度較高的表中出現(xiàn)的關(guān)鍵字進(jìn)行比對(duì),例如:“主變1號(hào)”、“停電故障”等關(guān)鍵字在多個(gè)日志中頻繁出現(xiàn),則該文檔所記錄的相關(guān)設(shè)備存在異常的可能性較大。
3.3文本分析應(yīng)用及成效
對(duì)生產(chǎn)信息管理系統(tǒng)中報(bào)缺單數(shù)據(jù)中的報(bào)缺單名稱進(jìn)行文本聚類,實(shí)現(xiàn)對(duì)缺陷的細(xì)分,進(jìn)而對(duì)各類別在非聚類變量上進(jìn)行分析,得出各類別的缺陷特征。經(jīng)過(guò)近一年以來(lái)在國(guó)網(wǎng)遼寧電力公司的逐步應(yīng)用,科學(xué)的分析挖掘出缺陷主要集中在開(kāi)關(guān)、主變、指示燈、直流、冷卻器、調(diào)速器等設(shè)備,主要出現(xiàn)啟呂旭明(1981–),男,河北保定人,高級(jí)工程師,從事電力企業(yè)信息化、智能電網(wǎng)及信息安全研究與應(yīng)用工作;雷振江(1976–),男,遼寧沈陽(yáng)人,高級(jí)工程師,從事電力信息化項(xiàng)目計(jì)劃、重點(diǎn)項(xiàng)目建設(shè)、信息技術(shù)研究與創(chuàng)新應(yīng)用、信息化深化應(yīng)用等相關(guān)工作;趙永彬(1975–),男,遼寧朝陽(yáng)人,高級(jí)工程師,從事電力信息通信系統(tǒng)調(diào)度、運(yùn)行、客服及信息安全等相關(guān)工作;由廣浩(1983–),男,遼寧遼陽(yáng)人,工程師,從事信息網(wǎng)絡(luò)建設(shè)、信息安全等工作。作者簡(jiǎn)介:動(dòng)、漏水、停機(jī)、滲水等缺陷現(xiàn)象。公司故障處理快速響應(yīng)、及時(shí)維修、提高供電質(zhì)量和服務(wù)效率得到了顯著的提升。電力設(shè)備故障缺陷特征示意如圖2所示。
4結(jié)語(yǔ)
國(guó)家電網(wǎng)文本挖掘的目的是從海量數(shù)據(jù)中抽取隱含的、未知的、有價(jià)值的文本數(shù)據(jù),利用數(shù)據(jù)挖掘技術(shù)處理電力公司文本數(shù)據(jù),將會(huì)給企業(yè)帶來(lái)巨大的商業(yè)價(jià)值。本文提出的關(guān)于檢修資金投入工作效能分析和家族缺陷識(shí)別分析2個(gè)文本挖掘?qū)嵗皇俏谋就诰蛟陔娏π袠I(yè)應(yīng)用的一角。如今,數(shù)據(jù)挖掘技術(shù)與電力行業(yè)正處于快速發(fā)展階段,文本挖掘的應(yīng)用將越來(lái)越廣泛。下一階段的研究目標(biāo)是探尋有效辦法將數(shù)據(jù)挖掘技術(shù)融入到文本挖掘領(lǐng)域的實(shí)際應(yīng)用中,使得國(guó)家電網(wǎng)文本挖掘項(xiàng)目得以順利實(shí)施,并達(dá)到預(yù)期成效。
參考文獻(xiàn):
[1]費(fèi)爾德曼.文本挖掘(英文版)[m].北京:人民郵電出版社,.
[2]孫濤.面向半結(jié)構(gòu)化的數(shù)據(jù)模型和數(shù)據(jù)挖掘方法研究[d].吉林:吉林大學(xué),.
[3]胡健,楊炳儒,宋澤鋒,等.基于非結(jié)構(gòu)化數(shù)據(jù)挖掘結(jié)構(gòu)模型的web文本聚類算法[j].北京科技大學(xué)學(xué)報(bào),,30(2):,yangbing-ru,songze-feng,tclusteringalgorithmbasedonnonstructuraldataminingmodel[j].journalofuniversityofscienceandtechnologybeijing,2008,30(2):217-220.
[4]周昭濤.文本聚類分析效果評(píng)價(jià)及文本表示研究[d].北京:中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所),.
[5]tanpn,steinbachm,kumarv.數(shù)據(jù)挖掘?qū)д?英文版)[m].北京:人民郵電出版社,.
數(shù)據(jù)挖掘論文篇十一
1、引言
對(duì)很多培養(yǎng)機(jī)構(gòu)而言,目前急需解決的問(wèn)題主要有:如何根據(jù)不同成員需求設(shè)置合理的課程、如何通過(guò)教學(xué)方式提高成員學(xué)習(xí)積極性、如何提高成員培訓(xùn)效果、如何通過(guò)考核檢驗(yàn)成員學(xué)習(xí)成果等,都是培養(yǎng)機(jī)構(gòu)發(fā)展過(guò)程中必須面對(duì)的問(wèn)題。隨著我國(guó)信息化進(jìn)程的加快,一些培養(yǎng)機(jī)構(gòu)也開(kāi)始進(jìn)行信息化建設(shè),通過(guò)信息系統(tǒng)對(duì)培訓(xùn)相關(guān)事宜進(jìn)行管理。但目前在針對(duì)培養(yǎng)機(jī)構(gòu)的信息系統(tǒng)中,所實(shí)現(xiàn)的功能和模塊是進(jìn)行簡(jiǎn)單的查詢、統(tǒng)計(jì)。在了解培訓(xùn)評(píng)估效果時(shí),目前的信息系統(tǒng)中,學(xué)員通過(guò)系統(tǒng)對(duì)不同課程的教師進(jìn)行打分,系統(tǒng)自對(duì)進(jìn)行匯總、統(tǒng)計(jì),得出教師評(píng)價(jià)。但這種匯總、統(tǒng)計(jì)是最簡(jiǎn)單的,對(duì)教師評(píng)價(jià)也缺乏全面性和深度。
2、數(shù)據(jù)挖掘在培訓(xùn)管理系統(tǒng)中的應(yīng)用
大數(shù)據(jù)時(shí)代下,數(shù)據(jù)信息呈現(xiàn)出海量特點(diǎn)。如何從海量、不完全的信息中尋找到真正有用的信息,是大數(shù)據(jù)時(shí)代中重要的問(wèn)題。由此便利用到數(shù)據(jù)挖掘,顧名思義,數(shù)據(jù)挖掘就是從眾多數(shù)據(jù)信息中尋找到有用、有價(jià)值的信息。大數(shù)據(jù)時(shí)代下,教育行業(yè)中,信息量也是海量的,要想提高教學(xué)質(zhì)量就需要運(yùn)用數(shù)據(jù)挖掘找尋到有用的教育信息,并運(yùn)用到實(shí)際教學(xué)中。信息系統(tǒng)通過(guò)一段實(shí)際應(yīng)用后,里面存儲(chǔ)了大量數(shù)據(jù),相應(yīng)的,學(xué)習(xí)管理系統(tǒng)也是如此,里面蘊(yùn)含了大量數(shù)據(jù)信息。如在線課程等功能中藏有大量師生應(yīng)用過(guò)程中的數(shù)據(jù)資料。如圖1為數(shù)據(jù)挖掘在培訓(xùn)管理中的流程圖。
2.1初步探索
培訓(xùn)管理系統(tǒng)中一般具有數(shù)據(jù)統(tǒng)計(jì)功能,將相關(guān)事宜進(jìn)行統(tǒng)計(jì)。如網(wǎng)絡(luò)課程開(kāi)展過(guò)程中,數(shù)據(jù)挖掘在培訓(xùn)管理系統(tǒng)中的應(yīng)用文/張宏亮在大數(shù)據(jù)時(shí)代,如何使用現(xiàn)有的數(shù)據(jù)對(duì)學(xué)員進(jìn)行培訓(xùn)管理,從而提高培訓(xùn)效率是當(dāng)前培訓(xùn)管理中所面臨的問(wèn)題。本文分析了數(shù)據(jù)挖掘在培訓(xùn)管理中的`應(yīng)用主要表現(xiàn)在初步探索、數(shù)據(jù)預(yù)處理以及數(shù)據(jù)挖掘過(guò)程。其中數(shù)據(jù)預(yù)處理和數(shù)據(jù)挖掘是培訓(xùn)系統(tǒng)的核心功能。
2.2數(shù)據(jù)預(yù)期處理
數(shù)據(jù)預(yù)處理時(shí),原始數(shù)據(jù)庫(kù)會(huì)發(fā)生轉(zhuǎn)變,以適應(yīng)數(shù)據(jù)挖掘、數(shù)據(jù)挖掘算法等的要求。在處理結(jié)構(gòu)化的數(shù)據(jù)時(shí),數(shù)據(jù)預(yù)處理需要完成兩項(xiàng)任務(wù),即消除數(shù)據(jù)缺陷現(xiàn)象的存在和為數(shù)據(jù)挖掘奠定良好基礎(chǔ)。數(shù)據(jù)處理是對(duì)現(xiàn)有的數(shù)據(jù)進(jìn)行前期處理,方便后期數(shù)據(jù)挖掘。如圖2為培訓(xùn)管理系統(tǒng)中數(shù)據(jù)預(yù)處理模塊。
2.3數(shù)據(jù)挖掘
wangj開(kāi)發(fā)了一個(gè)將數(shù)據(jù)挖掘技術(shù)與基于模擬的培訓(xùn)相結(jié)合的混合框架,以提高培訓(xùn)評(píng)估的有效性。以信仰為基礎(chǔ)的學(xué)習(xí)概念,用于從知識(shí)/技能水平和信心水平的兩個(gè)維度來(lái)評(píng)估學(xué)員的學(xué)習(xí)成果。數(shù)據(jù)挖掘技術(shù)用于分析受訓(xùn)人員的個(gè)人資料和基于模擬的培訓(xùn)產(chǎn)生的數(shù)據(jù),以評(píng)估學(xué)員的表現(xiàn)和學(xué)習(xí)行為。提出的方法論以臺(tái)灣基于模擬的步兵射擊訓(xùn)練的實(shí)例為例。結(jié)果表明,提出的方法可以準(zhǔn)確地評(píng)估學(xué)員的表現(xiàn)和學(xué)習(xí)行為,并且可以發(fā)現(xiàn)潛在的知識(shí)來(lái)提高學(xué)員的學(xué)習(xí)成果。bodeacn使用數(shù)據(jù)挖掘技術(shù)進(jìn)行了培訓(xùn)學(xué)習(xí)管理,用于分析參加在線兩年制碩士學(xué)位課程項(xiàng)目管理的學(xué)生的表現(xiàn)。系統(tǒng)數(shù)據(jù)來(lái)源是收集學(xué)生意見(jiàn)的調(diào)查數(shù)據(jù),學(xué)生記錄的操作數(shù)據(jù)和電子學(xué)習(xí)的平臺(tái)記錄的學(xué)生活動(dòng)數(shù)據(jù)。
3、總結(jié)
目前培訓(xùn)機(jī)構(gòu)在進(jìn)行教學(xué)評(píng)估時(shí),所選擇的指標(biāo)都是參考其他機(jī)構(gòu)的,并沒(méi)有真正從自身實(shí)際出發(fā)進(jìn)行評(píng)估,因此教學(xué)評(píng)估時(shí)存在諸多問(wèn)題。其中最明顯的兩個(gè)問(wèn)題是:第一教學(xué)評(píng)估方式單一化嚴(yán)重,只以數(shù)字評(píng)估為主;第二評(píng)估時(shí)容易受各種主觀因素影響。
參考文獻(xiàn)
將本文的word文檔下載到電腦,方便收藏和打印
推薦度:
點(diǎn)擊下載文檔
搜索文檔
數(shù)據(jù)挖掘論文篇十二
摘要:隨著科學(xué)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)也應(yīng)運(yùn)而生。為了高效有序的醫(yī)療信息管理,需要加強(qiáng)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的實(shí)際應(yīng)用,從而提升醫(yī)院的管理水平,為醫(yī)院的管理工作及資源的合理配置提供多樣化發(fā)展的可能性。筆者將針對(duì)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用這一課題進(jìn)行相應(yīng)的探究,從而提出合理的改進(jìn)建議。
關(guān)鍵詞:挖掘技術(shù);醫(yī)療信息管理;應(yīng)用方式
數(shù)據(jù)挖掘作為一種數(shù)據(jù)信息再利用的有效技術(shù),能夠有效地為醫(yī)院的管理決策提供重要信息。它以數(shù)據(jù)庫(kù)、人工智能以及數(shù)理統(tǒng)計(jì)為主要技術(shù)支柱進(jìn)行技術(shù)管理與決策。而在醫(yī)療信息管理過(guò)程之中應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠較好地針對(duì)醫(yī)療衛(wèi)生信息進(jìn)行整理與歸類來(lái)建立管理模型,形成有效的總結(jié)數(shù)據(jù)的同時(shí)能夠?yàn)獒t(yī)療工作的高效進(jìn)行提供有價(jià)值的信息。所以筆者將以數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用為著手點(diǎn),從而針對(duì)其應(yīng)用現(xiàn)狀進(jìn)行探究,以此提出加強(qiáng)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中應(yīng)用的具體措施,希望能夠在理論層面上推動(dòng)醫(yī)療信息管理工作的飛躍。
1在醫(yī)療信息管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)的基本內(nèi)涵
數(shù)據(jù)挖掘是結(jié)合信息收集技術(shù)、人工智能處理技術(shù)以及分析檢測(cè)技術(shù)等所形成的功能強(qiáng)大的技術(shù)。它能夠?qū)崿F(xiàn)對(duì)于數(shù)據(jù)的收集、問(wèn)題的定義與處理,并且能夠較好地對(duì)于結(jié)果進(jìn)行解釋與評(píng)估。在醫(yī)療信息管理工作進(jìn)行的過(guò)程之中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以較好地加強(qiáng)醫(yī)療信息數(shù)據(jù)模型的建立,同時(shí)以多種形式出現(xiàn),例如文字信息、基本信號(hào)信息、圖像收集等,也能夠用來(lái)進(jìn)行醫(yī)療信息的科普與宣傳。并且,數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息中所體現(xiàn)出的應(yīng)用方式有所不同,在數(shù)據(jù)挖掘技術(shù)應(yīng)用過(guò)程之中,既可以針對(duì)同一類的實(shí)物反應(yīng)出共同性質(zhì)的基本特征,同時(shí)也能夠根據(jù)具有一定關(guān)聯(lián)性的事物信息來(lái)探究差異。這些功能不僅僅能夠在醫(yī)療信息的管理層面上給予醫(yī)療人員較大的信息管理指導(dǎo),同時(shí)在實(shí)際的醫(yī)療診斷過(guò)程之中,也可以向醫(yī)生提供患者的患病信息,并且輔助治療的進(jìn)行[1]。所以,在醫(yī)療信息管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)不僅僅能夠推動(dòng)醫(yī)療信息管理水平的提升,也是醫(yī)院實(shí)現(xiàn)現(xiàn)代化、信息化建設(shè)的重要體現(xiàn),需要從根本上明確醫(yī)療信息管理應(yīng)用數(shù)據(jù)挖掘技術(shù)的必要性與基本內(nèi)涵,從而針對(duì)醫(yī)院的管理現(xiàn)狀實(shí)現(xiàn)其管理方式與技術(shù)應(yīng)用的轉(zhuǎn)變與優(yōu)化。
2在醫(yī)療信息管理過(guò)程之中加強(qiáng)數(shù)據(jù)挖掘技術(shù)應(yīng)用的重要措施
2.1實(shí)現(xiàn)建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)的優(yōu)化
在應(yīng)用數(shù)據(jù)挖掘技術(shù)的過(guò)程之中,必須基于數(shù)據(jù)庫(kù)信息的基礎(chǔ)之上,其數(shù)據(jù)挖掘技術(shù)才能夠進(jìn)行相應(yīng)的規(guī)律探究與信息分析,所以需要在源頭處加強(qiáng)數(shù)據(jù)收集環(huán)節(jié)以及建模環(huán)節(jié)的優(yōu)化。以醫(yī)院中醫(yī)部門(mén)為例,在對(duì)于中醫(yī)處方經(jīng)驗(yàn)的挖掘方法使用過(guò)程之中,需要針對(duì)不同的藥物進(jìn)行關(guān)聯(lián)性建模,比如數(shù)據(jù)庫(kù)中有基礎(chǔ)性藥物,針對(duì)藥物進(jìn)行頻數(shù)和次數(shù)的統(tǒng)計(jì),然后以此類推,將所有藥物都按照出現(xiàn)的頻數(shù)進(jìn)行降數(shù)排列,從而探究參考價(jià)值。建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)是醫(yī)療信息管理過(guò)程的根本,所以需要做好對(duì)于建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)的優(yōu)化,才能夠?yàn)閿?shù)據(jù)挖掘技術(shù)的應(yīng)用奠定相應(yīng)的基礎(chǔ)[2]。
2.2細(xì)化數(shù)據(jù)挖掘技術(shù)應(yīng)用類別
想要在醫(yī)療信息管理過(guò)程之中,加強(qiáng)對(duì)于數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用,就需要從數(shù)據(jù)挖掘技術(shù)應(yīng)用類別處進(jìn)行著手,從而提升技術(shù)應(yīng)用的針對(duì)性與有效性。常見(jiàn)的技術(shù)應(yīng)用類別有:醫(yī)院資源配置方面、病患區(qū)域管理方面、醫(yī)療衛(wèi)生質(zhì)量管理方面、醫(yī)療急診管理方面、醫(yī)院經(jīng)濟(jì)管理方面以及醫(yī)療衛(wèi)生常見(jiàn)病宣傳方面等,數(shù)據(jù)挖掘技術(shù)都可以在這些類別之中實(shí)現(xiàn)應(yīng)用,但是在應(yīng)用的過(guò)程之中也有所不同。以病房區(qū)域管理為例,在應(yīng)用數(shù)據(jù)挖掘技術(shù)之前,首先需要明確不同的科室狀況以及病房區(qū)域分配狀況等,加強(qiáng)病患區(qū)域的指標(biāo)分析,因?yàn)椴》抗芾聿粌H僅影響到科室的工作效率與工作效果,同時(shí)也是醫(yī)療物資分配與人員編制的主要參考標(biāo)準(zhǔn)。其次利用數(shù)據(jù)挖掘技術(shù)能夠較好地實(shí)現(xiàn)不同科室工作效率、質(zhì)量管理質(zhì)量以及經(jīng)濟(jì)收益等多種指標(biāo)的評(píng)估,建立其科室的運(yùn)營(yíng)模型,從而實(shí)現(xiàn)科室的又好又快發(fā)展。比如使用數(shù)據(jù)挖掘技術(shù)建立其病區(qū)管理的標(biāo)準(zhǔn)模型以及統(tǒng)計(jì)指標(biāo),從而計(jì)算出科室動(dòng)態(tài)的工作模型以及病床動(dòng)態(tài)的周轉(zhuǎn)次數(shù)等[3]。另外在醫(yī)療質(zhì)量管理過(guò)程之中,數(shù)據(jù)挖掘技術(shù)提供的不僅僅是資料數(shù)據(jù)的參考以及疾病的診斷,也能夠針對(duì)臨床的治療效果進(jìn)行分析與評(píng)價(jià),并且能夠預(yù)測(cè)治療狀況:可以利用醫(yī)院的醫(yī)療數(shù)據(jù)庫(kù),對(duì)于病人的基本患病信息進(jìn)行分類,從而比對(duì)死亡率、治愈率等多個(gè)數(shù)據(jù),實(shí)現(xiàn)治療方案的制訂。而在醫(yī)療質(zhì)量管理過(guò)程之中也有很多的影響因素,例如基礎(chǔ)醫(yī)療設(shè)備、病床周轉(zhuǎn)次數(shù)、病種治愈記錄等,所以也可以利用數(shù)據(jù)挖掘技術(shù)來(lái)進(jìn)一步加強(qiáng)其多種數(shù)據(jù)之間的關(guān)聯(lián)性,從而為提升醫(yī)院的社會(huì)效益與經(jīng)濟(jì)效益提出合理的參考性建議。
2.3明確數(shù)據(jù)挖掘技術(shù)的應(yīng)用方向
醫(yī)院加強(qiáng)數(shù)據(jù)挖掘技術(shù)應(yīng)用方向的探索上,可以從客戶拓展這個(gè)角度出發(fā)實(shí)現(xiàn)對(duì)于醫(yī)療信息管理。例如通過(guò)數(shù)據(jù)挖掘技術(shù)多方進(jìn)行患者信息比對(duì),同時(shí)制訂完善的醫(yī)療服務(wù)影響策略方式,加強(qiáng)對(duì)于客戶行為的分析;在數(shù)據(jù)挖掘的基礎(chǔ)之上,增強(qiáng)其技術(shù)應(yīng)用的實(shí)用性,在分析的基礎(chǔ)之上比對(duì)自身的競(jìng)爭(zhēng)優(yōu)勢(shì),實(shí)現(xiàn)醫(yī)院資源的合理規(guī)劃與合理配置,例如藥品、資金以及疾病診斷等,從而實(shí)現(xiàn)經(jīng)營(yíng)狀況的優(yōu)化。目前醫(yī)院也逐步向現(xiàn)代化、信息化方向發(fā)展,無(wú)論是信息管理還是醫(yī)療技術(shù)方面,醫(yī)院都已經(jīng)成為了一個(gè)信息化的綜合行業(yè)體系,所以在加強(qiáng)數(shù)據(jù)挖掘應(yīng)用的過(guò)程之中,還需要加強(qiáng)數(shù)據(jù)信息的管理,實(shí)現(xiàn)數(shù)據(jù)挖掘結(jié)果的維護(hù),從而提升醫(yī)院的決策能力,實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)的高效應(yīng)用。
3結(jié)語(yǔ)
醫(yī)院在目前的醫(yī)療信息管理過(guò)程之中,還有很大的發(fā)展空間,需要綜合利用數(shù)據(jù)挖掘技術(shù),實(shí)現(xiàn)其信息管理水平的提升。通過(guò)明確數(shù)據(jù)挖掘技術(shù)的應(yīng)用方向、應(yīng)用類別以及建模數(shù)據(jù)環(huán)節(jié)的優(yōu)化等,促進(jìn)醫(yī)院管理水平的提升,實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)應(yīng)用效果的提升.
參考文獻(xiàn):
[2]廖亮.數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用[j].中國(guó)科技信息,20xx(11):54,56.
數(shù)據(jù)挖掘論文篇十三
引言
近幾年,中國(guó)經(jīng)濟(jì)建設(shè)的快速發(fā)展也帶動(dòng)了水利這些基礎(chǔ)建設(shè)的發(fā)展,水利工程的增多正在逐漸改善我國(guó)的水利體系,如防洪、排水、灌溉、發(fā)電、養(yǎng)殖、旅游等,同時(shí)也反過(guò)來(lái)促進(jìn)國(guó)民經(jīng)濟(jì)更加穩(wěn)健發(fā)展。此外,為了能加快水利工程建設(shè)的發(fā)展,需要在水利工程管理上做出新的調(diào)整,以給水利工程注入新鮮血液,使水利工程起到更巨大的作用。因此,本文通過(guò)闡述數(shù)據(jù)挖掘技術(shù)的一些實(shí)施要點(diǎn),探討了數(shù)據(jù)挖掘技術(shù)在水利工程中的可行性和應(yīng)用情況。
1數(shù)據(jù)挖掘
從另一個(gè)角度看,數(shù)據(jù)挖掘是資料收集、信息化采礦等。在水利工程項(xiàng)目管理過(guò)程中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用對(duì)水利工程項(xiàng)目的管理起著重要的推動(dòng)作用。同時(shí),數(shù)據(jù)挖掘是從數(shù)據(jù)庫(kù)中發(fā)掘信息的過(guò)程(數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn))。數(shù)據(jù)挖掘的主要應(yīng)用于大量的數(shù)據(jù)的采集整理,通過(guò)搜索算法來(lái)隱藏信息的過(guò)程。同樣,在當(dāng)今的信息時(shí)代,數(shù)據(jù)挖掘與計(jì)算機(jī)和先進(jìn)的科學(xué)技術(shù)密切相關(guān),通過(guò)計(jì)算機(jī)、互聯(lián)網(wǎng)搜索、統(tǒng)計(jì)、分析、和其他方面的發(fā)展,可服務(wù)于許多行業(yè)和許多項(xiàng)目,本文借助于某市的水利工程,詳細(xì)的闡述了其在現(xiàn)場(chǎng)數(shù)據(jù)管理中的應(yīng)用情況。
2淺析數(shù)據(jù)挖掘技術(shù)實(shí)施方法
數(shù)據(jù)挖掘是以現(xiàn)有的海量數(shù)據(jù)為重要資源,采用數(shù)據(jù)挖掘引擎技術(shù),通過(guò)分析數(shù)據(jù)庫(kù)中的數(shù)據(jù),提取出最有價(jià)值的信息。
2.1相關(guān)性分析
通過(guò)數(shù)據(jù)源之間的相關(guān)性,找到所需的目標(biāo)數(shù)據(jù)和擴(kuò)展的信息,通過(guò)數(shù)據(jù)之間的聯(lián)系找到規(guī)律,以便更好地分析數(shù)據(jù)的使用情況。
2.2數(shù)據(jù)的分類與整合
為了達(dá)到對(duì)更多的數(shù)據(jù)進(jìn)行分類和整合的目的,對(duì)于沒(méi)有規(guī)律和類型的標(biāo)記數(shù)據(jù)按照相關(guān)的分類規(guī)則,以同一規(guī)則將信息匯總在一起,方便查找和應(yīng)用數(shù)據(jù),提高工作效率。
2.3堅(jiān)持預(yù)測(cè)分析
在數(shù)據(jù)源中堅(jiān)持預(yù)測(cè)分析,通過(guò)對(duì)重要數(shù)據(jù)進(jìn)行建模,對(duì)信息進(jìn)行綜合有效的分析和預(yù)測(cè),從而得出數(shù)據(jù)的發(fā)展趨勢(shì)。讓數(shù)據(jù)本身通過(guò)數(shù)據(jù)挖掘技術(shù)得出必要的結(jié)論。
2.4把握概念
通過(guò)了解數(shù)據(jù)源中所需信息的含義,總結(jié)主要特點(diǎn),并給出概念描述,使數(shù)據(jù)具有高度的清晰度。
2.5把握據(jù)偏差
數(shù)據(jù)在輸入和輸出時(shí)不可避免地會(huì)出現(xiàn)差錯(cuò),通過(guò)數(shù)據(jù)挖掘技術(shù)檢測(cè)數(shù)據(jù)準(zhǔn)確性是必要的,要找出參考值與結(jié)果之間是否存在差異,尋找一些潛在的信息,以減少數(shù)據(jù)誤差。
3數(shù)據(jù)挖掘技術(shù)在水利工程管理中的應(yīng)用出現(xiàn)的問(wèn)題
3.1部門(mén)專家觀點(diǎn)之間存在差異
在水利工程管理中使用了大量的數(shù)據(jù),特別是采煤工藝在處理大空間問(wèn)題上,加之水利部門(mén)普遍較大,且越來(lái)越多,需要與各部門(mén)協(xié)調(diào)配合工作。但不同的部門(mén)通常只負(fù)責(zé)溝通、交流的時(shí)間少,再加上數(shù)據(jù)分析技術(shù)落后于實(shí)踐,各部門(mén)使用的儀器不一樣,在數(shù)據(jù)點(diǎn)的分析上各專家持不同意見(jiàn),這將阻礙數(shù)據(jù)處理,從而影響部門(mén)之間的合作,數(shù)據(jù)非常容易干擾,從而影響整個(gè)項(xiàng)目進(jìn)展情況。
3.2與gis系統(tǒng)聯(lián)系不密切
gis在水利工程信息系統(tǒng)中占有很大的比重,是水利工程信息系統(tǒng)中不可缺少的一部分,它的主要功能是產(chǎn)生大量的空間數(shù)據(jù),空間數(shù)據(jù)的.計(jì)算、查詢和分析,以及空間數(shù)據(jù)可視化是非常復(fù)雜的,單純的依靠手工和一般信息系統(tǒng)是無(wú)法解決的,所以我們應(yīng)該充分利用gis系統(tǒng)。然而,在現(xiàn)實(shí)中,由于在這方面缺乏專業(yè)人才,充分利用原有的數(shù)據(jù)和gis系統(tǒng)以進(jìn)行有效結(jié)合,兩者一起處理復(fù)雜的空間數(shù)據(jù),現(xiàn)在還有很多事情要解決。
3.3數(shù)據(jù)挖掘模型建立不夠完善
我國(guó)的水利工程雖然已經(jīng)開(kāi)展多年,但水利工程信息系統(tǒng)的應(yīng)用還處于起步階段。如今,數(shù)據(jù)挖掘技術(shù)模型可以幫助水利工程數(shù)據(jù)挖掘的人員可以預(yù)見(jiàn)在工程設(shè)計(jì)和施工過(guò)程中存在的差距等問(wèn)題,確保水利工程項(xiàng)目按照原先設(shè)定好的方向進(jìn)展。
4實(shí)例分析
4.1概況
某水電站于1963開(kāi)始建設(shè),于1975年完工,其位于黃河中游的陜西境內(nèi),裝機(jī)容量122萬(wàn)5000kw,是新中國(guó)成立以來(lái)為數(shù)不多的達(dá)到百萬(wàn)千瓦的大型水利水電項(xiàng)目。大壩主體結(jié)構(gòu)為混凝土結(jié)構(gòu),大壩高度為147m,其電站總存儲(chǔ)容量為57億8000萬(wàn)m3。其水利項(xiàng)目主要管理內(nèi)容包括水庫(kù)管理、水閘管理、堤防管理、引水工程管理、水利工程管理等。
4.2工程管理數(shù)據(jù)挖掘模型的構(gòu)建
數(shù)據(jù)模型主要功能包括水利工程防洪、除澇、灌溉、運(yùn)輸、發(fā)電、水產(chǎn)養(yǎng)殖等,電站周邊區(qū)域的社會(huì)經(jīng)濟(jì)和農(nóng)業(yè)發(fā)展受其影響尤為巨大。在過(guò)去的發(fā)展過(guò)程中,某市的水利工程在管理和決策中,這些都是比較復(fù)雜的非結(jié)構(gòu)化決策。因此,構(gòu)建一個(gè)探索性或查詢驅(qū)動(dòng)的數(shù)據(jù)挖掘模型會(huì)給水電站的工作人員和專家在數(shù)據(jù)檢索和專業(yè)分析的工作上提供方便,使管理者在管理工作上更加的科學(xué)合理。
庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)olap和olam層(數(shù)據(jù)挖掘的核心內(nèi)容),用戶界面層。用戶界面層主要功能是管理員或用戶進(jìn)行人際對(duì)話、挖掘數(shù)據(jù)查詢、挖掘結(jié)果顯示以及數(shù)據(jù)結(jié)果輸出。
4.3數(shù)據(jù)挖掘技術(shù)與水利工程管理軟件的集成
該水利工程項(xiàng)目管理的內(nèi)容主要包括:管理水庫(kù),水閘管理、堤防管理、南水北調(diào)工程管理、項(xiàng)目管理、灌溉等方面。雖然數(shù)據(jù)挖掘有助于這個(gè)過(guò)程的開(kāi)展,水給利工程的管理提供了科學(xué)依據(jù),但如果該水利工程管理只是單單的進(jìn)行數(shù)據(jù)挖掘,這是不符合數(shù)據(jù)挖掘系統(tǒng)理論的基本思想。因此,只有在現(xiàn)有的、成熟的國(guó)內(nèi)水利工程項(xiàng)目管理成果的基礎(chǔ)上,結(jié)合數(shù)據(jù)挖掘系統(tǒng),這才是開(kāi)發(fā)水電站管理種數(shù)據(jù)挖掘系統(tǒng)的最佳方式。
國(guó)內(nèi)許多水利工程在管理和施工過(guò)程中,最常用的是gis技術(shù)軟件。gis軟件具有分析處理功能、空間數(shù)據(jù)查詢功能。gis技術(shù)軟件本身蘊(yùn)含著多樣的數(shù)據(jù)信息,如當(dāng)?shù)氐囊恍┥鐣?huì)經(jīng)濟(jì)、地形地貌、地質(zhì)、水文環(huán)境等。所以,對(duì)于水利工程管理數(shù)據(jù)挖掘系統(tǒng)的未來(lái)發(fā)展,首先要考慮的應(yīng)該是如何實(shí)現(xiàn)gis系統(tǒng)和數(shù)據(jù)挖掘理論系統(tǒng)完美銜接。
5總結(jié)
綜上所述,數(shù)據(jù)挖掘技術(shù)在水利工程管理中的應(yīng)用使我們能夠分析水利工程的數(shù)據(jù)更加的全面,這樣我們就可以充分挖掘潛在的、有價(jià)值的信息,使項(xiàng)目管理更加有效率,使工程的投入資金能被合理的利用,從而提高水電工程質(zhì)量和工作效率,降低項(xiàng)目管理成本,使水電工程發(fā)揮出最大的社會(huì)效益和經(jīng)濟(jì)效益。雖然在挖掘數(shù)據(jù)方面還存在很多問(wèn)題,但我們希望能在今后的水電工程管理中更多的去采用這種技術(shù),為項(xiàng)目管理提供更多的幫助,促進(jìn)國(guó)民經(jīng)濟(jì)的發(fā)展。
【本文地址:http://mlvmservice.com/zuowen/13667219.html】