數(shù)據(jù)挖掘技術在軟件開發(fā)信息管理中的應用論文
文章通過介紹數(shù)據(jù)挖掘技術概述,分析軟件開發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn),對數(shù)據(jù)挖掘技術在軟件開發(fā)信息管理中的應用展開探討,旨在為相關人員基于數(shù)據(jù)挖掘技術概述、軟件開發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn)的促進軟件開發(fā)信息管理有序開展研究適用提供一些思路。
數(shù)據(jù)的挖掘是一項復雜的系統(tǒng)工程,其主要指的是在龐大數(shù)據(jù)中收集有價值信息數(shù)據(jù)的過程。對數(shù)據(jù)挖掘技術在軟件開發(fā)信息管理中的應用展開研究,有著十分重要的現(xiàn)實意義。
1 數(shù)據(jù)挖掘技術概述
1.1 數(shù)據(jù)挖掘流程
通常而言,數(shù)據(jù)挖掘可劃分成四個階段,分別為選擇、預處理、挖掘以及吸收,如圖1所示。其中,選擇是就有著極強交互性的龐大數(shù)據(jù)而言的,在工作期間受信息數(shù)據(jù)不斷更新影響,通常要對數(shù)據(jù)展開重新選擇;預處理則是將沒有得到加工的信息數(shù)據(jù)變換成適宜挖掘處理的形式;挖掘是經(jīng)由科學計算方法將預處理數(shù)據(jù)輸入系統(tǒng),在龐大數(shù)據(jù)中收集有價值的信息內容,從而完成分類、聚類等工作;吸收也就是數(shù)據(jù)的后處理,其是為了將有價值的信息數(shù)據(jù)反饋給用戶,使數(shù)據(jù)預處理、挖掘環(huán)節(jié)具備真實意義。
1.2 數(shù)據(jù)挖掘技術
現(xiàn)階段,在軟件開發(fā)中數(shù)據(jù)挖掘技術諸如分析、聚類、預測及統(tǒng)計等已經(jīng)得到較好的'應用,這些技術的應用能夠使數(shù)據(jù)挖掘繁雜工程得到一定的簡化,也就是在海量的數(shù)據(jù)中盡可能快的時間內找出人們所需的信息,且對系統(tǒng)予以反饋供人們使用。在數(shù)據(jù)挖掘工程中,較為常見的技術包括關聯(lián)發(fā)現(xiàn)、分類樹、課時數(shù)據(jù)挖掘等,同時還有一些較為特殊的數(shù)據(jù)挖掘技術包括回歸建模、統(tǒng)計分析等。在軟件開發(fā)信息管理中應當對數(shù)據(jù)挖掘技術進行科學合理的選擇,以完成好軟件開發(fā)信息管理工作。
2 軟件開發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn)
2.1 軟件開發(fā)數(shù)據(jù)較為復雜
現(xiàn)階段,軟件開發(fā)數(shù)據(jù)以結構化數(shù)據(jù)和非結構化數(shù)據(jù)為主,前一種數(shù)據(jù)多牽涉軟件版本對應信息及缺陷報告等,后一種數(shù)據(jù)主要涵蓋相關軟件代碼及文檔等。該兩方面數(shù)據(jù)無法使用同一種算法,然而它們相互又有著很大的相關性。換而言之,在數(shù)據(jù)挖掘算法開發(fā)方面,為了盡可能權衡到兩方面數(shù)據(jù)的復雜關聯(lián),很大程度上提升數(shù)據(jù)挖掘難度。
2.2 分析手段并非傳統(tǒng)模式
軟件開發(fā)數(shù)據(jù)挖掘后續(xù)工作是把取得的信息提供給需要的用戶。在以往數(shù)據(jù)挖掘應用期間,就好比電子商務或者金融行業(yè),就是把信息轉化為文字或圖表。然而,軟件開發(fā)人員所需信息并非如此簡單,其還涉及了缺陷定位、編程模板等用戶信息,所以對數(shù)據(jù)挖掘技術提供較高的要求。
2.3 數(shù)據(jù)挖掘結果評價標準不統(tǒng)一
現(xiàn)如今,數(shù)據(jù)挖掘技術在諸多行業(yè)得到普及推廣,同時在結果呈現(xiàn)及評價標準等內容上相對完備。然而,在軟件開發(fā)新型管理中數(shù)據(jù)挖掘技術的應用卻并非如此。軟件開發(fā)人員要獲取諸多、繁雜的信息,且信息表示方法各不相同,如此很大程度上提升了對數(shù)據(jù)挖掘結果展開定量準確分析的難度。
3 數(shù)據(jù)挖掘技術在軟件開發(fā)信息管理中的應用
在軟件開發(fā)信息管理過程中,經(jīng)對數(shù)據(jù)挖掘技術科學合理應用,可為軟件開發(fā)帶來極有利的幫助,達到軟件開發(fā)信息管理低成本、高質量、短工期的要求,消除軟件開發(fā)信息管理期間存在的一系列問題。全面軟件開發(fā)行業(yè)在時代發(fā)展新形勢下,要與時俱進,大力進行改革創(chuàng)新,運用先進的科學技術不斷優(yōu)化數(shù)據(jù)挖掘技術研究。
3.1 數(shù)據(jù)挖掘技術在開源軟件開發(fā)中的應用
開源軟件,即源代碼為開放的軟件,此類軟件現(xiàn)階段大部分對用戶是不收取費用的,也正是受此影響提升了開源軟件控制管理難度,鑒于此,可應用數(shù)據(jù)挖掘技術來改善開源軟件的資料。就好比,日本某高校學生推出了一個分布式數(shù)據(jù)挖掘系統(tǒng),該系統(tǒng)一方面可對大型系統(tǒng)開展數(shù)據(jù)挖掘,一方面能夠一系列開源軟件開展數(shù)據(jù)挖掘。
3.2 數(shù)據(jù)挖掘技術在軟件項目管理中的應用
軟件項目管理中數(shù)據(jù)挖掘多表現(xiàn)于兩個方面,一方面為對組織關系開展的挖掘,一方面為對版本控制信息開展的挖掘。軟件項目管理作為一個系統(tǒng)工程,對組織關系開展挖掘主要是指對人力資源開展協(xié)調分配。就好比,一個龐大工程可能同時有千百余人參與,在工程運行期間人員相互會出現(xiàn)頻繁的信息數(shù)據(jù)交互,經(jīng)對數(shù)據(jù)挖掘技術的有效應用,能夠對人員組織關系展開合理劃分,積極促進軟件項目管理的有序開展。同時,數(shù)據(jù)挖掘技術還可應用于挖掘版本控制信息,能夠有效縮減系統(tǒng)維護成本,改善軟件項目管理水平。
3.3 數(shù)據(jù)挖掘技術在程序代碼及機構中的應用
在數(shù)據(jù)庫中收集有價值的代碼、構件,現(xiàn)階段,較為常用的手段包括經(jīng)由關鍵詞開展索引、經(jīng)由記錄輸入-輸出關系索引以及以建立交互關系圖為基礎的方法等,我們常常使用的百度、搜狗等搜索引擎均能夠開展數(shù)據(jù)檢索。
4 結束語
總而言之,在軟件開發(fā)信息管理過程中,經(jīng)對數(shù)據(jù)挖掘技術科學合理應用,可為軟件開發(fā)帶來極有利的幫助,達到軟件開發(fā)信息管理低成本、高質量、短工期的要求,消除軟件開發(fā)信息管理期間存在的一系列問題;诖耍嚓P人員務必要明確認識軟件開發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn),不斷鉆研研究、總結經(jīng)驗,積極促進軟件開發(fā)信息管理有序開展。
【數(shù)據(jù)挖掘技術在軟件開發(fā)信息管理中的應用論文】相關文章:
科研管理中數(shù)據(jù)挖掘技術的應用論文10-21
網(wǎng)絡營銷中數(shù)據(jù)挖掘技術的應用論文07-07
高校管理中數(shù)據(jù)挖掘技術的應用途徑論文10-28
在現(xiàn)代檔案信息管理系統(tǒng)中引入數(shù)據(jù)挖掘技術論文06-29
數(shù)據(jù)挖掘技術在科技期刊網(wǎng)站中的應用論文11-04