前言:想要寫出一篇引人入勝的文章?我們特意為您整理了旅游管理下數(shù)據(jù)挖掘運(yùn)用范文,希望能給你帶來靈感和參考,敬請閱讀。
一、旅游業(yè)數(shù)據(jù)挖掘國內(nèi)外研究現(xiàn)狀
隨著我國的旅游業(yè)的迅猛發(fā)展,旅游產(chǎn)業(yè)正邁向國際化的軌道,傳統(tǒng)旅游業(yè)積累的海量數(shù)據(jù),沒有被有效利用,資源被極大浪費(fèi)。將數(shù)據(jù)挖掘引入到旅游產(chǎn)業(yè)是大勢所趨。當(dāng)前數(shù)據(jù)挖掘在旅游信息化建設(shè)中的應(yīng)用與研究情況主要集中在高校理論界的研究,大多數(shù)研究僅僅是學(xué)術(shù)研究,真正運(yùn)用到旅游行業(yè)的文章多是從某個具體的方面出發(fā),針對個別應(yīng)用進(jìn)行數(shù)據(jù)挖掘的融合。筆者主要研究決策樹方法在旅游信息化建設(shè)中的應(yīng)用。目前,決策樹算法有CLS算法、ID3算法、C4.5算法、CART算法、SLIQ算法、Z統(tǒng)計(jì)算法、并行決策樹算法和SPRINT算法等。不同算法在執(zhí)行效率、輸出結(jié)果、可擴(kuò)容性、可理解性、預(yù)測的準(zhǔn)確性等方面各不相同??偟膩碚f,這么多決策樹算法各有優(yōu)缺點(diǎn),真正將數(shù)據(jù)挖掘運(yùn)用到整個旅游信息化建設(shè)中還有很多問題需要解決。
二、旅游業(yè)數(shù)據(jù)挖掘算法選擇
數(shù)據(jù)挖掘中常用的基本分類算法有決策樹、貝葉斯、基于規(guī)則的算法等等。其中,決策樹是目前主流的分類技術(shù),己經(jīng)成功的應(yīng)用于更多行業(yè)的數(shù)據(jù)分析。在關(guān)聯(lián)規(guī)則挖掘研究中,最重要的是Apriori算法,這個算法后來成為絕大多數(shù)關(guān)聯(lián)規(guī)則分類的基礎(chǔ)。聚類算法也是數(shù)據(jù)挖掘技術(shù)中極為重要的組成部分。與分類技術(shù)不同的是,聚類不要求對數(shù)據(jù)進(jìn)行事先標(biāo)定,就數(shù)據(jù)挖掘功能而言,聚類能夠可以針對數(shù)據(jù)的相異度來分析評估數(shù)據(jù),可以作為其他對發(fā)現(xiàn)的簇運(yùn)行的數(shù)據(jù)挖掘算法的預(yù)處理步驟。各種算法分類模型建立有所不同,但原理是大致相同的。筆者考慮決策樹算法結(jié)構(gòu)簡單,便于理解,且很擅長處理非數(shù)值型數(shù)據(jù),建模效率高,分類速度快,特別適合大規(guī)模的數(shù)據(jù)處理的優(yōu)點(diǎn),結(jié)合旅游產(chǎn)業(yè)數(shù)據(jù)特點(diǎn),故作重點(diǎn)分析。
三、旅游業(yè)數(shù)據(jù)挖掘系統(tǒng)需求分析
旅游業(yè)數(shù)據(jù)挖掘系統(tǒng)的基本特點(diǎn)如下:統(tǒng)計(jì)旅游興趣;購物消費(fèi)趨向;推薦其感興趣的旅游景點(diǎn);在后臺管理中,通過決策樹算法對游客數(shù)量、平均年齡、景點(diǎn)收費(fèi)、游客來自地區(qū)等進(jìn)行分析總結(jié),為旅游消費(fèi)者和旅游管理者提供服務(wù):為消費(fèi)者提供吃住行購?qiáng)蕵诽鞖飧鞣矫嫘畔⒉樵儭C(jī)票、車船票、酒店、景區(qū)門票、餐飲等方面的預(yù)定與現(xiàn)金支付、第三方支付、消費(fèi)者評價、在線咨詢等方面的便利、快捷服務(wù)。為管理者提供推薦、游客管理、線路管理、景點(diǎn)管理、特色服務(wù)管理、機(jī)票管理、在線咨詢管理、旅游客戶關(guān)系管理等服務(wù),提高整體服務(wù)效率和水平。
四、旅游業(yè)數(shù)據(jù)挖掘系統(tǒng)的實(shí)現(xiàn)
旅游業(yè)信息管理系統(tǒng)包括游客信息管理與游客信息分析兩個子模塊。根據(jù)系統(tǒng)日常運(yùn)行出現(xiàn)的問題及時對系統(tǒng)進(jìn)行維護(hù),如添加或者刪除某個模塊功能,系統(tǒng)整體運(yùn)行速度的更近等。系統(tǒng)運(yùn)用數(shù)據(jù)庫層、持久化層、業(yè)務(wù)邏輯層、表示層四層體系結(jié)構(gòu),主要利用ID3算法達(dá)到旅游數(shù)據(jù)信息的快速、準(zhǔn)確分類。考慮了游客與酒店之間的關(guān)系、游客與旅游路線之間的關(guān)系、游客與旅游景點(diǎn)之間的關(guān)系、游客與機(jī)票、車票之間的關(guān)系、管理員與游客之間的關(guān)系、邏輯結(jié)構(gòu)設(shè)計(jì)。程序之間的獨(dú)立性增加,易于擴(kuò)展,規(guī)范化得到保證的同時提高了系統(tǒng)的安全性。詳細(xì)功能設(shè)計(jì)包括:用戶登錄、用戶查詢、預(yù)定及支付、后臺管理、旅游客戶管理和數(shù)據(jù)分析等方面。本系統(tǒng)中主要運(yùn)用Java語言就行邏輯上的處理。系統(tǒng)主要使用Struts2和Hibernate這兩個框架來進(jìn)行整個系統(tǒng)的搭建。其中Struts2主要處理業(yè)務(wù)邏輯,而Hibernate主要是處理數(shù)據(jù)存儲、查詢等操作。系統(tǒng)采用Tomcat服務(wù)器。系統(tǒng)模塊需要實(shí)現(xiàn)酒店推薦實(shí)現(xiàn)、景點(diǎn)推薦實(shí)現(xiàn)、天氣預(yù)報實(shí)現(xiàn)、旅游線路實(shí)現(xiàn)、特產(chǎn)推薦、數(shù)據(jù)分析展現(xiàn)功能、報表數(shù)據(jù)獲取、景區(qū)客流量變化分析實(shí)現(xiàn)等。需要進(jìn)行后臺信息管理等功能測試以及時間測試、數(shù)據(jù)測試等性能測試。
五、旅游業(yè)數(shù)據(jù)挖掘算法方案中存在的一般性問題及其改進(jìn)
在對數(shù)據(jù)挖掘的基本方法與技術(shù)進(jìn)行總結(jié)的基礎(chǔ)上,結(jié)合當(dāng)今數(shù)據(jù)挖掘的發(fā)展方向和研究熱點(diǎn),可以發(fā)現(xiàn)旅游業(yè)數(shù)據(jù)挖掘算法系統(tǒng)有待進(jìn)一步完善之處:訂票系統(tǒng)尚待完善。界面美化需要進(jìn)一步改進(jìn)。數(shù)據(jù)表之間的結(jié)構(gòu)關(guān)系需要優(yōu)化,以提高數(shù)據(jù)處理能力和效率。數(shù)據(jù)挖掘工具及算法有待精細(xì)化改進(jìn)。
作者:朱暉 單位:河南職業(yè)技術(shù)學(xué)院