前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數據分析課程主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞 情境認知 數據分析 教學探究 分析方法
中圖分類號:G424 文獻標識碼:A
在傳統的數據分析教學研究中,人們總是試圖走通兩條道路,一條是做好理論假設,帶著理論去研究實踐;另一條是從大量的實踐研究中提升理論。結果往往是走第一條路的研究者將實踐“形式化”、“刻板化”;而走第二條路的研究者則往往將教育研究“簡約化”,從一線實踐中獲得的豐富經驗非但沒有上升到理論,反而在理論“提升”的過程中將大量的“經驗”過濾掉了。數據分析課程教學是建立在數學學科基礎上的,整個教學過程就是學生在一個“宏情境”中,獨立地識別問題、提出問題、解決真實與復雜的數學問題的全過程。無論是教師在課堂中的角色、課堂中教學策略的運用、數學學習與其它學科的整合,還是學生所要解決問題設計的層次性,都具有較強的科學性和目的性。情境認知學習理論是20 世紀80年代中后期形成的重要的學習理論,上世紀90年代之后,情境認知理論開始滲透到教育研究的各個領域。情境認知學習理論認為,學習的實質是個體參與實踐并與他人、環境等相互作用的過程,是個體形成實踐活動的能力、提高社會水平的過程。①國內外學者對情境認知與學習的教學模式的研究碩果累累,可對在數據分析課程中運用的研究目前作者沒有看到相關的文獻?;跀祿治稣n堂教學的本質特點,我們的課堂教學研究如何做?如何使情境認知學習的教學模式研究真正走進數據分析課程教學?圍繞這些問題,筆者從下面五個方面來探究數據分析的教學過程。
1 選取經典案例,引起學生對數據來源與背景分析的重視
數據不等于數字,數據是具有內涵的數字,它隱含著人們事先不知道但又有用的信息。作為一個數據分析學習者,解決問題的時候必須考慮數據的來源與背景,下面的故事充分說明了數據來源的重要性(讀者.2005.22)。一天,喬治在刪除垃圾電子郵件時發現了一個標題:驚人的足球杯預測。他好奇地打開了它:親愛的球迷,我們的統計學家已經設計出了準確預測足球比賽的方法,今晚英國足球杯第三場比賽是考文垂隊對謝菲爾隊,我們以0.95的概率預測考文垂隊獲勝。喬治看后一笑。晚上考文垂隊果然獲勝。三周后喬治又收到了那人的郵件:上次我們成功地預測了考文垂隊獲勝,今天考文垂隊要和米德爾斯堡隊相遇了,我們以0.95的概率預測米德爾斯堡隊獲勝??嘉拇龟爮娪趯κ?,那天晚上卻發揮不好,雙方打成平手,但在加時賽上米德爾斯堡隊奇跡般地獲勝了,喬治心中一震。一周后,那人的電子郵件預測米德爾斯堡隊將敗給特倫米爾隊,結果果然如此。接下來的四分之一決賽前,那人的郵件預測特倫米爾隊勝陶頓亨隊,結果也是如此,四次預測都成功了,喬治大吃一驚。喬治再次收到電子郵件:現在你大概知道了我們的確能夠預測比賽的結果,實際上我們買斷了一位統計學家的研究專利,能夠以0.95的概率預測足球比賽的正確結果。今晚的半決賽中,我們以0.95的概率預測阿森那隊打敗伊普斯維爾隊。晚上阿森那隊在比分落后的情況下分歧直追,最終獲勝。第二天,電子郵件又來了:我們已經五次預測成功,現在希望和你做一筆交易,你支付200磅,把一個月內所關心的比賽和球隊告訴我們,我們將以0.95的概率為你預測勝負。200磅不是小數目,但是如果能預知結果,就可以從彩票商手中賺回20萬。喬治心中盤算:如果發郵件的人只是猜測勝負,則5次都猜對的概率僅為2-5 = 0.0313,于是以0.9687的概率否定他是在猜測,于是支付了200磅。實際上這些騙子先發出8000封電子郵件,一半預測甲勝,一半預測乙勝,于是有4000人得到正確的預測,第二次只給上次得到成功預測的4000人的發電子郵件,依次類推,五次預測以后得到8000/25 = 32人,如果這250人中有100人付錢,就可以騙到20000磅,喬治就是其中一個。
關于美國選舉的例子:誰會在1936選舉中獲勝,蘭登還是羅斯福?《文學文摘》送出一千萬份問卷(返回二百四十萬份)后,預測蘭登會贏;而蓋洛普只問了五千人說羅斯福會贏。最后羅斯福和蓋洛普贏了,《文學文摘》倒閉了。為什么出現這樣的結果,究其根源在于數據的來源。通過類似這些情境的設置,使學生意識到要想準確地進行數據分析,必須重視數據的來源與背景。②
2 講解各種數據分析方法時要提供豐富的有意義的情境
學習的情境對提高知識的遷移非常重要,研究表明:復合而豐富的學習情境更有利于學習遷移的產生。在單一情境中被傳授的知識與在復合情境中被傳授的知識相比不利于產生靈活遷移。在復合情境中,學生更有可能去概括方法的相關特征,形成對知識更靈活的表征。然而當一個問題是在復合的情境中講授,并帶有演示其廣泛應用的例子時,人們就更有可能分離出方法的相關特征,并形成知識的靈活表征。③比如在講解主成分分析時可以舉例:如何理解不同機構得出的大學排名結果?如何對學生成績進行綜合評價?如何理解各地的經濟排名等等。從而引申出主成分分析是在降維的思想下產生的處理高維數據的統計方法。通過構造原變量的適當的線性組合提取不同信息,主成分分析著眼于考慮變量的“分散性”信息。再比如,在講解判別分析時可以舉例:信用問題中,如何根據公司的財務和商業資料來判斷一個公司的信用等級?工業中,如何根據產品的一些測量指標判別產品的質量等級?經濟學中,如何根據人均國民收入判斷一個國家的經濟發展程度?醫學診斷中,如何根據病人的化驗結果和病情征兆判斷病人患哪種疾???氣象學中,如何根據已有的氣象資料判斷未來的天氣情況?地質勘探中,如何根據地質結構、化探和物探的各項指標來判斷該地的礦物類型等等。從而引申出判別分析處理的問題往往包含較大量的數據資料,且其數量指標往往是多元的。判別分析是一種有效的多元數據分析方法,它能科學地判斷樣品的類型,在紛繁的數據中揭示內在的規律,使人們對所研究的問題做出正確的判斷。④在生產、科研和日常生活中,我們經常會遇到各種各樣的問題,這為各種數據分析方法提供了豐富的情境,在課堂教學中要加強情境的供應。
3 理論方法的講解要與情境認知有機結合起來
理論與應用并重,既要重視理論方法,也要重視應用模型解決實際問題。如何由情境問題恰當地歸納出數據分析的理論方法,再將數據分析方法正確地應用到實際中,是我們教學中必須高度重視的問題。對于理論方法,重點是思路,同時要注意各種分析方法的相互關系及綜合運用。比如相關分析和回歸分析是研究現象之間相關關系的兩種基本方法。所謂相關分析,就是用一個指標來表明現象間關系相互依存的密切程度,相關是解決客觀事物或現象相互關系密切程度的問題,回歸則是用函數的形式表示出因果關系。在醫學上,許多現象之間都存在著相互聯系,例如身高與體重、體溫與脈搏、年齡與血壓、釘螺與血吸蟲感染等。而有些事物的關系是互為因果的,如上述釘螺是因,感染血吸蟲是果;但有時因果不清,只是伴隨關系。例如父母的兄弟,兄高,弟也可能高,但不能說兄是因、弟是果,這里不是因果關系,而可能與社會條件、家庭經濟、營養、遺傳等因素有關。
4 將情境認知教學模式運用到軟件教學中去
數據分析這門課程除了要讓學生掌握必要的理論知識外,還要培養他們運用相關軟件在計算機上進行統計分析的能力。數據分析涉及大量數據的處理工作,需要借助統計軟件完成,學軟件的最好方式是在使用中學。2013年10月我院學生赴上海參加了“2013年中國高校SAS數據分析大賽”上海賽區的初賽,這次比賽充分帶動了學生學習的積極性,比賽所起到的推動作用遠遠高于一般實驗所起的作用,所以我們通過縮減驗證性實驗次數,增加綜合性實驗次數,給學生一些與實際生活密切相關的問題,讓學生自己去面對問題,包括數據搜集、數據處理、數據分析、圖表分析、問題結論分析等內容,進行實驗教學改革。實驗結束后通過班級比賽、院系比賽、學校比賽、全國比賽層層選拔的方式,激勵學生學習及檢查學生學習的效果,使學生意識到自己的不足,查漏補缺,從而帶動學生學習的積極性。通過這種教與練相結合的方式,學生不僅能較好地掌握各種數據分析方法的分析過程,加深對基本理論的理解,還增強了學習的興趣、信心和分析解決問題的能力。
5 將情境認知教學貫穿于輸出結果的分析與解釋中
情境認知教學模式要求學生在教師的指導下,通過自己的努力發現問題、分析問題和解決問題,這個過程不僅是知識的運用, 更主要的是能力的培養, 要學會分析問題的思路和解決問題的方法。學生在教學過程中的角色也要從聽話轉變為對話,這種轉變對于學生探究意識和創新能力的培養是非常有利的。在數據分析課程中,理論知識的傳授和實驗能力的培養歸根到底都是為了解決實際問題,各種軟件輸出的結果只能是數字或圖表,要想解決實際問題,學生必須對輸出結果進行分析、解釋,因此必須培養學生合理解釋所得到結果的能力。為了培養學生的這種能力,教學中我們經常組織學生進行討論,比如在對主成分分析的結果進行解釋時,首先從學生關心的問題開始,讓他們對輸出結果進行討論,在引起學生興趣的同時加強輸出結果模式的解釋,在其間采用引導、啟發的教學方式讓學生的思考逐步向準確答案靠近,然后逐步轉向理論化的問題。通過課堂討論不僅可以調動學生的思維,活躍課堂氣氛,而且可以在潛移默化中培養學生對所得數據結果進行合理解釋的能力。⑤
情境認知教學模式對培養學生的綜合能力、形成理論與實踐相結合的知識結構具有非常重要的作用。因此在數據分析課程的教學中要充分運用情境認知教學模式,在真實、互動的情境中學習,必定比傳統的課堂教學來得生動有趣,而且能靈活應用。
注釋
①③王文靜.基于情境認知與學習的教學模式研究[D].華東師范大學,2002.
② 黃奇杰,蔡罕.社會調查方法概論[M].杭州:浙江大學出版社,2007.8.
關鍵詞:創新實踐課程;項目驅動;大數據
中圖分類號:G642 文獻標志碼:A 文章編號:1673-8454(2017)04-0022-03 一、引言
隨著高等學校工科教學改革的深入,各大高校高度重視培養學生的創新意識和創新能力。創新實踐課程是順應當前高等工程教育改革與發展所提出的一門新型課程,關注于訓練學生的科學和創新思維,增強解決工程實際問題的能力。
全國各大高校針對不同的專業,開設了多門創新實踐課程[1][2][3]。不同于傳統課程,它具有形式靈活、小班化教學等特點,要根據實際需求靈活設置授課內容。為了加強學生的創新精神和實踐能力,提高人才培養質量,杭州電子科技大學在計算機專業面向大二學生開設了創新實踐課程。任課教師根據自身的學科背景,基于社會熱點需求問題,申報課程要完成的課題內容,再通過師生間的雙向選擇,組建授課班級。
隨著大數據時代的到來,大數據產業發展對培養高層次的數據科學人才提出了新的需求[4]。在未來3-5年內,我國數據分析師的缺口將達100萬人左右[5]。但是,目前國內高校對數據型人才的培養規模和質量還遠遠達不到要求。本文研究了在創新實踐課的教學過程中,以培養大數據可視分析人才為目的,探討如何設置理論授課與項目實踐環節,通過解決實際問題,提高學生的創新意識和創新能力。
二、 創新實踐課題的選擇
大數據可視化與可視分析是大數據分析中重要的組成部分,通過有機融合人的智能與計算機的處理能力,幫助人們洞悉大數據背后的知識與智慧,已經成為數據分析和科學決策的有效手段?;趥€人的專業背景和研究方向,筆者選定以大數據可視分析作為創新實踐課題,主要基于如下考慮:
(1)對于本科學生來說,可視分析中采用直觀的圖形化表示、所見即所得的交互方法,更容易激發他們的學習興趣,不會覺得枯燥難懂。
(2)該課題與社會熱點緊密結合,社會對該類人才需求較大。學生若能掌握并運用相關知識來解決實際問題,對更好地就業有很大幫助。
(3)數據分析與實際項目緊密結合,而尋找數據內部蘊含的特征又具有未知性,需要學生具有創新意識和探索精神,正好和創新實踐課程的設置宗旨不謀而合。 三、課程教學內容與實踐形式設置
與傳統的僅采用理論教學的授課模式不同,筆者將創新實踐課程劃分為理論授課和項目化實踐兩個部分。首先講解基礎理論,讓學生了解課程目的及課程實施過程。然后通過項目化的課程設計培養學生工程意識,提高綜合運用知識來解決實際應用問題的能力。
1.理論授課內容
理論授課是讓學生了解和熟悉課題的前提?;诳梢暬治龃蟮臼~母鞲霾街瑁細分授課內容,將數據分析過程拆解并貫穿于整個教學中,為解決實際問題提供理論保證。
具體來說,包括如下幾個方面:(a)大數據的概念:包括大數據出現的歷史;大數據的特征;大數據與其他學科的關聯;大數據時代面臨的挑戰等。(b)數據可視分析的案例介紹:介紹數據可視分析成功用于解決實際問題的典型案例,從案例的實際需求出發,通過描述案例的主要目的和設計思想,介紹案例采用的具體方法,指出完成過程中遇到的關鍵問題,幫助學生理解課程學習的價值所在。(c)數據可視分析所要掌握的關鍵技術:包括數據存儲和管理技術,數據可視化展示語言、人機交互技術等。
由于課程學時所限,在授課過程中,需要不斷引導學生利用課外時間,進一步學習和鞏固相關編程技術,為實施項目化的課程設計打好基礎。
2.以項目為驅動的實踐環節實施
在理論授課的基礎上,實踐環節是培養學生創新能力最重要的步驟。只有讓學生在參與完成某一具體任務的過程中,才能深化其對數據可視分析流程的理解,主動學習相關知識,提高動手能力,不斷地探索并解決未知的問題。
在實踐階段,納入項目化的教學模式,將學生組成創新研究小組,通過“分組――選題――制定和實施方案――撰寫分析報告”的實踐過程,鼓勵學生開展自主式、探索式、合作研究式的學習,促進知識的遷移和科學思維的養成,同時培養學生的團隊協作精神。
具體來說,分為如下幾個步驟:
1)合理進行人員分組。一個復雜的數據分析任務要求學生以團隊合作的形式來完成,讓學生根據各自的技術優勢,合理分組,每個小組選出一個小組長,組員通過分工與合作實現既定目標。
2)選取有價值的分析任務。以“交通大數據可視分析”為主要目標,通過小組討論擬定感興趣的分析子任務,由教師進行內容把關。要求所選取的項目任務具有一定的復雜度和綜合度,可以從數據分類、趨勢預測、歷史規律挖掘等方面著手,明確要研究的主要問題和預期的分析目標。
3)制定和實施分析方案。要求學生設計詳細的實施方案,考慮方案的可行性和合理性,主要包括:分析目的及內容,方法及步驟,計劃進度安排,如何分工等。在該過程中,教師指導學生檢索和閱讀科學文獻,一起討論采用何種技術或方法分析數據,引導學生逐步實現項目任務。在學生碰到問題和困難時,鼓勵其通過自主學習所需知識、與小組成員討論,與指導老師探討來解決問題。
4)完成分析報告。以小組為單位,完成分析報告,闡述分析任務的執行流程,人員分工情況,給出分析結果,并討論分析方法是否合理及未來的改進建議。
5)課程考核。課程考核結合教師評價(50%)、小組間互評(30%)、組內自評(20%)多種方式綜合給出課程分數。
在以項目為驅動的實踐過程中,教師的任務從“傳授知識為中心”逐漸向“引導學生探索知識,有體系、有目的地應用知識”轉變,學生成為了學習的主體和發展者,極大地調動了學生的積極性和參與度,培養了學生的團隊協作精神和創新能力。
四、教學效果及存在問題分析
本課程自開課以來,取得了一定的教學效果。授課班級共有14人,其中有2位學生在老師的指導下將項目的實施成果,整理成在計算機相關的學術會議上,有1位學生申請了發明專利。
為了更好地收集大多數學生的反饋意見,在課程結束后,讓學生投票選擇自己在哪方面的能力有所提高,并撰寫一份學習心得。投票結果為:編程能力(11票);團隊協作能力(9票);創新和探索能力(8票);自主學習新知識的能力(13票);完成實際工程的能力(10票)。從結果中發現,大多數學生認為通過課程學習能提高自己多方面的能力,包括自學、編程和工程實踐能力。部分學生認為提高了自己的創新和探索能力、團隊協作能力,這部分學生相對基礎較好,能夠針對分析任務得出自己的結論。而其他有些學生基礎知識儲備不足,還處于不斷學習編程技術的階段,因此對問題的探索不夠深入。
圖1和圖2分別為從學習心得中提取的中英文詞云。從圖1中發現,大多數學生描述了對數據可視化的學習,掌握了“技術”,得到了“信息”和“知識”,其他關鍵詞包括“分析”,“學會”,“理解”,“實現”,“任務”等。從圖2中可以看出學生實現項目時所采用的主要技術,這表明學生在上課過程中,根據實際需求自學了解決問題所用到的相關技術。下面摘取了部分學生的心得。學生1:“通過課程學習,我意識到事情有很多方法去解決,一個方法不通,還有其他的解決方法”;學生2:“集體的力量是無窮的,好的隊友是成功的一半,和大家一起做事情,能從別人身上學到自己沒有的”;學生3:“在這門課程上學到的東西比其他任何課程都要多,更有用”;學生4:“在后半學期,經過老師的提點,自己慢慢摸索,再加上同學的幫助,一個個任務難題漸漸被解決,我也逐漸有了繼續探索的動力。”從上述反饋來看,正是通過項目化的實踐,潛移默化地提高了學生的自主學習能力和探索未知的精神,培養了學生的綜合能力。
但是作為一門新型課程,課程在實施過程中遇到了一些問題,具體表現為:
(1)由于不同W生的學習效率與動手編程能力存在差異,因此部分學生進展較快,能針對項目制定方案,設計新的可視化表示來展示數據特征,探索數據規律。而部分學生始終處于編程技術的學習階段,影響到課程完成質量。
(2)本課程面向大二學生,雖然數據可視分析入門較快,但解決實際問題時涉及多種專業技術的學習與應用,部分學生感覺到知識儲備不足,項目實踐有難度。
因此在今后的教學過程中,應事先做好摸底調研工作,針對不同學生進行層次化教學,同時要進一步研究如何更好地激發學生的學習熱情,鼓勵他們在遇到困難時勇于克服困難。
五、結語
隨著高校工科教育改革的深入進行,創新實踐類課程對傳統的理論教學進行了很好的補充。課程對培養學生創新意識、解決實際工程問題能力起到積極作用。本文針對作者所承擔的計算機專業的創新實踐課程,圍繞數據可視分析人才培養展開,深入研究了課程理論教學內容的設置、項目化實踐的實施模式,同時也分析了目前課程取得的效果和存在的問題。由于該門課程開設時間較短,還處于探索階段,接下來要進一步完善目前的理論教學體系,研究層次化的教學方案,通過總結經驗,應用于新一輪的教學。
參考文獻:
[1]黃雪梅.圍繞機電實驗平臺的創新實踐課程[J]. 實驗室研究與探索,2011,30(3):140-144.
[2]陳妙,陳敏,余日安,等. 公共衛生創新實踐課程的構建及作用探討[J]. 基礎醫學教育, 2014(12):1031-1033.
[3]汪東風,林洪,曾明滂,等.創新實踐課程的實施步驟[J]. 實驗室研究與探索, 2009,28(3):107-109.
關鍵詞:Access數據庫;考試質量分析系統;數據表
中圖分類號:TP319 文獻標識碼:A 文章編號:16727800(2013)003010602
0 引言
考試質量分析系統主要用于班級的課程考試質量分析,由系統分析而得出的結果反饋到任課教師及教學主管部門,作為改進教學方法、提高學生學習成效的重要依據,從而改進課程教學質量。同時,應用過程所產生的數據也可以作為其它教學質量分析系統的基礎數據。
1 考察指標設置及系統功能
考試質量分析系統所設置的考察指標應當能正確地反映班級本次考試的實際情況及質量狀況,因而設置的主要考察指標為:考試人數、最高分、最低分、平均分、及格率,還有卷面各分數段成績人數分布狀況及比率等。因此,考試質量分析系統應具備的主要功能及完成的任務如下: ①輸入各學生的成績,統計考試人數,篩選出最高分及最低分,計算平均分和及格率;②按分數段分類統計人數,計算出各分數段人數的百分比;③寫出評語。
構建考試質量分析系統的重要一點就是要做到:只需一次輸入學生的成績,其它所有數據均由電腦計算完成。
根據上面的各項要求編制考試質量分析報告如表1所示。
本系統的數據量不大,而由于Access數據庫系統具有界面友好易操作、開發成本低廉、面向對象的開發環境集成各種向導和生成器工具且功能強大、工作效率高、支持ODBC(開發數據庫互連)等一系列優點,故本系統使用Access數據庫系統開發。
2 基本數據表設定
根據考察指標的設置以及對系統主要功能的分析,本系統的數據庫結構設計采用兩個數據表:主表――考試質量分析,副表――成績,分別如表2、表3所示。
3 系統構建及功能實現
(1)建立“成績輸入窗口”,將其與“成績”數據表聯系,使用“成績輸入窗口”輸入學生考試成績(圖1)。
(2)使用選擇查詢的方法,從“成績”數據表中篩選出最高分、最低分、平均分、及格率、90~100分、80~89分、70~79分、60~69分、45~59分、45分以下的人數(圖2),并計算出各分數段人數比率等各項數值(圖3),然后使用“追加查詢”(圖4)及宏(圖5),將數值填充到主表“考試質量分析”的相應單元格中。以上僅是簡略分析,大量的建立查詢、建立并使用宏將各查詢鏈接啟動的工作,限于篇幅,不再詳述。
(3)建立系統的主窗口,如圖6所示,窗口與主表“考試質量分析”相聯系,上面設有各功能按鈕,并使用宏將各相應功能賦予各按鈕。
4 系統運行
本系統設置了兩種輸入方式:“手動輸入” 和 “導入外部數據”方式,本系統運行時要首先選擇輸入方式,若選擇“手動輸入”方式,則在系統的主窗口中單擊“輸入成績”按鈕,在彈出的“成績輸入窗口”輸入成績,輸入完畢,返回主窗口,然后單擊主窗口上的“數據刷新”按鈕,各項數據即通過后臺的查詢及宏的運行,填充到主窗口上的各單元格中。主窗口上的“打印”按鈕已設置了宏,單擊“打印”按鈕即可啟動打印機得出結果。因為在主表“考試質量分析”的相應字段設置“顯示控件 行來源類型”中,使用了“組合框 值列表”方式,或使用了“組合框表/查詢” 方式,預先輸入了各課程名稱、班級名稱、任課教師字段的值,所以在主窗口的課程名稱、班級名稱、任課教師等字段值的輸入中,使用下拉方式選擇即可。
5 結語
本系統界面友好、操作方便,設置了兩種輸入方式: “手動輸入” 和“導入外部數據”方式,“手動輸入”方式上面已做了介紹,“導入外部數據”方式,主要是利用數據庫系統的導入外部數據技術,導入Excel電子表格等形式的數據,限于篇幅,不再介紹。本系統只使用查詢及宏即可完成復雜的數據處理及各種鏈接功能,未使用到VBA,方便設計及檢查且只需一次輸入考試成績分數,即可得出所需的全部數據,方便快捷。經本系統處理后的數據結果能較好地反映考試的質量狀況。另外,利用數據庫技術亦可以將數據導出為Excel電子表格形式,供其它軟件使用。
參考文獻:
\[1\] 肖瑛,周琦.考試制度在高校人才培養系統中的地位――高校教學改革的理論前提研究\[J\].湘潭大學社會科學學報,2003(6).
關鍵詞: “數據結構與算法分析” 課程群 分層實踐 分段管控
課程群是對教學計劃中有相互影響、互動、有序、相互間可構成完整的教學內容體系的相關幾門課程組成一個課程間相互連接、相互配合、相互照應的課程群體[1]。2014年提出建設程序開發類課程群,包括C語言程序設計、C++程序設計、數據結構與算法分析、JAVA程序設計、web程序設計、組件開發技術、軟件設計模式七門課程。其中“數據結構與算法分析”課程在整個課程群具有承上啟下、舉足輕重的地位,決定程序開發類課程群的成效。
一、“數據結構與算法分析”課程的現狀
1.課程理論性強,難度大。
調研發現:非計算機專業近80%的學生都感覺課程難,即使計算機專業的有近50%的學生,感覺該課程難學,這種畏懼思想影響學習興趣。
2.先導課程掌握不扎實,課程推進困難。
教學計劃中C++程序設計、實踐和該課程分別安排在第2和第3個學期。暑假將兩門課割裂了,造成是否介紹先導課的困境。
3.學生動手水平參差不齊,單一的實踐安排難以滿足不同的需求。
目前,課程的實踐安排對所有的學生相同,對于動手強的學生可能在寢室就完成題目,而對編程能力不強的學生可能根本不知該如何下手,久而久之學生就失去開發熱情。
4.課程管控不足,課程考核不能反映學生的真實水平。
目前課程的評定以卷面成績為主,實踐證明有些學生根本不會寫代碼但他卻能拿到很高的分數。
二、教學改革措施
1.課程群中相關課程開課時間的精細化安排。
(1)開課時間安排。
C++程序設計包括64上課課時和16實踐課時,將C++課程實踐調整到第3學期第1周上,而數據結構與算法分析課程從第2周以后開始上,這樣就將兩門課緊密地銜接起來。這種一門課程一分為二的方法促進了C++課程,同時也保證“數據結構與算法分析”課程的順利進行。
(2)教學內容及學時分配。
為呼應課程群中的后續課程,該課程內容是貫穿程序設計、軟件設計模式的思想和觀點。該課程采用面向對象和抽象數據類型觀點介紹數據結構,集中體現分解、抽象和信息隱蔽的基本原則,抽象數據類型是中樞,展示信息結構轉換的三個重要階段:數學模型、抽象數據類型、數據結構與算法。其理論教學環節的安排為:數據結構的基本概念(2),表、棧和隊列(6),樹(8),散列(4),優先隊列(7),排序(12),不相交集(4),圖論算法(7),算法設計技巧(4),攤還分析(4),高級數據結構(6);課內實踐的安排:棧和隊列(2),表達式樹(2),散列、優先隊列(2),排序(2),不相交集(2),深度優先搜索應用(2),貪心、分治算法(2),AA樹、treap數(2)。
2.課堂教學模式改革
(1)注重啟發式教學,建立自主學習、合作學習相結合的教學模式。
為強調思維訓練,采用講、做穿插的授課方式,教師采用示例案例授課時學生采用自主學習模式,是教-做-答疑的互動、有反饋方式。它強調教中實踐、實踐中思考、交流中提升;自主學習完后各小組通過“以強帶弱、以老帶新”的方式合作完成綜合實踐作業。
具體講解時,(1)首先引入案例,然后給出C++實現的方法,最后詳細展開相應數據結構及操作實現;(2)一題多解、一題多語,如對同一問題采用不同的數據結構實現方法,對比講解,多語言實現為拓展作業;(3)難點分散,如將棧與非遞歸處理技術分別在棧、二叉樹非遞歸算法、快速排序與歸并排序的非遞歸算法等多處講解;(4)圖示講解和動畫展示相結合。
(2)標準化教學與微課程教學模式相結合。
為了確保課程的可持續發展,課程采用項目組集體備課、集體討論、分頭準備的方式。課程組骨干教師經過多次討論后修訂了課程教學大綱,形成了標準教案、PPT及算法演示視頻。為充分利用學生的課余時間,采用課程微課程化,微課視頻一般10分鐘左右[2],選擇與生活比較貼近的數據結構(比如棧、隊列等)和基礎實踐內容微課化。
3.項目驅動的分層實踐教學模式研究。
教育心理學家發現:學習是累積性的,較復雜、較高級的學習是建立在基礎性的學習基礎之上的[3]。因此,課程的實踐教學以貫穿課程群的項目進行驅動,提出“注重基礎、綜合應用、提高創新”的三層次實驗教學模式,以基礎、設計、綜合三個方面的實踐能力培養為中心,全方位地培養學生的動手能力和創新能力。
基礎類實踐通常是對教材上所涉及的數據結構及相關操作進行上機驗證,要求學生掌握相關數據結構,提高學生的軟件設計規范化能力。這類實踐通常在介紹完相關知識后以課程作業的方式發放,要求學生在規定時間內完成,教師以晚自習的形式進行個別指導;設計類實踐要求學生對給定的題目進行數據結構的設計及算法實現,題目是從貫穿課程群中的項目案例中切割出來的。實踐中我們鼓勵學生一題多解,并分析不同解的時、空代價。這類實驗通常是課程內實驗題目,要求每個學生獨自完成,教師全程指導、重點考核;綜合類實踐是對C++實踐課程中學生已完成題目的重新設計,以小組為完成單位,人員分組原則上是C++實踐的人員分組。該類實踐培養學生分析、設計實際項目的能力和創新能力。教師對有強烈要求的學生通過答疑的方式進行指導。各小組完成后需要進行結題答辯,答辯中教師會對完成情況進行評價,從而引出后續課程。
4.課程考核與過程控制。
我們采用分段控制的多元化實踐考核方式:期末機考30%+基礎實踐20%(程序代碼+報告+隨機面試)+設計實踐40%(課前準備材料+完成代碼+報告)+綜合實踐10%(報告+答辯)。考核方式強調對課程的過程監控,基礎實踐的每一次完成情況能夠給教師提供重點監控的學生名單,通過晚自習的重點指導確保學生弄懂相關知識點、順利進行實踐課任務,為保證設計實踐課的完成質量,要求學生在課前精心準備并提交準備材料。綜合實踐強調以強帶弱,最后通過總結引出下一門課程,從而保持學生長久的學習動力。
三、結語
數據結構與算法設計是程序開發類課程群中最重要的一門課程,其成敗直接決定整個課程群的成敗。在不影響其他課程下的課程群開課時間微調保證課程的順利進行;創新的教學課堂模式激發學生自主式、探索式學習;項目驅動的實踐模式將課程群中的課程更緊密地結合起來;分層的實踐教學滿足不同層次學生的需求;教學過程的管控進一步確保教學的順利推進。該課程改革對課程群中其他課程改革有積極的作用。
參考文獻:
[1]馬賽,李方能,吳正國,卜樂平.《信號與系統》課程群的建設與教學改革探索[J].高等教育研究學報,2010.3.
[2]梁樂明,曹俏俏,張寶輝.微課程設計模式研究—基于國內外微課程的對比分析[J].開放教育研究,2013,19(1).
[3]哈斯.《數據結構》課程中使用逐步演示法進行算法教學的實驗研究[D].呼和浩特:內蒙古師范大學,2007.
關鍵詞:可疑值;3s法;Dixon法;Grubbs法
在水質分析時,異常值可能是因為各種隨機誤差的影響,也有可能因為其他因素。對可疑值的處理,可通過一些方法進行統計檢測。本文列出了三種方法,下面對這三種方法分別做出討論。
1 拉依達法
由于該方法是以3倍標準偏差作為判別標準,所以亦稱3倍標準偏差法,簡稱3S法。
適用條件:當測量數據較多時,且成正態分布時可選用此方法。
檢驗方法:檢測公式|x-xd|>3S (1)
x:樣本平均數xd:可疑數據S:樣本標準偏差,若xd滿足(1)式,則為離群值,應舍去。
取3S的理由:根據隨機變量的正態分布規律,在多次試驗中,測量值落在xd-3S與xd+3S之間的概率為99.73%,出現在此范圍之外的概率僅為0.27%,也就是在近400次試驗中才能遇到一次,這種事件為小概率事件,出現的可能性很小,幾乎是不可能。因而在實際試驗中,一旦出現,就認為該測量數據是不可靠的,應將其舍棄。
另外,當測量值與平均值之差大于2倍標準偏差(即|x-xd|>2S)時,則該測量值應保留,但需存疑。
方法優點:拉依達法簡單方便,不需查表,但要求較寬,當試驗檢測次數較多或要求不高時可以應用,當試驗檢測次數較少時(如n
2 Dixon法
適用條件:用于一組測量值的一致性檢驗和剔除離群值,本法中最小可疑值和最大可疑值進行檢驗的公式因樣本的容量(n)不同而異。
檢驗方法:(1)將一組數據從小大大排列為X1,X2,X3,…,Xn,X1和Xn分別為最小和最大可疑值;(2)按下表1求Q值。(3)通過顯著性水平以及n值,查出Q值。若Q≤Q0.05,則可疑值為正常值;若Q0.05Q0.01,則可疑值為離群值。
方法優點:相對比較嚴密,對一組數據中只有一個可疑值存在時較為適用。
注意問題:用該方法剔除一個可疑值時,若剩余數據還有可疑值存在,經過檢驗又被剔除,則說明該方法對此組數據檢驗存在誤差,不能再使用此方法,可使用Grubbs法。
表1 Dixon檢驗法計算公式和臨界值Qn表樣本數n 統計計算公式 顯著性水平(α)
檢驗最小異常值 檢驗最大異常值 0.10 0.05 0.01
3 Q Q 0.886 0.941 0.988
4 0.679 0.765 0.889
5 0.557 0.642 0.780
6 0.482 0.560 0.698
7 0.434 0.507 0.637
8 Q Q 0.579 0.554 0.683
9 0.441 0.512 0.635
10 0.409 0.447 0.597
11 Q Q 0.517 0.576 0.679
12 0.490 0.546 0.642
13 0.467 0.521 0.615
14 Q Q 0.492 0.546 0.641
15 0.472 0.525 0.616
20 0.401 0.450 0.535
25 0.360 0.406 0.489
3 Grubbs法
使用條件:用于多組測量值均值的一致性和剔除多組測量值中的離群均值,也可以用于檢驗一組測量值的一致性和剔除一組測量值中的離群值。
檢測方法:對L組測量值,將每組n個測量值的均值記為x1
計算所有均值的總均值,標準偏差
若可疑值為最小值x1,則T=,若可疑值為最大值為x1,則T=。根據T值和L值對比臨界值表: 若T≤T0.05,為正常均值;若T0.05
表2 Grubbs檢驗臨界值(Ta)表
L 顯著性水平α L 顯著性水平α L 顯著性水平α
0.05 0.01 0.05 0.01 0.05 0.01
3 1.153 1.115 11 2.234 2.485 19 2.532 2.854
4 1.463 1.492 12 2.258 2.050 20 2.557 2.884
5 1.672 1.749 13 2.331 2.607 21 2.580 2.912
6 1.822 1.944 14 2.371 2.695 22 2.603 2.939
7 1.938 2.097 15 2.409 2.705 23 2.624 2.963
8 2.032 2.221 16 2.443 2.747 24 2.644 2.987
9 2.110 2.322 17 2.475 2.785 25 2.663 3.009
10 2.176 2.410 18 2.504 2.821
方法優點:較Dixon法更為嚴密,能對一組數據中多個可疑值進行檢測,可進行多次可疑數據的剔除,提高數據處理的準確度。
注意問題:當可疑數據有兩個或兩個以上時,且均勻分布在同一側(即為x1,x2或xL-1,xL) 此時在檢測時,要先檢測靠近的可疑值(即為x2或xL-1),然后通過計算T= 來檢驗x2是否舍去,若x2離群,則x1必然離群,應當注意的是此時總均值=,不包括x2。同理檢驗xL-1,即T=,此時=,然后對照T值表,檢驗xL-1是否離群,若xL-1離群,則xL必然離群。當可疑數據在總均值兩側時,要先檢驗離均值遠的可以數據,若剔除了一個數據,在檢驗下一個時,此時總均值的求解為剩余L-1個均值的算術平均值。
通過這三種方法,我們可以在水質分析數據處理過程中提高我們檢測結果的準確度,從而相對客觀的反映水質情況,為水質鑒定,水污染防治提供可信資料。
參考文獻
[1] 奚旦立,孫裕生,劉秀英.環境監測[M].北京:高等教育出版社,2010.
[2] 劉國華,呂曉柯,石晨,劉曉蕾,王鵬.初速數據判別方法研究[J].火炮發射與控制學報, 2013(3):01-0008-03.
與此相適應,會計信息管理專業的人才培養課程體系體現為會計學基礎課程、數據分析技術課程以及決策能力提升課程等三個層次。
0 引 言
2012年以來,鋪天蓋地的大數據進入了我們的視線,各種流行書籍,各大網站、媒體都在談論大數據,一時間成為這個時代最熱門的話題。同時,這也引起了我們的關注。我們說,大數據,不單純是數據規模上的大,還在多樣性、速度、精確性上都有突破性增長。更重要的是,這種數據的潛在價值也是舊有數據難以企及的。我們這里暫且不論如何駕馭大數據以及有什么樣的技術要求,它給我們的一點重要啟示就是要注重數據分析的重要性。在此背景下,深圳信息職業技術學院會計信息管理專業積極探索滿足新形勢下人才需求的培養模式,使人才更好地滿足當前企業的實際需要。
1 大數據時代背景引發對人才需求的變革
可以說,在未來的競爭領域,“占領市場必須先占有數據”,也就是要做到基于信息的決策——“用數據說話,做理性決策”,即進行數據分析。數據分析是從海量的數據中提取和挖掘出對企業有價值的規律和趨勢,為企業的決策提供支持,這些支持體現在四個方面:①行為預見鏡——幫助企業識別機會、規避風險;②問題良藥——幫助企業診斷問題、亡羊補牢;③跟蹤檢測——幫助企業評估效果,提升效益;④引力動力器——幫助企業提高效率,加強管理。
不可否認,個別公司的決策人具有超人的戰略眼光以及敏銳的洞察力,單靠直覺也能給公司帶來巨大價值。那么究竟靠數據分析的決策能否優于直覺決策,我們這里也要靠數據說話。有學者比較了組織中用直覺決策以及用數據分析決策的可能性,研究發現,業績優秀的組織更多地傾向于采用分析決策,尤其是在財務管理、運營、戰略等方面。因此,可以推斷,用數據分析決策比直覺決策能給企業帶來更大的價值。與此同時,根據智聯招聘網站顯示,短短兩年時間,珠三角地區數據分析人才需求已接近了需求量旺盛的傳統會計專業??梢姡絹碓蕉嗟墓拘枰軌驅矩攧盏认嚓P信息數據進行處理、加工、分析以為公司管理層決策提供信息支持的人才。
可以說,傳統會計專業注重會計核算,即財務報表編制的整個流程及環節的掌握,而會計信息管理專業更注重對財務報表數據以及其他有用信息數據的再加工、處理、分析及呈報,以滿足管理層經營決策的需要。 可以說,不同的社會發展階段和發展水平要求有不同的專業設置及專業培養目標與之適應。從會計電算化到會計信息管理背后的推動力是時代的變革引發的對人才的需求。
然而,從當前會計信息管理專業的建設情況來看,多數院校存在培養目標不清晰、沒有明確的專業定位、與會計電算化等專業沒有明顯區分以及缺乏明確的專業核心課程等突出問題,尤其是對會計信息管理專業名稱中“信息”二字究竟如何體現沒有清晰的把握和界定。 因此,會計信息管理專業的人才培養模式亟需變革。
2 大數據時代背景下會計信息管理人才工作崗位及能力分析
深圳信息職業技術學院2012年成功申報會計信息管理新專業,并于2013年下半年開始首屆招生。與此同時,會計信息管理的專業定位、培養目標、課程體系也成為擺在專業任課教師面前的重大課題。近幾年來,全體專任教師圍繞會計信息管理專業建設展開了一系列的咨詢、調研、走訪,并定期進行討論、交流,扎扎實實了解實際中的人才需求,實現專業人才供給與人才需求無縫對接。到目前,初步形成了具有專業特色的會計信息管理專業建設思路與方法。
首先,會計信息管理專業人才就業崗位主要集中在賬務處理、管理會計、財務數據分析、預算管理、成本管理、資金管理及內部控制等方面。具體工作任務體現在:會計核算,納稅申報,管理會計,財務數據處理、加工、分析及呈報,以及預算、成本、資金管理等。
其次,在新形勢下會計信息管理人才的工作崗位領域,會計信息管理專業人才應具備如下三方面能力:
①會計核算能力,指的是熟悉并掌握會計信息生成系統,運用財務信息對企業經營活動進行評價;②數據分析能力,指的是掌握一定的數據分析方法,運用Excel、數據庫等現代信息技術手段對數據進行采集、處理、分析及呈現;③輔助決策能力,指的是能夠依據相應的數據分析結果,為公司日常財務等管理決策提供支持。
3 大數據時代背景下會計信息管理人才培養目標
在當前互聯網時代及大數據時代,對財務人才的要求,已經不局限于傳統賬務處理,更傾向于對決策相關信息數據的處理和分析?!罢碱I市場必須先占領數據”,公司財務和經營決策的制定更多的是基于信息的決策,即“用數據說話,做理性決策”,而數據分析即是從海量的數據中提取和挖掘出對企業有價值的規律和趨勢,為企業的決策提供支持。因此,在新形勢下,會計信息管理專業的人才培養目標可以確定為數據分析引領財務決策信息化。
為了實現這一培養目標,需要三個層面的支撐體系,即基于財務會計、強化數據分析、服務管理決策。
4 大數據時代背景下會計信息管理人才培養課程體系
在以數據分析引領財務決策信息化的人才培養目標指引下,我們初步形成了如下三個層次的課程體系。
(1)會計學基礎課程:會計信息管理源于會計,不能脫離財務會計,仍然要以財務會計為基礎。專業學生要了解財務報表的生成過程及會計賬務處理流程、能夠對一般企業常見經濟業務進行會計處理、進行企業納稅申報等。
這方面課程主要有:會計學原理、財務會計、納稅實務。(2)數據分析技術課程:對信息的把握體現在兩個層面,其一是與企業信息化相適應的一般管理軟件、財務軟件的使用及熟練操作以及簡單維護,能夠作為關鍵人物輔助中小企業實現財務信息化;另一層面通過對數據的采集、整理、分析報告,滿足管理層基于信息的決策以及決策的科學化。數據的來源可以來自公司內部的管理信息系統,根據需要也可以來自企業外部的國家經濟產業政策、行業市場信息等。
其中,對數據的分析能力又從兩方面進行培養,一方面是分析思維方式的培養,這是起主導作用的層面;另一方面是分析工具運用的培養,信息化時代,數據量的加大要求借助于一定的分析工具才能實現數據分析。企業信息化實施及數據分析方面的主要課程有:財務報表分析、財經數據分析、應用統計學、數據庫原理及應用、數據處理軟件應用、商務智能等。
(3)決策能力提升課程:新形勢下財務人員面對和服務的更多是企業的管理層和決策層,會計信息管理專業學生要清楚公司管理層和決策層需要哪方面的決策信息支持,并通過數據分析方法進行提供,同時給出合理化建議。這方面課程主要有:管理會計、財務管理、成本管理等。
具體課程名稱及課程目標見表2。
其中,財經數據分析課程能夠使學生掌握系統的數據分析方法,包括數據收集、數據處理、數據分析、數據展現及報告撰寫各環節的基本理論及操作技能,同時熟練地運用數據分析的思想和方法分析企業的財務數據,為管理層決策提供信息支持。數據分析軟件應用課程能夠讓學生熟練運用Excel等常見數據分析工具、軟件進行數據錄入、數據整理和數據分析的方法和技巧,培養學生操作Excel等數據分析軟件的基本技能。商務智能(含數據挖掘)課程依托商務智能平臺,從商務智能概念、商務智能結構、多維數據集內容、數據挖掘、交付等主要內容,使學生在了解如何運用商務智能的工具、架構以及規則的基礎上,分析企業數據,為企業管理層提供信息化決策支持系統。
5 結 語
不同的社會發展階段和發展水平要求有不同的專業設置及專業培養目標與之適應。從會計電算化到會計信息管理背后的推動力是時代的變革引發的對人才的需求。大數據時代下會計信息管理人才培養目標為數據分析引領財務決策信息化。 相應課程體系為財務會計基礎課程、數據分析技術課程、決策能力提升課程。我們共同期待,會計信息管理人才將通過數據分析對企業財務等管理決策帶來價值增值。
關鍵詞: 實驗教學改革 經管類 大數據
實驗教學是培養經管類專業學生實踐能力的重要手段。經濟管理類專業學生不僅要熟練地掌握理論知識,更要具備較強的實踐能力,特別是大數據時代的到來,強調以數據為基礎進行研究,并快速做出決策[1],不僅對掌握大數據思維和技術的人才需求量擴大,而且對經管類專業人才培養提出了新的要求[2],因此在大數據背景下應充分認識實驗教學對經管類專業學生實踐技能的重要性,科學全面地構建面向數據分析和管理的實驗教學體系,以適應大數據背景下經管類專業人才的培養需求。
大數據擴寬了信息的來源,提高了信息獲得的速度,分析對象從傳統的結構化數據過渡到非結構化數據,因此對經管人才需要更全面地掌握大數據思維方式和分析流程。對工商管理、企業管理專業而言,需要其更注重利用多種類型的企業運作的數據,通過對其進行整理分析,幫助企業進行業務流程改革,提升企業運營效率,提高經濟效益[3]。對于電子商務、市場營銷專業而言,應學會利用大數據技術探索新商業模型,分析營銷網絡,評估投資風險及創新服務模式[4]。而對于和大數據技術緊密相關的信息管理專業來說,需要更全面地從數據采集、分析到數據挖掘多個方面轉變傳統的數據分析思維,以適應大數據環境下知識管理與智能決策的需要[5]。
1.實驗目的不合理,實驗設計不當。
目前,對于經管理類專業的大數據實驗教學體系還處于基本概念階段,與科研前沿脫節,實驗目標大多只要學生掌握數據采集、統計分析等基本概念和方法,就學會對給定的數據進行分析。但是在大數據環境下,數據分析和挖掘需要針對結構化數據、非結構化數據等用創新性的思維方式解釋分析結果,并用于智能輔助決策及知識發現。因此,大數據實驗課程應與時俱進地適應大數據的要求,開展多樣化、啟發式的實驗項目,不僅讓學生掌握如何收集信息和整理信息,還要解釋隱藏在數據背后的潛在規律。
2.實驗教學方法和手段陳舊。
傳統實驗課是學生按照老師的要求和給定的數據,學習各種數據分析方法。實驗內容設計單一,沒有針對不同知識結構的學生開展有針對性的實驗訓練項目,學生學習積極性不高。因此,在大數據實驗教學中,要以培養學生創新實踐能力為主要目標,在教師的幫助下,通過團隊協作、自主設計完成。同時,分層次制定針對不同知識結構背景的實驗項目,便于學生根據自身的特長和能力自主選擇實驗項目。
由此可以看出,傳統的實驗教學已不能滿足大數據背景下的經管類專業人才對數據分析和處理的新需求,在實驗教學方式、實驗教學內容等多方進行創新和改革,才能培養出順應時代背景的優秀經管類人才。
在大數據背景下,經管類人才應該具備:發現問題的能力,收集整理數據和信息的能力及理解分析數據的能力。對此,我們從教學方式、課程體系、技能與經驗三方面入手,開展實驗教學改革,以適應大數據時代對于經管人才培養的要求。
3.創新實驗教學方式。
大數據時代,書本和課堂不是獲取信息的唯一選擇,網絡資源、各種移動端應用程序等方式都擴展了學生獲取信息的方式,在這種情況下,實驗教學不僅需要讓學生掌握如何搜集、整理數據的技術,還要培養學生觀察、分析問題的能力,從而真正調動學生的學習積極性。例如可以提供多種獲取大樣本數據的渠道,學生組隊進行數據分析和挖掘,設計算法,進行相關分析直到最后撰寫出分析報告,整個流程全部由學生獨立完成。
4.完善大數據實驗課程體系的構建。
對于經管類專業的學生而言,實驗目的主要是讓他們掌握數據分析的主要流程、主要算法的基本原理,具備大數據應用的初步能力。另外,考慮到不同專業的學生知識結構不同,我們構建多層次的經管類大數據實驗課程、基礎實驗,以驗證和演示實驗為主,強調掌握數據分析工具和分析算法,理解數據分析基本流程。專業實驗,以簡單設計性實驗為主,強調利用現有的數據分析工具,較完整地體驗從數據采集、數據整理、數據分析到數據挖掘的全過程,并編寫簡單的數據分析代碼。綜合性實驗,采用自助式、合作式模式,讓學生自己動手收集數據,團隊合作分析問題,在實驗教師的指導下,綜合運用各種數據分析工具,自主設計算法,進行相關分析,直到最后分析報告,初步具備大數據的應用能力。
5.培養專業技能和增加實踐活動。
積極開展大數據應用相關的實踐活動,提供多種形式讓學生參與大數據的實踐環節,在提高專業水平的同時,提高實踐操作能力。合理利用現有慕課、微課等在在線課程作為實體課堂的有益補充,引導學生深入學數據技術。另外,積極聯系軟件企業提供各種實習途徑和崗位,讓學生真正參與與大數據的各種項目開發,強化課堂的理論知識,豐富實踐經驗,提高專業級技能,有效地提高學生的數據分析能力和數據挖掘能力。
大數據作為近年來的熱點研究問題,已經廣泛應用于經管類學科當中。經管類專業學生只有更好地掌握并懂得如何利用大數據,才能在大數據時代擁有更多的優勢。因此,本文從教學方式、課程體系、技能與經驗進行創新,提出切實可行的改革措施,以更好地培養經管類學生的數據分析的專業能力,適應大數據環境下知識管理與智能決策的需要。
參考文獻:
[1]祝智庭,沈德梅.基于大數據的教育技術研究新范式[J].電化教育研究,2013(10):5-13.
[2]朱懷慶.大數據時代對本科經管類統計學教學的影響及對策[J].高等教育研究,2014(9):35-37.
[3]李永,劉玉紅.大數據時代大學生學習模式轉變研究[J].長春工業大學學報(高教研究版),2014,35(4):38-41,100.
[4]邵舉平,沈敏燕,樊星.大數據時代背景下地方高校研究生教育教學模式改革研究[J].《魯東大學學報》,2015,32(4):82-85.
關鍵詞:大數據;復合人才;教學內容;實踐形式;校企合作
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2014)45-0201-03
一、引言
隨著計算機軟硬件技術的快速發展,計算技術已從傳統的PC平臺計算模式發展到嵌入式計算、移動計算、并行計算和服務計算等多種計算系統并存及融合的計算模式,處理的對象也呈現出網絡化、多媒體化、大數據化和智能化需求的特征,而物聯網、移動互聯網的快速發展促進了這一趨勢,從而迎來了大數據時代的到來。大數據是繼云計算、物聯網之后興起的又一新興發展方向,被學術界、工業界乃至政府機構密切關注和廣泛研究。
大數據又稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極的目的的資訊。在維克托?邁爾?舍恩伯格及肯尼斯?庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據的方法。一般說來,大數據具有4V的特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。大數據技術的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換言之,如果把大數據比作一種產業,那么這種產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。
二、大數據時代對人才的要求
從廣義上講,大數據人才就是具備大數據處理能力的科學家和工程師。目前,國際上開設了大量的數據科學方面的課程、數據科學學位計劃以及數據科學短期培訓班。從國際上設置的培養計劃來看,大數據人才應該系統地掌握數據分析相關的技能,主要包括數學、統計學、數據分析、商業分析和自然語言處理等,具有較寬的知識面,具有獨立獲取知識的能力,具有較強的實踐能力、創新意識和團隊合作意識。具體來說,大數據人才首先應具備獲取大數據的能力,例如能根據任務的具體要求,綜合利用各種計算機手段和知識,收集整理海量數據并加以存儲,為支撐相關的決策和行為做好數據準備。其次,應具備分析大數據的能力,對于經過預處理的各類數據,能夠根據具體的需求,進行選擇、轉換、加載,采用有效方法和模型對數據進行分析,并形成分析報告,為實際問題提供決策依據。最后,應具備良好的團隊合作精神,大數據時代下的數據分析任務通常無法依賴個人能力來完成,需要在團隊制度的約束下,與他人一同攜手、互相鼓勵、分工合作來實現既定目標,因此具備較強的責任心與團隊合作精神也是大數據從業人員必備的基本條件。
三、大數據人才培養的探索
大數據產業的發展,對大數據人才提出了新的需求,國內各高校在積極進行大數據學術研究的同時,也開始考慮將大數據相關課程納入培養體系,以滿足社會對大數據人才的需求。以下結合作者在數據庫及分布式技術系列課程中的教學經驗,以及大數據分析與處理方面的實踐經驗,探討大數據系列課程教學內容和實踐形式的設置。
在教學內容的設置上,大數據系列課程建議可分為理論教學和技術教學兩個方面,因為理論是大數據認知的必經途徑,也是被廣泛認同和傳播的基線;而技術是大數據價值體現的手段和前進的基石。在理論方面,講授的理論內容可涵蓋如下幾點:
(1)大數據概念:大數據概念出現的歷史,關于大數據定義的各種流派以及說明,大數據的四個特征,大數據與云計算、物聯網的關系,大數據與大規模數據、海量數據的差別。這個部分主要突出“大數據”概念中應包含的“對數據對象的處理行為”。
(2)典型的大數據應用實例:精選有新意的大數據分析典型案例,可幫助學生更清晰的理解大數據的概念和含義,這樣的案例如:美國梅西百貨的實時定價機制(根據需求和庫存的情況對多達7300萬種貨品進行實時調價)、百度搜索的實時熱點排行榜(以數億網民的搜索行為作為數據基礎,建立權威的關鍵詞排行榜與分類熱點)、沃爾瑪的搜索引擎Polaris(利用語義數據進行文本分析、機器學習和同義詞挖掘使得在線購物的完成率提升了10%~15%)、谷歌流感趨勢工具(通過跟蹤搜索詞相關數據來判斷全美地區的流感情況)等。在教學過程中,教師應注意將授課的重點放在系統化的開發步驟和關鍵性問題的求解上,介紹案例的設計思想、主要方法和應用過程等。
(3)大數據關鍵技術與挑戰:介紹大數據時代面臨的新挑戰,包括大數據集成(數據異構性和數據質量問題)、大數據分析(數據形式多樣化、數據處理的實時性、索引結構的復雜性等)、大數據隱私問題(隱私保護和數據分析的矛盾)、大數據能耗問題(低功耗硬件的設計)、大數據處理與硬件的協同、大數據管理易用性問題以及性能測試基準。
(4)大數據存儲和管理技術:介紹如何把采集到的大數據存儲起來,建立相應的數據庫,并進行管理和調用。主要內容包括:分布式文件系統(HDFS)、去冗余及高效低成本的大數據存儲技術、新型數據庫技術(鍵值數據庫、列存數據庫、圖存數據庫以及文檔數據庫等)、異構數據融合技術、分布式非關系型大數據管理與處理技術、大數據索引技術和大數據移動、備份、復制等技術。
(5)大數據分析及挖掘技術:介紹從大量數據中尋找其規律的技術,通常由數據準備、規律尋找和規律表示3個階段組成。數據準備是從上述大數據中心存儲的數據中選取所需數據并整合成用于數據挖掘的數據集;規律尋找是用某種方法將數據集所含規律找出來;規律表示則是盡可能以用戶可理解的方式(如可視化)將找出的規律表示出來。根據挖掘任務可分為分類或預測模型發現、數據總結、聚類、關聯規則發現、序列模式發現、依賴關系或依賴模型發現、異常和趨勢發現等。
在技術方面,可考慮分別從云計算、分布式處理技術、存儲技術和感知技術的發展來說明大數據從采集、處理、存儲到形成結果的整個過程,具體可包括以下幾點:
(1)NoSQL技術:NoSQL產生的背景、NoSQL現狀、NoSQL數據庫與關系數據庫的比較、聚合數據模型、分布式模型、數據一致性、典型的NoSQL數據庫分類、NoSQL數據庫開源軟件。
(2)MapReduce:MapReduce模型概述、編程模型:Map和Reduce函數、MapReduce工作流程、并行計算的實現、實例、Yarn等
(3)Hadoop分布式文件系統:Hadoop出現的背景、Hadoop的功能與作用、為什么不用關系型數據庫管理系統、Hadoop的優點、Hadoop的應用現狀和發展趨勢、Hadoop項目及其結構、Hadoop的體系結構、Hadoop與分布式開發、Hadoop應用案例、Hadoop平臺上的海量數據排序。
(4)還可進一步包括數據流的管理與挖掘、云數據庫、圖數據庫等。
由于大數據系列課程所涉及的技術具有很強的應用背景和實踐意義,因此應摒棄傳統教學模式中“重理論、輕實踐”的思想,在掌握大數據相關的理論知識和技術知識之后,還需重點培養學生的綜合實踐能力,以滿足社會就業的需要。為此,應設立一定的大數據技術實踐課程內容,幫助學生從知識型向能力型轉變。結合上一節分析的大數據時代對人才的具體要求,建議按以下流程設置實踐環節的內容:
(1)分組。如前所述,大數據時代下的數據分析任務通常需要以團隊的形式來完成,因此首先要求學生根據自身情況,結合各自的技術優勢,合理進行分組。
(2)選題。在具體選題上,可使用校企合作的具體項目或以Apache Hadoop、MongoDB、Dremel、Gephi等一系列的開源大數據分析軟件作為實踐平臺,以Kaggle為數據科學平臺來進行選題。
(3)明確需求并撰寫大數據分析任務書。明確選定的題目范圍內,數據分析要研究的主要問題和預期的分析目標。只有明確了數據分析的目標,才能正確地制定數據收集方案,即收集哪些數據,采用怎樣的方式收集等,進而為數據分析做好準備。
(4)數據收集及預處理。由于大數據分析最終的結果與其獲取的數據質量緊密相關,因此收集的數據是否真正符合數據分析的目標是必須注意的重要問題。該步驟要求學生從分析目標出發,從浩瀚的數據中正確的收集高質量且服務于既定分析目標的數據,然后對數據進行必要的加工整理,包括填寫空缺值、平滑噪聲數據、識別和刪除孤立點、解決不一致性、規范化(消除冗余屬性)和聚集(數據匯總)等。
(5)探索性數據分析。由于大數據分析的數據量通常達到PB甚至YB級以上,因此希望直接選定一個分析模型是不現實的,而且面對高維海量數據,也很難直接看出數據的規律。在這個步驟中,應指導學生通過基本描述統計量的計算、基本統計圖形的繪制、用各種形式的方程擬合等手段,計算某些特征量等方法探索規律性的可能形式,幫助學生快速掌握數據的分布特征,這是進一步深入分析和建模的基礎。
(6)模型選定分析。在探索性分析的基礎上提出一類或幾類可能的模型,然后通過進一步的分析從中挑選一定的模型。有時選擇幾種統計分析方法對數據進行探索性的反復分析也是極為重要的。每一種統計分析方法都有自己的特點和局限,因此,一般需要選擇幾種方法反復印證分析,僅依據一種分析方法的結果就斷然下結論是不科學的。
(7)模型的驗證及分析報告。指導學生對選擇的數據分析模型及結果進行分析,可使用數理統計方法對所定模型或估計的可靠程度和精確程度作出推斷。觀察模型提供決策的信息是否充分、可信,所發揮的作用是否與期望值一致,數據分析方法是否合理,是否將風險控制在可接受的范圍。
以上這種項目式實踐形式的優勢是:在學生參與完成某一具體的大數據分析任務過程中,通過主動地學習來自主地進行知識的建構,讓學生經歷項目開發的整個過程,從中去發現和掌握相關知識,達到既能熟悉大數據分析過程,又完成了經驗的積累,還能實現學習知識、培養能力的目的。在這里,教師不再是知識的傳授者,而是項目活動的組織者和咨詢者。
四、校企合作推動人才培養
一方面,大數據的核心業務必然是一種扎根于特定行業,綜合運用已有的存儲、分析、挖掘、展現技術,根據用戶需求并融入行業特色技術模型的一站式大數據平臺業務。另一方面,對于企業來說,各類業務產生的數據為數據分析創造了非常好的基礎條件。大數據解決方案是有價值的,但是苦于找不到既懂數據分析技術,又懂得業務的專業人才。由此可見,既懂得相關技術,又諳熟企業業務的復合型人才才是企業部署大數據應用最迫切需要的人才。因此,企業可以與學校聯合培養自己所需要的大數據人才,這種方式有兩方面的優勢:一是大數據技能訓練的對象,即大量的數據,只有企業才具備;二是在企業的支持下,學校也能通過針對性的實踐訓練來培養學生的大數據處理技能。
大數據時代下的校企合作的形式多種多樣,可通過聯合辦學、聯合制定人才培養方案、合作開發課程和教學內容、設置實訓項目、教學管理和共建“雙師”結構教學團隊等形式展開。
五、結語
2數據分析觀念由《小學數學課程標準(實驗稿)》中的“統計觀念”改造而來?!缎W數學課程標準(實驗稿)》中的“統計觀念”強調的是從統計的角度思考問題,認識統計對決策的作用,能對數據處理的結果進行合理的質疑等?!缎W數學課程標準(正式版)》將其修改為“數據分析觀念”,就是希望改變過去這一概念含義較“泛”,體現統計與概率的本質意義不夠鮮明的弱點,而將該部分內容聚焦于“數據分析”。數據分析觀念是學生在有關數據的活動過程中建立起來的對數據的某種“領悟”,由數據作出推測的意識,以及對于其獨特的思維方法和應用價值的體會和認識。《小學數學課程標準(正式版)》對于數據分析觀念一是過程性(或活動性)要求:讓學生經歷調查研究,收集、處理數據的過程,通過數據分析作出判斷,并體會數據中蘊涵著信息;二是方法性要求:了解對于同樣的數據可以有多種分析方法,需要根據問題背景選擇合適的數據分析方法;三是體驗性要求:通過數據分析體驗隨機性。
3運算能力是《小學數學課程標準(正式版)》增加的核心概念。運算是數學的重要內容,在義務教育階段數學課程的各個學段中,運算都占很大的比重。學生在學習數學的過程中要花費較多的時間和精力,學習和掌握各種運算的知識及技能,并發展運算能力。運算的正確、有據、合理、簡捷是運算能力的主要特征。運算能力并非一種單一的、孤立的數學能力,而是運算技能與邏輯思維等有機地整合。在實施運算分析和解決問題的過程中,要力求做到善于分析和運算條件,探究運算方向,選擇運算方法,設計運算程序,使運算符合算理,合理簡捷。總之,運算能力不僅是一種數學的操作能力,更是一種數學的思維能力。
4《小學數學課程標準(正式版)》提出的推理能力與過去相比,有這樣一些特點:一是進一步指明了推理在數學學習中的重要意義?!缎W數學課程標準(正式版)》指出“:推理是數學的基本思維方式,也是人們學習和生活中經常使用的思維方式。”它對教學的啟示是,不僅要引導學生認識到推理是數學的重要基礎之一,它與人們的生活息息相關,更重要的是要逐步培養學生運用推理進行思維的方式,二是基于數學推理的特點,突出了合情推理與演繹推理這條主線,指出在數學思維和問題解決的過程中,兩種推理功能不同,相輔相成——合情推理用于探索思路,發現結論;演繹推理用于證明結論。三是強調推理能力的培養“應貫穿于整個數學學習過程中”,應當貫穿于整個數學課程的各個學習內容,貫穿于數學課堂教學的各種活動過程,貫穿于整個數學學習的環節,貫穿于三個學段,合理安排,循序漸進,協調發展。
本站为第三方开放式学习交流平台,所有内容均为用户上传,仅供参考,不代表本站立场。若内容不实请联系在线客服删除,服务时间:8:00~21:00。