前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的大數據時代的概念與特征主題范文,僅供參考,歡迎閱讀并收藏。
當我看到這本書的名字《塊數據》時,我就想我一定要好好閱讀。現今"大數據"、"云計算"的聲音不絕于耳時。我了解過大數據,快速的閱讀了這本《塊數據》。總的來說,還是收獲頗多的。原先我了解的不過是大數據的應用。尤其例如中央電視臺利用大數據分析春運人們的流動走向。方便簡單的示意圖就把各個城市的流動量做好統計,簡便的分析出什么地方的客流量大,什么地方的客流量相對較下。這樣很容易做好資源分配工作,極大地解決了歷年讓我們頭疼的春運難的問題,就從這簡單的一點,我們也肯定大數據時代要來臨啦!
這本書跟我們系統的解釋了塊數據概念,從一個全新的角度來看待大數據。第一章講述的是塊數據的定義與特征,首先講述什么是大數據,其次講述‘條數據’概念——越長大越孤獨。最后引出‘塊數據’的概念。未來的大數據時代時的數據形式。為我們引領了一種"塊"思維的方式。講述了塊數據的三個自我智慧。第二章講述塊數據的素描。一是高度關聯性。不管什么樣的人,做不同的事都是相關的。二是立體性。其次,是可以隨時隨地的活性、以人或物的活動主體性、以及塊數據的開放性。第三章講述塊數據的價值。商業模式的發展、社會領域的應用、轉變政府的職能、改變社會公共文化。第四章講述塊數據面臨的挑戰。頂層機制設計問題、數據結構化的挑戰、數據安全凸出、公民隱私保護、行業重大變革。讓我們體會到塊數據的艱辛、挑戰不斷。第五章講述塊數據的形成原因。不斷提速的寬帶、各個城市的無線不斷普及、物聯網的飛速發展都加劇了塊數據的形成。第六章講述了塊數據匯聚和處理。例如打造公共平臺、打破數據瓶頸、增益數據塊價值。第七章講述塊數據的開放與市場交易機制的構建,使數據資深化。第八章講述塊數據的商業應用,服務業、工業、農業、文化教育、醫療健康、就業創業、社會保障、交通出行、城市安全等領域。第十章講述政府的治理領域,可以打造一個透明、智慧、法治、有責任的政府。
本書寫的非常詳細,全面而系統的詮釋了在大數據時代下的塊數據的形成、集聚、運行模式及塊數據的應用。將像本書提到的,受摩爾定律驅動的信息技術的不斷廉價化、互聯網的普及以及其延伸所帶來的信息技術無處不在的應用,催生了大數據時代的到來。進而是信息化進入以數據的廣泛關聯、跨域融合和深度應用為特征的智慧化階段。本書從一個新穎的角度——塊數據,來看待大數據以及未來發展,頗有創意!也發人思考。
貴州大學大數據與信息工程學院
通信與信息系統
【關鍵詞】大數據;思想道德建設
近年來,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。當前,大數據引領下的智慧科技時代已然來臨,社會各行各業都受到前所未有的深刻影響,大數據時代背景下,大學生思想政治教育也要積極地深入探討新形勢下面臨的主要問題,從而提高當前高校大學生思想政治教育的針對性與實效性。
一、大數據時代的內涵
信息技術領域原先已經有“海量數據”、“大規模數據”等概念,但這些概念只著眼于數據規模本身,未能充分反映數據爆發背景下的數據處理與應用需求,而“大數據”這一新概念不僅指規模龐大的數據對象,也包含對這些數據對象的處理和應用活動,是數據對象、技術與應用三者的統一。
大數據(bigdata),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助學生解決實際問題,獲得更積極目的和資訊。大數據對象既可能是實際的、有限的數據集合,如某個政府部門或企業掌握的數據庫,也可能是虛擬的、無限的數據集合,如微博、微信、社交網絡上的全部信息。
大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。隨著大數據時代的到來,越來越多的大學生通過互聯網接觸到多樣化的信息,涉及到學習、思想、社交、就業等等多個領域。
二、大數據時代對當代大學生思想的影響
目前大數據已經成為社會各領域廣泛關注的焦點之一,也是推動社會各行各業發生變革的主要力量之一。高校大學生的思想政治教育工作同樣具備大數據的特征。例如:大學生們每天使用的信息交流溝通平臺,時時刻刻都在產生由文字、圖片、視頻、音頻、對話、郵件、短消息等構成的海量信息,這些信息集中反映了大學生的思想動態和行為特征。作為高校思想政治教育工作者,如何對這些海量信息進行科學合理有效的收集、整理、篩選、甄別、判斷,如何適應和開展大學生思想政治教育工作,如何重新審視高校思想政治教育工作者的主導權和話語權,是需要深入研究和積極實踐的重要課題。
1.積極影響。網絡大數據時代下的思想政治教育與傳統思想政治教育相比具有明顯的積極影響。在大數據時代,高校思想政治教育工作者對教育信息掌握更加全面,教育方式更加靈活,教育的主客體關系更加平等,教育載體具有“微傳播化”特征,教育方法更加定量化。可以說,網絡大數據的出現和發展,引起了社會各方面的發展。對于高校思想政治教育來說更是如此,以前傳統的思想政治教育模式受到了巨大的挑戰。研究在大數據浪潮侵襲下的高校思想政治教育,是新形勢思想政治教育的重點。
2.消極影響。大數據在大大提高思想政治教育效率的同時,不可避免地也帶來消極影響。在大數據時代,如洪流般的數據中難免夾雜著大量負面虛假信息,很大程度上對大學生的價值觀念、行為方式等帶來不好影響,教育的主流價值觀念受到這些虛假信息的沖擊。這就對高校提出了必須對學生的信息數據進行不斷地收集、挖掘和分析的要求,如果這項工作沒有做好,將會引起數字鴻溝,造成信息差距擴大。這不僅增加了思想政治教育的難度,也一定程度上導致思想政治教育的權威性降低,減弱了思想政治教育的效果。此外,大數據的普遍應用使得數據傳播速度快,信息透明度高,如果網絡輿情不加以控制,容易在高校學生中產生不良影響,這也將考驗著思想政治教育的效果。
三、大數據時代高校思想道德建設的建議
1.研究數據的創新性。大稻蕕乃枷胝治教育,最鮮明的特征就是研究對象的“數據化”。研究對象的數據化最核心的體現就是量化,具體指標可以體現在數據方面,簡言之,即用數據說話。傳統的思想政治教育工作者主要采用的研究方式有問卷和交流座談等,實效性很難保證。在大數據時代背景下,人們各項決策的制定都需要借助于相應的數據分析,高校思想政治教學也是如此,要想在大數據時代獲得新的發展,就必須緊緊抓住數據化機遇,積極采取一定的措施,構建科學的一體化數據信息平臺,在平臺上各高校教師針對學生思想情況所做的調查問卷數據等,為思想政治教育研究工作提供量化數據支持。
2.研究方向的全面性。要在當前社會背景下進一步提升對大學生相關思想行為狀態信息分析整理的時效性和全面性,首先應該找準學生信息的搜集的切入點,對高校學生信息進行科學的匯總,不僅從網絡上調查和分析學生群體的思想發展情況、對社會事件的關注偏向和集中程度、探究學生思想狀態與各類事件之間的聯系,還需要通過個體數據的整理,反映學生個體的思想成長情況,進而對學生實施該特性化教育指導,提升思想政治教育質量。
在如今這個海量數據的信息時代,不同領域中的海量數據的高度融合引發了各行業之間的數據革命和競爭,各種數據逐漸呈現出高度復雜化、價值稀缺化的基本特征,各種數據如同洪水一般涌入到全球經濟發展與創新的不同領域。相關統計數據顯示:在未來幾年的發展中,數據每年的增長率為40%。預計到2020年,全球一年產生的數據量將達到或者超過40ZB。前所未有的海量數據信息正在不斷聚集,數據數量逐漸龐雜,這已經不是我們能夠應對的。在未來,各領域將會對數據進行大規模生產、運用、分享,大數據時代正在迎面趕來。“大數據”是“云計算”、“物聯網”等熱點、高頻詞之后的新的關注話題。在大數據時代,數據已經成為企業資產中必不可少的一部分。一個企業所擁有的數據的規模、活性,對數據的收集、處理、利用能力等將是企業核心競爭力的主要內容,因此,在海量的數據信息資源中,如何才能正確挖掘和利用蘊藏于大數據中的各種社會、經濟、科研價值信息已成為學術界、企業界高度關注的問題。與此同時,這種思想也恰好凸顯出企業競爭情報分析的重要性。在大數據的驅動下,企業的決策者必須對各種不斷變化的競爭形勢進行實時、動態化的跟蹤與監測,對每一分鐘、每一小時、每一天產生的數據進行分析。大數據時代的到來,給企業競爭情報研究工作的創新帶來了全新挑戰,如情報研究人員的工作量激增、情報工作的成本將大幅增加、具有大數據分析技能的專業人員的匱乏等。
1 大數據時代的基本概念與基本特征
1.1大數據時代的基本概念
要想深入了解大數據時代企業競爭情報的具體情況和內容,就必須先對大數據時代的基本概念和內涵進行了解。筆者認為,對于大數據的基本概念的理解可以是一種全新的描述,并非是真正的定義或概念。隨著大數據時代的到來與逐漸發展,人們對海量的數據進行了挖掘和應用,這也就預示著在一定程度上將產生新一輪的生產率增長、消費者盈余,其實這就是對大數據時代最好的解釋與詮釋。大數據具有5V的特征。
1.2大數據時代的基本特征
1.2.1在大?稻菔貝?下所有的物質實現了數字化
相關統計資料顯示,2015年全球一天的全網流量已經可以裝滿1.88億張DVD光盤,還有專家曾經預測到2020年,我國僅僅一個普通家庭的一年所產生的數據就相當于半個國家圖書館的信息儲量。在大數據時代,淘寶實現了商品的數字化,微信實現了人際關系的數字化,微博實現了人們心情的數字化。通過這些數字化的過程,人們周邊的物質已經成了各種不同的數據,而這些不同的數據經過匯集后又形成了大數據,這也充分體現出大數據的多樣性、大量性。
1.2.2數據分析是大數據時代的核心特征
在大數據時代,在不同領域匯總進行決策已經不能再簡簡單單依賴管理者自己的經驗、直覺等來完成,而是需要從海量的數據中進行挑選,充分體現出大數據的高價值性和真實性。如:沃爾瑪公司對客戶購物習慣的數據進行營銷分析,最后得出“啤酒+紙尿褲”的搭配方式。
1.2.3大數據時代實現了前瞻性與實時性的統一
在大數據時代,人們獲取信息的形式呈現出多元化的方式,信息來源更加廣泛,并具有實時性。另外,大數據時代的到來,使得各行業更具備前瞻性。例如:谷歌就曾經利用網民檢索中的一些高頻詞匯、時間的分布等對2009年的流感爆發與迅速傳播進行了提前預測,為醫院提供了相關的信息,使醫院提前做好防御準備,并配備了大量的人員、設備、藥品。大數據時代不僅促進了各領域的發展與變革,更為這些領域未來的發展指明了方向。可見,只要存在大數據,就會為企業的發展帶來全新的機遇和挑戰。
2 大數據時代企業競爭情報所面臨的主要問題
情報研究的主要目的就是從大量繁雜的數據信息中提取出更有價值的情報,并為企業的發展提供決策與支撐,使企業的各項決策更加精準化,便于企業對各種紛繁復雜的數據信息進行搜集、分析、闡釋,并努力挖掘這些數據的內在聯系,最終將其轉化為能夠為企業提升競爭力的有利用價值的情報。在企業競爭情報的分析中,對企業競爭環境、對手等各方面的信息做出了詳盡地分析,制定出符合企業發展的競爭情報策略。可見,在大數據環境下,企業的競爭情報更加清晰化、明朗化,企業對市場的把握也更加準確。
2.1競爭情報研究機構的職能存在缺失
目前,很多企業的競爭情報工作都是由不同的業務部門負責人具體實施的,雖然在企業內部可以構建一個穩定的、專門的競爭情報機構,然而,與之相適應的配套的職能定位往往處于缺失的狀態中,特別是在競爭情報搜集工作制度的制定方面存在很大的隨意性,如有的企業從事競爭情報搜集工作的部門包括企業的市場部門、人力資源部門、銷售部門等。隨著市場競爭環境的日趨激烈,很多企業為了在競爭中立于不敗之地,紛紛建立了屬于自己的競爭情報機構,并出臺了一系列較為系統的部門職能制度,這些成功的經驗值得各個企業借鑒。
2.2競爭情報研究工作人員缺乏必要的業務素質
企業競爭情報工作人員的基本素質主要包括:業務技能素質、競爭情報意識和素質、團隊協作意識、對組織的忠誠、遵紀守法的素質,但是就目前各企業從事競爭情報的工作人員現狀來看,企業的情報工作者缺乏這方面的綜合素養,特別是企業的中層以上領導者,更是只關注能夠為企業帶來經濟效益的工作,對于能夠間接促進企業經濟效益增長的各種隱性因素并不關注,競爭情報搜集缺乏主動意識。另外,各企業的競爭情報搜集人員并未經過任何系統性的、信息管理類的培訓,特別是對于搜集到的各種情報信息不善于管理、分析、加工,使得情報資料的應用價值不高。
2.3競爭情報信息管理缺乏科學性
目前,很多企業的競爭情報管理工作缺乏科學性,建立在現代信息管理理論基礎上的信息管理工作更是尚未建立完善的體系。如:企業的中層領導管理人員在競爭情報的搜集工作中缺乏科?W的行動規劃,對于企業層面的規劃也考慮不全;在情報的存儲、分析方面問題更加突出,對于搜集來的競爭情報沒有及時進行歸類整理、存儲,更未將相關的資料建立相應的數據庫,很多信息在了解、使用之后就隨意丟棄;在競爭情報的內部共享方面嚴重不足,有的企業的中層管理人員搜集到的信息僅供個人工作時使用,并未向其他部門或者領導進行匯報,這也就是事實上的信息共享壁壘問題;由于很多企業沒有進行系統性的競爭情報信息工作,再加之管理層缺乏必要的重視,導致迄今為止很多企業并未建立完善的、科學的競爭情報管理制度。
3 大數據環境下現代企業競爭情報工作的創新措施
3.1為企業競爭情報工作提供堅強的組織保障
各企業應根據自身的實際情況、未來的戰略發展規劃成立獨立的競爭情報機構;如果沒有條件或者在短時期內無法成立獨立的競爭情報機構,企業可以在保證業務正常運轉的情況下從內部各部門抽調一名信息工作人員,組成規模為10人左右的競爭情報工作小組,并由企業的主要領導牽頭,擔任該機構的主要負責人,各成員分別根據本企業的業務職能開展對應的情報搜集工作。
3.2為企業競爭情報工作提供堅強的財力保障
經濟基礎決定著上層建筑,這是一項普適性的哲學原理。對于企業競爭情報工作也具有同樣的指導性意義。如果沒有強大的財務基礎作支撐和保障,那么競爭情報工作就如同是空中樓閣,因此,為了保證企業的競爭情報工作的順利進行,必須將該項工作的經費納入到企業的預算中,并設定相應的臨時劃撥制度作保證。如企業競爭情報搜集設備與工具建設的經費、企業競爭情報工作人員的薪酬與激勵經費、企業競爭情報搜集資料信息購置經費、企業競爭情報工作人際關系的攻關經費。
3.3為企業競爭情報工作提供強大的物力支撐
在大數據環境下,要想保證企業競爭情報研究工作的順利進行、保證競爭情報工作方案的有效實施,物力保障必不可少。從物質條件的充裕程度來講,各企業應該積極為企業競爭情報工作提供必要的、充足的物質條件;從企業的發展實際來看,在為企業競爭情報工作提供必要的物質條件的同時,一定要本著投入與產出相匹配的基本原則,選擇性地對企業競爭情報工作進行物力支持。如必要的交通運輸物品(小轎車等)、信息采集工具(攝像機、錄音筆等)、信息管理設備(移動硬盤、U盤、互聯網計算機等)等。
3.4為企業競爭情報工作提供制度保障
現代企業必須根據自身的實際情況,積極構建或完善相關的企業競爭情報工作制度。為有效地開展大數據環境下的企業競爭情報工作奠定制度基礎。如企業競爭情報工作小組崗位職責、企業競爭情報工作流程與業務規范、企業競爭情報工作內部協作制度、企業競爭情報工作獎懲激勵機制等。這些制度需要企業的不同職能部門通過深入調研后進行制定,這些制度可以先試行一年,在試行的過程中根據實際中出現的問題及時進行調整,然后再統一進行引發并執行。
【關鍵詞】 大數據;銀行業;互聯網金融;發展趨勢
一、大數據的概念和研究回顧
1.大數據的概念。
目前,大數據還沒有一個明確的概念。維基百科以“大數據”被定義為“一個龐大而復雜的,難以使用現有的數據庫管理工具來處理數據集”。美國研究公司的Gartner認為,大數據是新的處理模型有較強的決策權的需要,洞察能力和過程的大規模優化能力,高增長率和多樣化的信息資產。
2.大數據的本質特征
James、Vlahos、Risenthal、Jonathan和Black等通過大數據發現,大數據的本質特征的研究,一是分析對象的相關數據,對數據的不只是部分,但數據不全;兩強調數據的復雜性,即探索應力之間的關系;非因果關系。
二、大數據帶給銀行業的歷史機遇
1.廣闊的業務發展空間
目前,在大數據庫的基礎上,互聯網金融的發展突飛猛進,對銀行業造成了不小的影響。中國的傳統銀行過去對大數據的應用是有限的,你可以從網上銀行的快速發展經驗借鑒。隨著多元化社交網絡平臺的快速發展,銀行與客戶之間的聯系渠道也不局限于傳統的網點,越來越多的人選擇了便捷的移動互聯網和第三大媒體平臺來完成交易。導致大量的結構性和非結構性數據交織在一起,大量的,這給銀行提供了更廣闊的發展空間。通過對銀行大數據的分析,挖掘、更全面的把握客戶資源、更高效的產品營銷,更大程度上拓展了其業務空間。
2.科學的信息決策判斷
傳統銀行業在判斷信息的決策上,往往更多的是基于經驗的判斷或相對較小的市場調研范圍。然而,在信息的大數據時代,大數據的價值中所包含的信息,不能僅僅依靠歷史的經驗和市場調查,掌握所有的信息,必須通過挖掘大數據的處理和分析,以深入了解銀行業本身和整個市場的情況,談隨著數據業務的風險程度和銀行資源的評價更為科學的銀行績效評價和合理有效配置,使銀行的決策更加科學、合理和有效的。
3.優秀的經營管理能力
目前,為了滿足消費者多樣化的需求,越來越多的項目在銀行業務中,對業務流程的發展提出了更高的風險識別和監控的要求。但在大數據的視角下,通過對業務發展過程中的數據挖掘,可以有效地挖掘出潛在的風險,并及時根據客戶的屬性、行為和信用風險監控體系建立一個合理、有效的。
三、大數據背景下銀行業的未來發展
1.打好數據基礎、培養專業人才
大數據時代,大部分數據來源于各種社交平臺,電子商務媒體、多種類型、數據的增長遠遠超過了傳統的數據庫技術,構建了數據倉庫管理的能力。銀行要處理大數據,我們必須充分考慮到各種硬件和軟件成本、勞動力和材料成本、管理成本和效率和安全成本等因素,以挖掘大數據的價值。因此,第一銀行推進技術創新,開發適合高效的軟件程序和硬件平臺,建立大數據倉庫,為數據的收集、存儲和分析提供支持。其次,銀行可以有效地從海量數據中提取有價值的信息,你需要培養專業人才,不僅需要熟悉大數據技術人才,也需要考慮數據業務人才的能力,需要數據科學家的綜合素質。
2.開展精準營銷、提高客戶滿意度
中國的傳統商業銀行發展至今,日積月累的很長一段時間后,在客戶的身份信息有非常豐富的數據信息,消費與收入、風險偏好、資產狀況、交易習慣等。之前和之后的大數據技術營銷策略差異的應用可以發現,相比之下,一方面,可以得到客戶的貢獻度、活動和行為的客戶特征的偏好,使這些數據在許多銀行客戶的需求和潛在的商業機會,更好地了解客戶,更好地識別客戶的服務起點。根據客戶的特點進行分類,通過差異化的營銷設計,組織營銷活動,推薦相關的產品和服務,以提高銀行的精準營銷能力;另一方面,數據處理是由客戶服務中心進行咨詢、投訴,及時的產品或服務中發現,客戶意見收集的數據分析,了解不同人群的需求和偏好,做到以客戶為產品和服務的設計和開發中心,提供客戶提供更加個性化的服務準確,提高客戶滿意度。
3.推進跨界合作、創新產品業務
近年來,各國為了促進金融發展和繁榮,鼓勵民間資本進入銀行業,越來越多的企業開始形成網絡參與金融業,建立了各種類型的第三方支付公司。金融企業通過各種、銷售來涉足一般的商務活動。在大數據刺激互聯網金融增長的大數據中,銀行必須適應形勢發展的需要,積極尋求跨界合作。銀行可以通過與電子商務平臺的戰略合作,擴大大數據,分享對大客戶數據的處理和分析的結果,得到用戶行為更多的信息,更快速、準確地把握客戶的行為特征。此外,微信的普及,微博客和其他社會媒體目前,銀行應該根據虛擬社區服務及時的客戶需求,創新產品和服務,提供更優質的金融服務,信息服務和商業服務的客戶。
四、結語
通過本文的分析可以看出,在這一階段,在大數據時代的逐步成熟,商業銀行需要適應新時代的金融服務的發展,保證金融信息新業務模式的順利進行,促進企業數據的發展。但無法照搬西方發達國家的模式,商業銀行的財務信息的發展是一個漸進的探索和發展,成熟的過程中,需要政府、商業銀行、信息技術服務公司的共同努力。
參考文獻:
[1]闕方平.大數據時代銀行業十大轉型趨向[J].銀行家,2013( 11) : 25.
[2]陳曉雁.基于大數據的銀行業管理路徑探索[J].價值工程,2014( 1) : 134.
[3]李[,賈鴻飛.大數據時代銀行業的機遇與挑戰[J].中國金融電腦,2012( 12) : 25.
[4]韓耀強.金融行業大數據應用嶄露頭角[N].通訊產業報,2013.15.01.
近年來,“大數據”這一概念迅速流行,在業界和學界得到高度關注。事實上,“大數據”并不是從天而降的,而是時代演化的產物。當信息技術發展到云計算、大數據時代,人們的生活漸漸發生了全面的變化。從基礎研究方法到各個學科,人們普遍感受了大數據的迫近,但我們要看到大數據之“熱”背后的東西,以及企業需要構建哪些關鍵能力。
計算范式進化
回顧信息技術革命對社會生活的影響,可以分為幾個時代:主機(Mainframe)時代,個人電腦(PC)時代,Web 1.0時代,Web 2.0時代,以及物聯網/云計算/大數據時代。主機時代主要是指以大型機為主導的1960-1970年代。人們若有計算需求,就要去計算中心,把程序交給專門的工作人員負責試運行。這完全是集中式的數據管理,個人想做計算非常不方便,而且很貴。1980年代可以稱作個人電腦時代。此時,大型計算機的一部分功能轉移到了臺式個人電腦上,人們可以在個人電腦上運行一些簡單的計算功能,開始了簡單的文本處理,計算開始從集中走向分散。20世紀90年代Web 1.0 興起了,互聯網幫助人們把全世界的信息聯系在一起了。但此時的互聯網是單向的,我們僅僅能夠查詢和獲取信息,只能通過這個窗口向外看。到2000年前后,以互動和參與為主要特征的Web 2.0出現了。原來人們只是互聯網信息的被動接受者,但此時,網民可以自己寫作博客,參與維基百科的編輯,聯系社會網絡等等。電腦的計算功能越來越強,越來越融合在人們的生活之中。人們之間的信息溝通越來越密,社會中的信息點也越來越分散。直到近年來,出現了以物聯網、云計算和大數據為標志的新時代。此時,不是單個軟件或單個機器的革新,而是整個計算范式(Paradigm of Computing)的變革。這是一種新型的集中式計算:無處不在的探測感應裝置、計算機網絡、移動終端、云服務、社會化媒體、數字化生活使得數字世界和計算能力處于物理上高度分散和分布式狀態;另一方面,物聯網、云計算和大數據應用又強調信息整合、數據中心平臺以及全局視圖。所以,與傳統集中式不同,此時呈現出物理上分散、邏輯上集中的新特點。
技術的發展與應用有一個刺激響應螺旋:當某個技術突破產生時,個人和組織不管主動還是被動都免不了要面對這項技術,思考諸如“要不要應用這項技術,如何應用”等問題;技術的發展又會受到這些應用要求的影響,一直互動和循環下去。一項新技術是一個刺激,個人和企業會響應并產生新需求,進而這些新需求又成為新的刺激,使得技術再做出創新響應。技術和應用需求就在這種刺激與響應中螺旋上升。在當前新型計算范式背景下,特別是從大數據的視角來審視我們面臨的機遇和挑戰,思考對未來的管理可能產生哪些影響,具有重要理論和實踐意義。
大數據改變生活
現在關于大數據的說法比較多。一些提法也在涌現,如認為大數據只注重關聯不注重因果、只注重總體不注重抽樣等。這些觀點反映了特定場景和應用的某些特點,但是作為大數據的一般屬性的話,目前還缺乏足夠的共識。簡單說來,具有相對廣泛共識的大數據特征是所謂的4V(Volume, Variety, Value, Velocity)。第一,大數據意味著超常規模數據(Volume)。與之前的大規模數據不同的地方在于,大數據對企業來講意味著數據規模超越了企業本身的內部數據,而是延伸到了企業外部,成為一種社會化的企業數據。每個人作為終端使用者,既是信息的使用者,又是信息的創造者。全社會的人都與數據發生關聯,在社會活動的各個環節,而不僅僅局限于之前的某些企業、某些部門職能環節;這是質的變化。第二,大數據意味著多樣性(Variety)。富媒體(Rich Media)大大擴展了人們的數字化生活體驗,全球數據和數字流量中70%~80%都是視頻、語音、圖像,而不是過去以二維的、規范化的、非常簡單數據形式為主的結構化數據。多樣性成為大數據的顯著特征。第三,我們處在數據的海洋之中,但與我們企業或個人相關的數據相對說來是很少的,所以是低價值密度的(Value)。即,數據量的分母太大,對企業或個人決策有價值的信息占總量的比例就很小。所以這里有一個重要的含義,即如何從低價值密度的數據海洋中挖掘出有用信息,成為企業數據分析的關鍵。第四,大數據的實時性強(Velocity)。信息就像開著的水龍頭一樣,源源不斷地出來。人們打開手機看新聞,支付賬單,都需要得到及時響應,而不是等到晚上再看新聞,要排個隊才能支付賬單。信息是連續的,實時的,流涌的。這種流信息是時時刻刻(Real-Time)的,構成了大數據之“大”和無時不在。
大數據的這四個特征會給人們的科學研究方法帶來挑戰,當然也會影響商業和管理。
比如說對統計理論的挑戰。在傳統概率統計學中,因為做不到對總體進行采集,所以設計了許多抽樣方法,要用到測度(如均值、方差)這些概念。在大數據背景下,很多基礎的假設都需要重新檢驗和審視:哪些被顛覆了,哪些可能還可以用。在所有管理學理論中,統計是最基礎的方法之一,所以這種審視很重要。
再者,比如對信息處理的挑戰。傳統的信息處理技術要應對具有4V特征的大數據是極有挑戰性的,一方面是測度、信息處理的基本方法,另一方面是搜索、推薦等應用方法。大量的信息處理方法都只能處理結構化的數據,而無法處理富媒體數據,因而需要重新審視。譬如,30和31不相等,兩個數字易于比較;而兩篇博文可能只是相似,意義相接近,等等;視頻和圖像的比較,更需要判斷其相似性而非“等于”。此時,數學上的“等于”就變成特殊的個例了,多種情況下是“約等于”,或者說相似關系。但是,已有的大量算法并不是基于“相似性”,需要重新檢驗。例如,數據挖掘方法中有一種關聯規則算法叫做Apriori算法。這個算法是基于結構化記錄的經典算法,是許多應用方法的基礎。啤酒尿布問題就是關聯規則算法的經典案例。然而,如果現在要處理的不是一條條的記錄,而是視頻、音樂,經典算法能否處理新問題就需要重新審視。第一要審視算法是否可用,第二要審視算法是否足夠有效率。再如,現在我們搜索一個關鍵字可以很快得到結果,但搜索圖片時體驗還是很差的,如果要搜索一段語音、音樂,那么,搜索的響應時間、質量和精度都還遠達不到人們的要求,是計算機學界需要解決的問題。考慮到處理大數據需求的是流算法,對實時性要求高,沒有效率的算法勢必會被拋棄。其它的挑戰還涉及數據傳輸與存儲技術、社會分析與計算技術、模式識別與語義分析技術等諸多領域。
當數據完全滲透到人們生活之中,大數據帶來的挑戰就涉及人們生活的各個方面,除了上述基礎方法、信息處理方面的挑戰,在很多方面我們都可以觀察到大數據時代的不同。比如,智能手機和平板電腦作為一類功能強大的移動終端,通過豐富多樣的客戶端應用(如apps等)支持人們的各種需要(如:開展業務、網上購物、信息搜索、聊天交友、休閑娛樂等等)。這極大地擴展了企業和個人的計算觸角,深化了社會化商務和移動商務,豐富了數字化的社會生活。
對管理趨勢的影響
大數據時代的管理喻意可以從兩個方面來概括,即:“三個融合”和“三新”。“三個融合”指IT融合、內外融合和價值融合。而“三新”則指大數據時代催生的新模式、新業態和新人群。這兩個方面反映了大數據時代管理理論和實踐的變化特征,其中前者主要體現管理領域和視角上的變化,后者則主要體現管理主體和方式上的變化。
信息技術融合 信息技術融合(IT融合)是指,技術與人們生活和企業運作的密不可分性。信息技術融合有很多實例和問題,概而言之,這對管理有兩方面的意義:第一,越來越多的傳統企業管理問題已經變成或正在變成數據管理或信息管理的問題;第二,越來越多的企業決策已經變成或正在變成基于數據分析的決策。在企業原先的運營框架中,IT支持、營銷、會計、戰略管理、創新可能是不同的職能,但當企業的活動和事件越來越多地用數據體現時,企業決策就要基于數據決策。
內外融合 內外融合強調企業外部數據的重要性。通常,企業關心內部的信息化,如ERP關注內部資源的整合,CRM系統也只是與客戶建立聯系,但現在,評論、口碑、商譽、流言等各類信息都是企業外部數據,而企業還必須關注,否則很可能會出現企業聲譽危機。所以,企業要關注內部數據與外部數據的融合,基于內外數據的交互來做決策。用戶生成內容(User Generated Content,UGC)、公共生成內容(Public Generated Content,PGC)正在發揮越來越大的作用,影響消費者的購買決策、商業輿情和企業形象,企業必須對此做出反應。
價值融合 價值融合是指,企業因生產產品和提供服務而產生價值,消費者在使用產品的過程中產生價值。譬如,手機制造商或者電信運營商面臨著這種情況:你生產和銷售手機或提供流量,會獲得一些收入;但大量的價值增值并不在手機本身,而在于顧客如何使用手機。也就是說,生產有形的產品是一種價值,在此基礎上的無形產品(如服務、內容)可能會帶來更大的價值增值。所以,企業不但要關注有形產品,還要關心附加價值,強調服務、內容等等。
新模式 很多企業在探討大數據背景下如何轉型升級的問題,為了適應大數據的挑戰會產生許多新模式,比如O2O(online to offline,線上線下結合的商業模式)。像線下實體電器賣場,為了適應變化要做線上電子商務平臺、進行了線上線下同價、線上定購線下提貨的嘗試等。而線上商城為了保證時令產品及時到達顧客手中,就會租線下倉庫、打通物流的上下游等。這并不意味著某些公司會消失,只是企業模式會發生改變。因為大數據情景強調企業外部知識,用戶體驗更重要也更豐富,比如虛擬體驗、實體體驗和線上線下融合的體驗。企業內部也要有新模式。因為數據管理和基于數據分析的決策對企業越來越重要,企業要重點增強的一個核心能力就是深度業務分析(Business Analytics, BA)能力,而這個能力的很多方面來自商務智能和數據挖掘技術。這種分析是有深度的、嚴謹的,可以輔助企業在變化的環境中做出更好的決策。
新業態 賽博空間(Cyberspace)和眾包(Crowdsourcing)、數據產業等都是相關的新業態。以前我們可能在休息的時候玩一會兒游戲,但現在有很多人生活在賽博空間的虛擬現實中。對有些人來講,賽博空間是他們的“第二生活(Second Life)”,而對另一些人來講甚至是“第一生活”空間。他們長期生活在其中,心理、行為可能會發生變化,也會產生一些商業機會。很多企業的主要業務就是滿足這類虛擬需求的,比如說賣秘籍的,賣虛擬裝備的,賣虛擬幣的。雖然人們在觀念認同上可能存在差異,但在這種新業態上確實產生了年銷售額非常可觀的企業。眾包是企業外部的大眾為企業出創意、做設計等工作,這種新型生產組織形式還未得到企業的足夠重視,其潛力不應被低估。此外,云計算和大數據應用需要新型數據平臺和資源虛擬整合優化,所以數據中心產業會興起,這會涉及很具體的產業政策、宏觀環境等整個生態系統。
新人群 很多中老年人從1970年代開始學習信息處理,應該算是信息社會的“移民”,但是現在兩三歲的兒童都能對iPad上癮,是信息社會的“原住民”。雖然從年齡上來看,在歲數上差一代兩代,但在技術進化來看,可能跨了很多代,中間隔著處于各種技術代的人群。如果企業的員工、客戶都是這些信息社會的新生代或原住民了,那么組織行為、績效管理、KPI、企業文化、客戶關系管理都要發生改變。舉例來說,和這些人溝通,除了面談、聚會之外,微信、QQ成了更重要的溝通方式;而與老客戶老員工溝通,可能還是要采取傳統套路。
BA將成企業關鍵能力
面向大數據機遇和挑戰的應對策略是進行長期部署和短期規劃,一步一步走。從長期來看,大數據的影響是深刻的。但眼下對企業而言,應對大數據的第一步是構建BA能力。
關鍵詞:大數據 數據分析
中圖分類號:TP3 文獻標識碼:A 文章編號:1672-3791(2013)07(b)-0029-01
在計算機系統中,各種字母、數字符號的組合、語音、圖形、圖像等統稱為數據,數據是信息的載體。以博客、微博、社會化網絡為代表的新型互聯網的應用,使得用戶成為數據產生的重要來源,數據的規模以前所未有的速度在不斷的積累和增長。谷歌公司每天要處理超過24PB(1PB=250字節)的數據。Facebook公司每天更新的照片數量超過1000萬張。Twitter上的信息量幾乎每年都要翻一番,每天都會超過4億條微博。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規模將達到今天的44倍。毫無疑問,大數據時代已經到來。
1 何為大數據
大數據(Big Data)并非新生事物,2008年9月4日《自然》推出了名為“大數據”的專刊,其實它在物理學、生物學、環境生態學、自動控制等科學領域,以及軍事、通訊、金融等行業已存在多年。近年來,隨著互聯網行業的蓬勃發展越來越得到人們的關注,開始煥發出勃然生機。
一般認為,大數據又稱巨量資料,是由數量巨大、結構復雜、類型眾多數據構成的數據集合,是基于云計算的數據處理與應用模式,通過數據的整合共享、交叉復用形成的智力資源和知識服務能力。2012年初,《紐約時報》撰文,宣告“大數據時代”已然降臨。大數據正在對各個領域都造成影響。在商業、經濟及其他領域中,越來越多的決策行為將日益依賴于對數據的收集和分析而做出,在公共衛生、經濟發展和預測等領域中,大數據的預見能力也已經嶄露頭角。
2 大數據的特點
大數據并不是一個確切的概念,甚至人們對它的理解也存在認識上的混淆。
“大”并不能準確的描述大數據的全部特征。大數據具備四個特點,第一,數據體量巨大:從TB級別,躍升到PB級別,甚至EB級別;大數據”龐大很龐大,以至于不能用G或T來衡量,大數據的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。第二,數據類型繁多:數據多樣,包括網絡日志、音頻、視頻、圖片、地理位置信息等等,多類型的數據對數據的處理能力提出了更高的要求。第三,價值密度低,不相關信息數量龐大,需要深度挖掘分析。如隨著物聯網的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何通過強大的機器算法更迅速地完成數據的價值“提純”,是大數據時代亟待解決的難題。第四,處理速度快。時效性要求高。這是大數據區分于傳統數據挖掘最顯著的特征。
3 大數據的應用
2012年,奧巴馬政府宣布投資2億美元拉動大數據相關產業發展,將“大數據戰略”上升為國家意志。奧巴馬政府將數據定義為“未來的新石油”,并表示一個國家擁有數據的規模、活性及解釋運用的能力將成為綜合國力的重要組成部分,未來,對數據的占有和控制甚至將成為陸權、海權、空權之外的另一種國家核心資產。而這些事情在小規模數據的基礎是無法實現的。大數據對于國家來說是一個歷史性的機遇,人們如今可以使用極為豐富的數據資源,來對社會經濟進行前所未有的實時分析,幫助政府更好地響應社會和經濟運行。對于企業來說,海量數據的運用將成為未來競爭和增長的基礎,通過對海量數據進行分析獲得有巨大的價值的產品和服務,數據將成為一切行業當中決定勝負的根本因素,最終數據將成為人類至關重要的自然資源。
目前,對于大數據的應用研究處在起步階段,隨著互聯網技術的不斷發展,數據即資產,這一觀點在業界已經達成共識。越來越多的政府、企業等機構開始意識到數據正在成為組織最重要的資產,數據分析能力正在成為組織的核心競爭力。對數據的分析,獲得有價值的信息,大數據是為了大智慧。隨著商業環境的變化發展,營銷方式也發生了巨大的變化,例如營銷數據的獲取,過去傳統的市場調研通常采用問卷、用戶走訪的形式,在每個網站、每個頁面以及每個廣告都記錄下每一次用戶訪問的信息,用戶來自哪里,是單次訪問還是重復訪問,每次來駐留的時間有多長,是直接訪問還是通過搜索引擎,看了什么內容、最關注哪些內容等等都一一存在。而這一切的獲取和分析都離不開大數據,對數據分析,要實現較高的精準、細分的數據,必須建立在大數據的基礎上,進行全數據的分析。搜索記錄、Facebook的留言和微博消息使得人們的行為和情緒的細節測量成為可能。挖掘用戶的行為習慣和喜好,在凌亂紛繁的數據背后找到更符合用戶興趣和習慣的產品和服務,并針對產品和服務進行針對性的調整和優化,這就是大數據的價值所在。
4 大數據產業鏈分析
IDC的數據顯示,2015年整個大數據市場將超過170億美元。大數據的商業機會主要在以下幾個方面。第一,數據中心的規劃、建設、運營及優化,三分技術,七分數據,得數據者得天下。隨著未來數據的規模劇增,數據中心的建設與維護是必不可少的。大數據需要在服務器和存儲設施中進行收集,并且大多數的企業信息管理體系結構將會發生重要大變化,需要擴大他們的系統,以解決數據的不斷擴大。第二,數據分析和挖掘,據“棱鏡”計劃顯示,美國政府多年前就開始基于海量數據的大數據技術應用,利用谷歌、雅虎、Facebook等網絡服務公司提供的電郵、即時消息、聊天記錄、社交網絡資料、以及登錄時間等海量數據中挖掘情報信息。第三,在大數據時代,商業智能有望得到迅速發展。商業智能是數據庫技術、人工智能技術、統計技術和軟件技術等的有機結合,根據功能不同,可細分為工具平臺軟件和應用軟件兩大部分。從全球范圍來看,商業智能已經成為軟件市場當前最具發展潛力的領域之一。第四,信息安全,如何處理海量數據,成為未來IT發展的關鍵,而在人們充分享受大數據所帶來的便利的同時,其背后所潛藏著的數據丟失風險不容忽視。故此,數據保護和安全的產業前景也同樣有巨大的機會。
參考文獻
[1] 孟小峰,慈祥.大數據管理:概念、技術、挑戰[J].計算機研究與發展,2013,50(1).
【關鍵詞】大數據;圖書館;信息服務;服務創新
1 大數據的內涵和特點
信息技術、云計算的蓬勃發展,促使信息量成指數級增長,在2011年,麥肯錫公司(McKinsey)就提出了“大數據時代到來”的觀點,這引起了全球的廣泛關注,該觀點認為大數據已經滲透到全球經濟中的每一個行業和業務職能領域,它將和硬件設施、人力資源一樣成為當今增強創新力,增加競爭力和提升生產力的驅動力[1]。那究竟什么是大數據?至今尚未得到學界或業界的統一共識。賽迪顧問公司的吳李知認為,大數據是指需要通過快速獲取、處理、分析以從中提取價值的海量、多樣化的交易數據、交互數據或傳感數據[2]。但人們更普遍認為大數據是指信息技術大量應用于各行各業,使得后者擁有快速獲取、高速存儲、精準分析和智慧處理大量化、多樣化、快速化、價值化的各種類型的數據,包括結構化數據、非結構化數據、半結構化數據。大數據帶來的信息風暴正在變革我們的生活、工作和思維,大數據開啟了一次重大的時代轉型。大數據改變了人們的認知方式,其核心是預測,而預測結果之所以能夠成功,關鍵在于它們是建立在海量數據基礎之上的。
IBM在2011年美國拉斯維加斯舉辦的IOD2011大會上指出了大數據的“3V”特征,即多樣性(Variety)、容量(Volume)和速度(Velocity)[3]。IDC(Internet Data Center,既互聯網數據中心)定義了大數據的4大特征,在原“3V”特征基礎上又增加了數據價值(Value),并賦予了原“3V”特征新的含義[4]。目前大數據“4V”特征已經得到了科學界的共識,正是這四個特征對數字時代的數據存儲、信息共享、數據挖掘分析等方面都帶來了巨大的沖擊和變革。大數據帶來的變革和挑戰是具有顛覆性的,大數據的發展基礎是信息技術的進步,顯著特征就是人類社會的數據化生存,在于人們通過對數據的獲取、利用和分析,進而提供一種有價值的信息源。信息源使得人們的社會生活、行為態度、交往過程、互動關系都被記錄并保存下來,通過以恰當的方式處理海量數據,可以尋找隱藏在數據中的模式、趨勢和相關性,揭示社會現象與社會發展規律,并能夠預測結果。
2 圖書館中的“大數據”
電子資源的出現極大的豐富了館藏資源,圖書館的布局、管理和服務也隨著資源結構的變化而發生巨變,經費逐年遞增,資源購進更加具有針對性、科學性和合理性,形式、內容和服務更加多樣化,已經由傳統的單一型走向復合型。隨著電子資源、電子數據庫等數據資源所占的比例逐漸增加,圖書館的存儲形式也相對發生了巨大改變,讀者對文獻資源的獲取形式也逐漸網絡化、移動化,一些新生代讀者更希望獲取私人定制資源。經過快速的發展,長期的積累,圖書館的書目數據、各類電子資源、讀者行為信息等數據資源隨著圖書館的硬件設施的強化也在迅速積累,雖然這些數據在編碼和格式上并不統一,但也形成了大量的異構數據,具備了大數據的特點。傳統上這些零散的異構數據并沒有得到充分的開發、利用,只是作為一種常規數據進行存儲,但是隨著數據挖掘、預測分析技術的發展,這些數據在讀者信息服務中開始逐漸發揮出決策作用。
在大數據時代背景下,圖書館的物理形態、服務方式、資源存儲及用戶群體等都發生了巨大的變化,同時圖書館在大數據運作的過程中也面臨新的挑戰。單一的結構化數據庫無法滿足用戶需求的多樣性,圖書館現有的信息化數據存儲和分析能力不強,未建立相應的數據分析輔助決策系統,并不能充分挖掘這些數據的潛在價值,不能為決策者提供有力的數據支持,這需要傳統的信息服務內容亟須轉變。網絡技術的發展,信息量指數級的遞增,讀者獲取信息渠道的多樣化,這些基本原因正在促使圖書館信息服務模式發生著根本性的變革,從而出現了從以物為本走向以人為本、從被動走向主動、從實體走向虛體等新的服務理念。
在這個數據為支撐時代,傳統的圖書館信息服務模式已經遠遠不能滿足讀者日益增長的信息需求。為了更加快速、準確、多渠道、多形式獲取所需信息,讀者對圖書館的信息服務提出了更高的要求,如何滿足讀者的特定化需求,已成為圖書館信息服務發展過程中所必須解決的問題。面對大數據背景下信息浪潮的沖擊,怎樣利用圖書館中的“大數據”分析、挖掘結果,提高圖書館信息服務質量是急需解決的問題。
3 大數據背景下圖書館信息服務的變革和創新
3.1 信息服務觀念的變革和創新
圖書館傳統的“館內”信息服務觀念缺乏創新性和主動性,只是被動服務于讀者,這種服務手段落后,層次低,難以發揮圖書館信息服務的作用,嚴重制約了圖書館信息服務的發展,已經遠遠不能滿足于讀者日益多元化的信息需求。大數據背景下,圖書館信息服務的觀念要與時俱進的變革和創新。樹立以讀者為本的服務理念,一切為了讀者,一切從讀者需求出發。深度發掘、分析圖書館中與讀者相關數據,針對不同的讀者群,制定具有針對性的定制服務,強化主動創新意識,由被動型服務轉為主動型服務,以數據分析預測結果為基礎,建立超前服務意識,了解讀者預期需求,提前制定服務計劃,做好信息資源儲備,創新信息服務觀念,使圖書館信息服務綜合化、多元化,與讀者需求成為一個完整的、有機的整體。
3.2 管理模式的變革和創新
圖書館傳統的文獻采購、加工、保存、流通的管理模式已經嚴重滯后,遠遠的不能滿足現代圖書館發展的需求。存儲技術的發展,為圖書館積累了大量的異構數據,數據信息量的龐大及不斷更新就要求圖書館改變現有的管理模式,建立以適應大數據時代圖書館發展需要的管理模式。強化文獻采訪,建立讀者參與機制,轉變讀者角色,由被動接受服務,轉變為主動要求服務,使讀者成為館藏資源建設者,參與到館藏建設過程中。充分發揮讀者主觀能動性,調動讀者參與意識,提高資源建設質量。變革現有圖書機械借還模式,強化發掘讀者潛在借閱需求,提高服務質量,增強資源推薦力度,提供館藏文獻流通率。強化信息咨詢服務,加大館藏數據分析力度,預測讀者文獻需求期望,增加讀者培訓力度,為讀者提供優質、快速的信息服務。
加強館內部門之間的合作,尤其是流通、采編、咨詢部門之間的合作,互通讀者需求信息,建立讀者信息反饋聯絡點,及時整理、分析各部門收到的讀者反饋信息,協調相關部門及時解決問題,并針對讀者提出的問題及時改進工作方法,為提高信息服務質量打造一個堅實的管理平臺。
3.3 面向讀者的館藏資源整合
計算機技術和信息網絡的進步為信息服務開拓新的發展方向創造了條件,大數據概念的提出為圖書館信息服務改革創新提供了有力的支持,然而新技術、新環境、新需求也對圖書館信息服務提出了新的挑戰,圖書館傳統的館藏資源模式已經無法適應內部和外部的種種變化,傳統模式的弊端已經嚴重束縛了圖書館信息服務在知識經濟條件下的發展。只有進行面向讀者的館藏信息資源整合,才能適應新時代的要求,滿足讀者多維度的信息需求。
傳統圖書館要想從根本上提高信息服務能力,滿足用戶對于便捷性、個性化、時效性、系統性、智能型的多種需求特征,就必須從資源核心出發,推進資源整合服務戰略,全面推廣資源繼承服務體系,提高信息服務的知識含量,推進信息資源全方位整合系統,在圖書館整體上進行資源、服務、技術、環境和用戶的全方位整合。在現有館藏資源的基礎上,實現紙質資源與電子資源、圖書資源與期刊資源、中文資源與外文資源、館藏資源與網絡資源、采購資源與合作自建資源等資源的合理配置,促進資源立體化、層次化,為信息服務提供有力的資源保障。
面對館藏資源,只有基于大數據分析技術的推進網絡集成技術戰略,強化對網絡以及現代信息技術的綜合利用,是當前大數據背景下圖書館館藏資源整合的重要特征。針對館內存儲數據,推進分布式異構信息資源整合管理措施,適時動態資源整合,拓展信息服務渠道,推進信息服務資源整合能力的培育,提高數據挖掘、分析能力,充分利用數據分析結果預測讀者信息需求期望,具有針對性的劃分資源整合模塊,才能定制符合不同讀者需求的信息服務。
3.4 建立數據分析輔助決策系統
數據分析輔助決策是對數據的搜集、融合、挖掘和分析過程,將分析后的數據以動態、直觀的多維報表、圖形等形式占線給決策者,為決策提供數據依靠。獲取最佳數據分析輔助決策結果,往往需要一個強有力的決策分析系統的支持,以便在系統中整合各項功能,并未決策者提供一個統一的系統應用環境。目前高校圖書館的數據管理系統雖然可以高效實現數據的查詢和統計,但是無法有效的充分利用這些數據,不能將圖書館所存儲的數據有機整合,不能進行深度的發掘、分析,只能進行簡單的運算,所獲得的結果已經遠遠不能滿足決策者對數據結果的需求。
在當前大數據背景下,建立圖書館數據分析輔助決策系統,有利于利用圖書館有限的購置經費最大限度的優化館藏,極大提高讀者信息獲取速度及獲取綜合信息的能力[5];能夠針對不同類型讀者提供定制服務,能夠提高信息服務質量并挖掘讀者潛在需求;能夠為決策者提供有效數據支撐,縮短決策制定時間,有效發揮決策潛在能量。
4 結語
當前圖書館信息服務的核心是滿足讀者的信息需求,傳統的信息服務已經滯后于時代的發展,大數據概念的提出及在圖書館的應用,為圖書館信息服務提供了新的活力和動力。其所產生的影響將改變圖書館的服務理念和管理模式,這種先進的數據存儲、傳遞、分析和使用技術將給圖書館帶來更大的機遇、變革和挑戰,圖書館信息服務只有通過不斷的創新,才能適應這一切。所以,圖書館信息服務在不斷的變革和創新過程中,要不斷進行自我完善,讓大數據在圖書館中發揮越來越大的優勢。
【參考文獻】
[1]Manyikn J, Chui M, Brown B, et al. Big Data: The Next Frontier for Innovation, Competition, and Productivity [R]. Mckinsey Company, 2011.
[2]吳李知.數據資產化與決策智能化時代來臨[N].中國計算機報,2012-06-25(02).
[3]互聯網數據中心[EB/OL]. [2013-01-04]. .cn.
[關鍵詞]大數據;信息技術;數據處理
[中圖分類號]TP274[文獻標識碼]A
20世紀中葉計算機的誕生標志著電子時代正式開始,從此人類社會開始生產并存儲各類型的數據。經過數次計算機技術革命,單位面積所能存儲的數據量大大提高。近年來,由于WEB2.0應用的全面爆發,網絡參與者同時也成了網絡信息的制造者,由WEB2.0帶來的大規模非結構化數據開始呈現出幾何增長。因此,麥肯錫公司在2011年的報告《Big Data:the Next Frontier for Innovation》[1]中,對這種密集型數據爆炸的現象成為“大數據”時代的到來。
1大數據的概念
大數據的概念并不是憑空出現的,它的前身是海量數據。但兩者之間有所區別。海量數據強調了數據量的規模之大,并沒有對其特性進行定義。而大數據的概念包含了大數據的體積、傳播速率、特征等內容。雖然截至目前還沒有對大數據有統一的定義,但被廣泛接受的定義為:大數據是無法在一定時間內用通常的軟件工具進行收集、分析、管理的大量數據的集合[2]。大數據的特點一般歸納為四點:一是數據總量大,目前大數據的最小單位一般被認為是10~20TB的量級;二是數據類型多,包括了結構化、非結構化和半結構化數據;三是數據的價值密度很低;四是數據產生和處理的速度非常快。這四個特點又被稱作大數據的4 V理念,即:Volume,Variety,Value,Velocity[3]。
2大數據的技術
依據大數據生命周期的不同階段,可以將與大數據處理相關的技術分為相應的三個方面:
2.1大數據存儲
從海量數據時代開始,大規模數據的長期保存、數據遷移一直都是研究的重點。從20世紀90年代末至今,數據存儲始終是依據數據量大小的不斷變化和不斷優化向前發展的。其中主要有:DAS(Direct Attached Storage),直接外掛存儲;NAS(Network Attached Storage),網絡附加存儲;SAN(Storage Area Network),存儲域網絡和SAN IP等存儲方式[4]。這幾種存儲方式雖然是不同時代的產物,但各自的優缺點都十分鮮明,數據中心往往是根據自身的服務器數量和要處理的數據對象進行選擇。
此外,這兩年數據存儲的虛擬化從研究走向現實。所謂虛擬化,就是將原有的服務器進行軟件虛擬化,將其劃分為若干個獨立的服務空間,如此可以在一臺服務器上提供多種存儲服務,大大提高了存儲效率,節約存儲成本,是異構數據平臺的最佳選擇。從技術角度來講,虛擬化可以分為存儲虛擬化和網絡虛擬化,網絡虛擬化是存儲虛擬化的輔助,能夠大幅度提升數據中心的網絡利用率和傳輸速率。目前IBM、浪潮、思科等公司紛紛發力虛擬化市場,可以預見虛擬化會成為未來大數據存儲的一個主流技術。
2.2大數據挖掘
在大數據的處理技術中,超大規模的數據挖掘一直是難點,也是重點。面對上百TB,甚至PB級別的異構數據,常規的處理工具往往難以擔當重任。需要考慮到的是大數據是個不斷生長的有機體,因此在挖掘過程中還要考慮到未來數據繼續增長所帶來的影響。
因此,大數據的挖掘需要采用分布式挖掘和云計算技術。Google公司一直是分布式挖掘技術的領導者,它研發了MapReduce分布式挖掘工具[5],英特爾公司在此基礎上開發了Hadoop分布式挖掘工具。這兩個工具都具有高效、高擴展、高可靠性和高容錯率的特點,并提供免費版本,適用于各種類型的大數據挖掘。
2.3大數據分析
從內容來說,大數據的分析分為技術和方法兩種類型。從技術上講,主要是分布式的數據分析和非結構化數據處理等。從方法上講,主要是利用常用的數理統計方法來進行數據分析,例如使用可視化的數據分析工具。但兩者是一個有機的整體。大數據處理的最終目的是為了將數據之間的關系以可視化的方式呈現在用戶面前,包括了處理的全部過程和展現的過程。在數據分析過程中,不僅僅是需要計算機進行自動化的分析,更需要人工進行數據選擇和參數的設定,兩個是辯證的關系。
隨著大數據行業的興起,產生了一個新的職業,被稱作數據科學,而從事該行業的人員被稱作數據科學家。這類科學家的一個特點就是能夠藝術性地將數據進行可視化分析,簡單明了而且能夠展現出數據之間的關聯關系。
3大數據的應用
麥肯錫在大數據的研究報告中指出,大數據的應用已經滲透到每一個行業和業務職能領域,逐漸成為了重要的生產因素[6]。按照專業領域劃分,信息技術、互聯網行業、商業、遙感探測已經開始應用大數據技術來進行研究和生產效益;生物信息技術、科研情報所、圖書情報領域已經對大數據展開了研究,并進行了規劃;其他專業和行業對大數據可能仍處于了解階段,但大數據的浪潮很快就會波及大部分的行業領域。
從大數據的應用效果來看,總體趨勢與上述的三類專業呈現出一致性。百度、淘寶等公司作為信息技術、互聯網和商業領域的杰出代表,已經對大數據開始了深度應用,馬云在卸任阿里巴巴CEO時更是闡述了大數據時代將改變互聯網商業的面貌,誰提前開始大數據的應用,就可以獲得未來行業發展的優勢。大數據的普及需要一個過程,首先從重點應用行業開始,例如信息技術領域行業,逐漸擴展到其他行業。美國已經由白宮頒布了大數據開發與利用的國家級戰略,由美國國防部和國土安全局牽頭開展全面推廣大數據的應用。我國目前對大數據的研究并不多,應用更是缺乏。如果要推動大數據的應用,應當由國家層面進行大數據的平臺建設。在今年的國家自然科學基金和社會科學基金的課題指南中,已經提出了很多設計大數據的課題,相信在未來幾年內國家會對大數據的研究、開發與利用提供政策和資金支持。
總而言之,大數據的技術與應用還是處于起步階段,其應用的前景不可估量。各個行業應當把握時代脈搏,充分認識到大數據所能帶來的革命性改變,只有這樣才能夠保持創新與進步,從而站在行業的最前沿。
參考文獻:
[1]Manyika J,McKinsey Global Insti? tute,Chui M,et al. Big data: The next fron? tier for innovation,competition,and produc? tivity[M]. McKinsey Global Institute,2011.
[2]盧勝軍,王忠軍,栗琳.賽博空間與大數據雙重視角下的錢學森情報思想[J].情報理論與實踐,2013,36(004): 1-5.
[3]Hirt C W,Nichols B D. Volume of fluid(VOF)method for the dynamics of free boundaries[J].Journalofcomputational physics,1981,39(1): 201-225.
[4]Chirillo J,Blaul S. Storage Security: Protecting,SANs,NAS and DAS[M].John Wiley & Sons,Inc.,2002.
[5]Dean J,Ghemawat S. MapReduce: simplified data processing on large clusters[J]. Communications of the ACM,2008,51(1): 107-113.
[6]鄭玲微.大步跨入“大數據”時代[J].信息化建設,2013(1).
關鍵詞:計算機;輔助外語教學;范式轉移
一、定義“大數據”
在社會科學研究中,當下最熱門的名詞之一莫過于“大數據”了。對于傳統概念冠以“大數據”的名目,已經成為一種時尚和風潮。在“大數據”以鋪天蓋地之勢席卷人們視聽的同時,這個概念又在各種語境下被混用,甚至濫用,導致人們對使用該詞時的具體所指莫衷一是。面對這種學術誤區,本文力圖闡明大數據在計算機輔助外語教學語境下的內涵和外延,并指出大數據作為一個全新的歷史坐標如何區別于“信息”、“訊息”和傳統意義上的“數據”等相關概念。首先,盡管二者關系緊密,“大數據時代”的提法在諸多方面局別于早先的“信息社會”的概念。總體來講,大數據是一種特殊的信息,以大容量、高速度,以及多樣性著稱。追根溯源,信息的概念來自于數學家克勞德•香農1948年的著作《通信的數學理論》中提出的“信息論”(也稱“信息理論”)。香農認為,信息以一種極為特異方式運作。信息與其他物品的流通不同,一旦被分享,就相當于被復制,無論是傳播者和接受者都獲得了同等數量和信息。這種特征的意義就在于其使用只會創造增值而非貶值,因此信息就可以在傳播者不放棄信息本身的情況下將其分發。信息既是一種物質,又是一種能量,而在大數據時代,這種“大、快、多”的信息給數據挖掘等新興技術提供了豐潤的土壤。其次,如果說大數據是一種特殊的信息,那它和訊息之間的聯系就更加錯綜復雜了。從技術決定論的角度上說,對于大數據的崇拜暗合了前衛媒介理論家馬歇爾•麥克盧漢的理論———“媒介即訊息”。當我們不停地輾轉于各種媒介技術變革時,往往是這些媒介本身,而并非技術所傳達的訊息,成為定義這個時代的標準。然而,從信息論的角度來看,大數據”中包含的遠遠不僅是“訊息”,還有大量的“噪聲”。事實上,作為一種新媒介,大數據已經遠遠超越了傳統數理統計的設計能力和人們的認知能力,而這其中絕大多數的內容并沒有實際意義,甚至會給解碼訊息造成一定的阻礙。舉一個簡單的例子來說,一個入門語言學習者固然可以利用搜索引擎來翻譯母語中的成語和習語,然而在成千上萬的搜尋結果中,真正正確的翻譯可能極少。盲目相信搜索引擎提供的翻譯往往會貽笑大方。因此,怎樣在大數據中獲得訊息,并篩除噪聲,是計算機輔助外語教學的一個關鍵命題。在充分理解信息和訊息的關聯的基礎上,“數據”的內涵便其義自見了。簡而言之,數據既可以是信息,又可以是訊息。根據具體語境變化,數據的概念也十分靈活多變,而其是否具有意義,則取決于如下幾個方面。其一,數據內容和對內容的解讀和篩選往往使數據本身具有極大的延展性。同樣的數據在不同的解讀者眼中的意義可能會大相徑庭。舉例來說,互聯網上由用戶自下而上組建的集合性數據庫(如百度文庫、豆丁網等)往往充斥著良莠不齊的外語學習資料,而如何刪選并甄別這些內容則是考量外語學習者媒介和語言學習素養的重要指標。具有較高判斷力的學習者可能會找到質量較高的文檔,并經過重新整合,為己所用,而有些學習者可能會在萬花筒一樣的文檔海洋中迷失自我,不知所措。由此可見,“唯數據論”并不科學,更不用說盲目迷信“唯大數據論”往往會誤導外語學習者,制造迷惑,而日益發展膨脹的計算機信息系統則可能恰恰是這種迷惑的始作俑者。其二,數據格式往往決定了對其解碼的方法和難度。在計算機輔助外語教學中,由于數據的來源十分廣泛,如專門設計的學習軟件、既成的數據和語料庫、網絡資源等等,數據可能存在于多種不同的格式,如用戶創建內容(UserGeneratedCon-tent),底層數據記錄(logdata)等等。隨著數據量的增加和數據格式的多樣化,索引和整理數據的難度也逐漸遞增。當下五花八門的外語培訓機構也正是利用了他們突擊組織人力物力的能力,對不同格式數據的整合利用,通過尋求最優解來吸引招生。在高校中,盡管人員分工明確,資質優良,但往往缺乏這種突擊組織人力物力的動因,仍以傳統講授為主,各種科技輔助的效用沒有得到充分發揮。因此,高校也應該反思如何在大數據的海洋里樹立自己獨有的一面風帆,為學習者引航指路。綜上所述,對于大數據一詞的理解應遠遠超越“大”和“數據”兩詞的簡單疊加。大數據不僅是一種大容量、高速度和多樣化的信息,又在傳播訊息的同時夾帶了各種噪聲。豐富的數據內容和復雜的數據格式決定了計算機輔助外語教學必須與時俱進,通過甄別篩選,整合資源,為外語學習者提供一條最優路徑。
二、計算機輔助外語教學的范式轉移
計算機信息技術以及相關領域的迅猛發展使得我們日常接觸的數據每天幾何式增長,以爆炸性的突變影響著整個社會。動輒數千TB甚至PB的大數據正在挑戰傳統的數據處理和分析手段。高峰期間,新浪微博每天可以產生將近一億條的新微博,而百度目前數據總量已經突破1000PB。根據權威分析,2020年全世界數據量將是十年前的44倍。如果說量變的積累會導致質變,那大數據無疑正在用巨大的量變挑戰傳統學科中曾被奉為圣經的各種假定。借用美國著名哲學家托馬斯•庫恩在其著作《科學革命的結構》中提出的術語,大數據正在引領了一場遍布自然科學和社會科學的“范式轉移”(paradigmshift)。這種范式轉移也將深刻地影響計算機輔助外語教學的理論與實踐。理解范式轉移,我們首先要提出的問題是:“何為計算機輔助外語教學的范式?”。庫恩認為,范式就是一種公認的模型或模式。在科學活動中被廣泛接納的定律、理論和范例,都是范式的組成部分。換言之,范式不僅僅囿于科學的本體論層面,在認識論和方法論層面也需要有明確的體現。而這些體現需要被主流研究集團所認可,成為指導性的研究綱領,并構建之后的科研實踐,以形成完整的科研體系。對于計算機輔助外語教學而言,其基本范式則發源于20世紀后期,中興于世紀之交,并在近年來引發了學科在新時代何去何從的諸多討論。桂詩春認為,廣義上來講計算機輔助語言教學不僅包括具體教學過程,還涉及教學途徑、大綱設置、教學方法、教材、測試等一系列因素。陳堅林指出,在新時代中計算機與網絡已屬同義詞,而計算機輔助外語教學其實一種植根于互聯網資源的外語教學新模式。從業內專家的定義不難看出,計算機輔助外語教學的范式雖然隨著時代的發展發生了微妙的變化,但是“輔助”二字仍然是該學科的核心假設。“輔助”一詞所傳到的意思不言自明,一方面認可計算機信息技術在外語教學中可能扮演的重要角色,另一方面又唯恐其“喧賓奪主”。一些較為傳統的高校教師可能會認為電教輔助設施不過是“奇技巧”,會使學生注意力渙散,教師授課能力降低,影響教學質量。筆者認為,該學科的范式轉移恰恰來源于對“輔助”二字的重新定義。眾所周知,美國教育考試服務中心(ETS)所推出的TOEFL和GRE標準化英語考試,全部在計算機網絡上進行,其試題具有很高的信度、效度和區分度。學生在備考時,也可以通過ETS購買樣題,上機訓練。備考人員如果不熟悉計算機和相關考試軟件的操作,則無法在規定時間內獲得滿意的成績。在這些考試中,計算機所扮演的角色已經超越了傳統意義的輔助,而是成為了整個考試的有機組成部分,甚至是將這類標準化考試以最低成本推廣到全球的重要手段。我們不難看出,這種標準化考試從根本上要求培訓者和學習者不僅要具有合格的外語水平,還需要具有一定的計算機水平和媒介素養。因此,這種范式轉移其實是從“輔助論”過渡到“等量齊觀論”的過程,具體來說,即計算機水平和外語教學水平是互相聯系,密不可分的兩個個體,在成功的教學中缺一不可。另一方面,我們對于計算機一詞的理解,也在不斷深化、擴展、向前推移。移動輔助語言學習(Mobile-assistedlanguagelearning)就是計算機輔助外語學習在大數據時代的一種全新模式。當智能手機幾乎成為人人必備的設備時,許多學習者也開始嘗試通過手機、平板電腦等移動平臺學習語言,無疑在極大程度上拓展了傳統教學的時間和空間。移動平臺中社交媒體往往有機融合了語言學習,使得“背單詞打卡”、“詞匯量測試”成為我們手機中司空見慣的語言學習形式。許多移動設備客戶端在傳播信息的同時,也在收集個人信息,并按照個人信息量身定做學習計劃,使得語言學習的興趣和效率激增。需要特別關注的是,在這些全新的模式中,教育者的形象是逐漸被弱化的,而知識作為教學的本體則被強化。可以說,在大數據引領的這場前所未有的范式轉移中,傳統的“一師多生”模式逐漸演變為“一生多師”,甚至“無師自通”。當然,究竟這種“無師自通”的語言學習是否像傳統語言學習一樣有效,則是學界熱議的話題。一些專家認為,最優的語言學習應是課上/線下教授配合課下/線上復習。這種學習模式的效果考量則是又一個重要問題。
三、計算機輔助外語教學的新生:機遇和風險
毋庸置疑,大數據時代的到來也預示著計算機輔助外語教學的一次全新蛻變,而在這種新生的背后,機遇和風險總是并存的,而外語教育者則需要辯證看待這種關系,以有效掌控時代的脈搏。以下,筆者總結了三條大數據時代計算機輔助外語教學的特征,并探討每種特征背后蘊藏的各種機會和挑戰。
(一)教育權力結構的重組
對于新技術帶來的教育者形象甚至權威的弱化,前文已有提及,然而這種現象的背后則是更深層的教育權力結構的重組。當實體的教師和教育機構逐漸演化為計算機和移動設備中的虛擬人物時,教育權力曾經的支配性則受到了挑戰。這種教育權力的重構是大數據時代下由教師權力向知識權力的一種過渡。與教師預先掌握知識并設定評價標準的傳統模式不同,人們對知識的渴求在大數據的時代以多種形式被滿足。這種全新的知識教育體系對于我們而言,既是機遇,又是挑戰:一方面隨著權力的去中心化,教師所掌握的資源被計算機和網絡較為平均地予以分配,另一方面,教師作為教育質量把關人的角色也受到了削弱。因此,在大數據時代中,教育權利結構的重組將外語教學帶來極為深遠的影響。
(二)學習者為中心的啟示
“因材施教”,以學習者為中心的教育理念在大數據時代被重提,并在短短幾年中不斷在理論和實踐方面刷新教育者對這個理念的認知和解讀。當自主學習成為一種常態,外語學習者可以通過手機、電腦獲得網絡海量資源時,關鍵問題在于這些被中心化的學習者是否真正了解學習的目標和最為有效的學習手段。因此,培養學習者甄別篩選信息的能力是學習者為中心的學習模式給我們的重要啟示。
(三)高校扮演的重要角色
在計算機輔助外語教學的全新范式轉移中,高校扮演的極為重要的角色不容忽略。簡而言之,這種角色可以用“引進來,走出去”來概括。“引進來”指的是高校始終是培養外語人才的大本營。舉例來說,大學英語必修課和四六級考試成為很多學生堅持學習英語的重要動因。然而僅僅“引進來”已經不足以滿足時代賦予高校的使命,高校外語教育者還需要懂得讓學生“走出去”,即在課堂外通過各種新技術來鞏固學習成果。唯有讓“引進來”和“走出去”有機結合才能適應計算機輔助外語教學在大數據時代的范式轉移,將外語教學的事業推向一個全新的高峰。
參考文獻:
[1]陳堅林.大學英語教學新模式下計算機網絡與外語課程的有機整合———對計算機“輔助”外語教學概念的生態學考察.外語電化教學,2006(6),3-10.
[2]桂詩春.關于計算機輔助外語教學的若干問題──在全國計算機輔助語言教學專業委員會上的發言.外語電化教學,1994(4):3-5.
[3]Kuhn,T.S.Thestructureofscientificrevolutions.Univer-sityofChicagopress,2012.