亚洲AV无码成人网站久久精品大最新的|A区色逼逼不卡91AV一区二区|免费涩涩夜夜骑一区|亚洲中日韩成人在钱|男女视频在线观看无人一区二区|欧美精品成人在线观看一区二区|国产青青草原一区二区三区精品在线|久久免费观看伊人网|亚洲一区二区在线导航|日韩字幕一区二区

學習啦 > 知識大全 > 知識百科 > 百科知識 > 什么是大數(shù)據有什么特征與性質

什么是大數(shù)據有什么特征與性質

時間: 謝君787 分享

什么是大數(shù)據有什么特征與性質

  大數(shù)據必然無法用單臺的計算機進行處理,必須采用分布式架構。大數(shù)據也是具備有一定的特征與性質的。以下是由學習啦小編整理的大數(shù)據的內容,希望大家喜歡!

  大數(shù)據的主要介紹

  大數(shù)據(big data),指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應海量、高增長率和多樣化的信息資產,

  在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據時代》中大數(shù)據指不用隨機分析法(抽樣調查)這樣捷徑,而采用所有數(shù)據進行分析處理。大數(shù)據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)、Veracity(真實性)。

  大數(shù)據的特征

  容量(Volume):數(shù)據的大小決定所考慮的數(shù)據的價值和潛在的信息;

  種類(Variety):數(shù)據類型的多樣性;

  速度(Velocity):指獲得數(shù)據的速度;

  可變性(Variability):妨礙了處理和有效地管理數(shù)據的過程。

  真實性(Veracity):數(shù)據的質量

  復雜性(Complexity):數(shù)據量巨大,來源多渠道

  價值(value):合理運用大數(shù)據,以低成本創(chuàng)造高價值

  大數(shù)據的意義

  現(xiàn)在的社會是一個高速發(fā)展的社會,科技發(fā)達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數(shù)據就是這個高科技時代的產物。[7] 阿里巴巴創(chuàng)辦人馬云來臺演講中就提到,未來的時代將不是IT時代,而是DT的時代,DT就是Data Technology數(shù)據科技,顯示大數(shù)據對于阿里巴巴集團來說舉足輕重。

  有人把數(shù)據比喻為蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數(shù)據并不在“大”,而在于“有用”。價值含量、挖掘成本比數(shù)量更為重要。對于很多行業(yè)而言,如何利用這些大規(guī)模數(shù)據是贏得競爭的關鍵。

  大數(shù)據的價值體現(xiàn)在以下幾個方面:

  1)對大量消費者提供產品或服務的企業(yè)可以利用大數(shù)據進行精準營銷

  2) 做小而美模式的中小微企業(yè)可以利用大數(shù)據做服務轉型

  3) 面臨互聯(lián)網壓力之下必須轉型的傳統(tǒng)企業(yè)需要與時俱進充分利用大數(shù)據的價值

  不過,“大數(shù)據”在經濟發(fā)展中的巨大意義并不代表其能取代一切對于社會問題的理性思考,科學發(fā)展的邏輯不能被湮沒在海量數(shù)據中。著名經濟學家路德維希·馮·米塞斯曾提醒過:“就今日言,有很多人忙碌于資料之無益累積,以致對問題之說明與解決,喪失了其對特殊的經濟意義的了解。”這確實是需要警惕的。

  在這個快速發(fā)展的智能硬件時代,困擾應用開發(fā)者的一個重要問題就是如何在功率、覆蓋范圍、傳輸速率和成本之間找到那個微妙的平衡點。企業(yè)組織利用相關數(shù)據和分析可以幫助它們降低成本、提高效率、開發(fā)新產品、做出更明智的業(yè)務決策等等。例如,通過結合大數(shù)據和高性能的分析,下面這些對企業(yè)有益的情況都可能會發(fā)生:

  1)及時解析故障、問題和缺陷的根源,每年可能為企業(yè)節(jié)省數(shù)十億美元。

  2)為成千上萬的快遞車輛規(guī)劃實時交通路線,躲避擁堵。

  3)分析所有SKU,以利潤最大化為目標來定價和清理庫存。

  4)根據客戶的購買習慣,為其推送他可能感興趣的優(yōu)惠信息。

  5)從大量客戶中快速識別出金牌客戶。

  6)使用點擊流分析和數(shù)據挖掘來規(guī)避欺詐行為。

  大數(shù)據的結構

  大數(shù)據就是互聯(lián)網發(fā)展到現(xiàn)今階段的一種表象或特征而已,沒有必要神話它或對它保持敬畏之心,在以云計算為代表的技術創(chuàng)新大幕的襯托下,這些原本看起來很難收集和使用的數(shù)據開始容易被利用起來了,通過各行各業(yè)的不斷創(chuàng)新,大數(shù)據會逐步為人類創(chuàng)造更多的價值。

  其次,想要系統(tǒng)的認知大數(shù)據,必須要全面而細致的分解它,我著手從三個層面來展開:

  第一層面是理論,理論是認知的必經途徑,也是被廣泛認同和傳播的基線。在這里從大數(shù)據的特征定義理解行業(yè)對大數(shù)據的整體描繪和定性;從對大數(shù)據價值的探討來深入解析大數(shù)據的珍貴所在;洞悉大數(shù)據的發(fā)展趨勢;從大數(shù)據隱私這個特別而重要的視角審視人和數(shù)據之間的長久博弈。

  第二層面是技術,技術是大數(shù)據價值體現(xiàn)的手段和前進的基石。在這里分別從云計算、分布式處理技術、存儲技術和感知技術的發(fā)展來說明大數(shù)據從采集、處理、存儲到形成結果的整個過程。

  第三層面是實踐,實踐是大數(shù)據的最終價值體現(xiàn)。在這里分別從互聯(lián)網的大數(shù)據,政府的大數(shù)據,企業(yè)的大數(shù)據和個人的大數(shù)據四個方面來描繪大數(shù)據已經展現(xiàn)的美好景象及即將實現(xiàn)的藍圖。

  大數(shù)據的應用

  洛杉磯警察局和加利福尼亞大學合作利用大數(shù)據預測犯罪的發(fā)生。

  google流感趨勢(Google Flu Trends)利用搜索關鍵詞預測禽流感的散布。

  統(tǒng)計學家內特.西爾弗(Nate Silver)利用大數(shù)據預測2012美國選舉結果。

  麻省理工學院利用手機定位數(shù)據和交通數(shù)據建立城市規(guī)劃。

  梅西百貨的實時定價機制。根據需求和庫存的情況,該公司基于SAS的系統(tǒng)對多達7300萬種貨品進行實時調價。

  醫(yī)療行業(yè)早就遇到了海量數(shù)據和非結構化數(shù)據的挑戰(zhàn),而近年來很多國家都在積極推進醫(yī)療信息化發(fā)展,這使得很多醫(yī)療機構有資金來做大數(shù)據分析。

  大數(shù)據的主要特點

  第一,數(shù)據體量巨大。從TB級別,躍升到PB級別。

  第二,數(shù)據類型繁多,如前文提到的網絡日志、視頻、圖片、地理位置信息,等等。

  第三,價值密度低。以視頻為例,連續(xù)不間斷監(jiān)控過程中,可能有用的數(shù)據僅僅有一兩秒。

  第四,處理速度快。1秒定律。最后這一點也是和傳統(tǒng)的數(shù)據挖掘技術有著本質的不同。物聯(lián)網、云計算、移動互聯(lián)網、車聯(lián)網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,無一不是數(shù)據來源或者承載的方式。


看過“大數(shù)據是什么“的人還看了:

1.涂子沛大數(shù)據的讀后感

2.大數(shù)據基礎知識

3.大數(shù)據時代優(yōu)秀讀后感

4.大數(shù)據發(fā)展歷史簡介

5.大數(shù)據時代讀書心得體會

1363183