A. 大數據具體是什麼
二、什麼是大數據(大數據是什麼?)
大數據,又稱巨量資料,指的是所涉及的數據資料量規模巨大到無法通過人腦甚至主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。
三、發展歷程(大數據發展是否成熟?)
目前,我國大數據產業正處於高速發展期,多種商業模式得到市場印證,新產品和服務不斷推出,細分市場走向差異化競爭。
四、和傳統數據的區別(跟傳統數據有什麼區別?)
1、傳統數據信息化:
傳統數據信息化大多是存貯在本地,非全部公開數據資源,例如市場調研數據、企業數據、生產數據、製造數據、消費數據、醫療數據、金融數據等數據資源;把握數據資源的企業或行業也必然成為大數據的直接受益者。
2、大數據之移動互聯網:
移動互聯網的快速發展,搜索引擎及智能手機等移動設備成為重要的數據入口。社交網路、電子商務以及各類應用APP等將分散的"小數據"變成"大數據"。
3、大數據之物聯網:
物聯網的發展能夠實現"萬物互聯",所有事物產生的信息都是數據,所有事物之間都具有"數據化"的聯系。
五、應用領域(大數據用在哪些地方?)
B. 大數據是什麼
大數據的概念可能不同的人會有不同的理解,我自己從08年開始從事大數據相關的工作,那個時候我們是覺得自己搞的是雲計算和數據倉庫,而到了2011、2012年的時候,國內大數據的概念才興起來,之後就是炒了三年的概念。
因為從事這一方向,這幾年不斷會有人問我什麼是大數據?我一直都回答不好。在最近的幾個月,我對這一概念思考的更多一些,結合看過的一些資料(如《大數據時代》、《數學之美》第二版、《矽谷之謎》、吳軍的演講材料等)和實際的經歷,算是有了一些認識。與其說認識,還不如說是總結,換個角度看待這個問題,分為大數據概念和大數據思維。
我把大數據的概念總結為四個字:大、全、細、時。
大數據之大
我們先來看一組數據:
網路每天採集的用戶行為數據有1.5PB以上
全國各地級市今天的蘋果價格數據有2MB
1998年Google抓取的互聯網頁面共有47GB(壓縮後)
一台風力發電機每天產生的振動數據有50GB
網路每天的行為數據1.5個PB夠大吧?我們毫無懷疑這是大數據。但全國各個地級市今天的蘋果價格只有2MB大小,是典型的小數據吧?但如果我們基於這個數據,做一個蘋果分銷的智能調度系統,這就是個牛逼的大數據應用了。Google在剛成立的時候,佩奇和布林下載了整個互聯網的頁面,在壓縮後也就47GB大小,現在一個U盤都能裝的下,但Google搜索顯然是個大數據的應用。如果再來看一台風機每天的振動數據可能都有50GB,但這個數據只是針對這一台風機的,並不能從覆蓋面上,起到多大的作用,這我認為不能叫大數據。
這里就是在強調大,是Big不是Large,我們強調的是抽象意義的大。
C. 什麼是網路大數據
大數據是什麼?
首先,大數據技術是什麼?
簡而言之,從大數據中提取大價值的挖掘技術。專業的說,就是根據特定目標,從數據收集與存儲,數據篩選,演算法分析與預測,數據分析結果展示,以輔助作出最正確的抉擇,其數據級別通常在PB以上,復雜程度前所未有。
關鍵作用是什麼?
挖掘出各個行業的關鍵路徑,幫助決策,提升社會(或企業)運作效率。
最初是在怎樣的場景下提出?
在基礎學科經歷信息快速發展之後,就誕生了「大數據」的說法。但其實是隨著數據指數級的增長,尤其是互聯網商業化和感測器移動化之後,從大數據中挖掘出某個事件現在和未來的趨勢才真正意義上被大眾所接觸。
D. 大數據是什麼
大數據本身是一個抽象的概念。從一般意義上講,大數據是指無法在有限時間內用常規軟體工具對其進行獲取、存儲、管理和處理的數據集合。
目前,業界對大數據還沒有一個統一的定義,但是大家普遍認為,大數據具備 Volume、Velocity、Variety 和 Value 四個特徵,簡稱「4V」,即數據體量巨大、數據速度快、數據類型繁多和數據價值密度低,如下圖 所示。
E. 大數據指的是什麼
大數據是指無法在一定時間范圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對數據的「加工能力」,通過「加工」實現數據的「增值」。
(5)網路大數據是什麼擴展閱讀
大數據的價值體現在以下幾個方面:
1、對大量消費者提供產品或服務的企業可以利用大數據進行精準營銷
2、做小而美模式的中小微企業可以利用大數據做服務轉型
3、面臨互聯網壓力之下必須轉型的傳統企業需要與時俱進充分利用大數據的價值
參考資料來源:網路-大數據
F. 什麼是大數據 大數據是什麼意思
大數據是一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統資料庫軟體工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特徵。
從技術上看,大數據與雲計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單台的計算機進行處理,必須採用分布式架構。它的特色在於對海量數據進行分布式數據挖掘。但它必須依託雲計算的分布式處理、分布式資料庫和雲存儲、虛擬化技術。
(6)網路大數據是什麼擴展閱讀
大數據的價值體現在以三方面:
1、對大量消費者提供產品或服務的企業可以利用大數據進行精準營銷;
2、做小而美模式的中小微企業可以利用大數據做服務轉型;
3、面臨互聯網壓力之下必須轉型的傳統企業需要與時俱進充分利用大數據的價值。
G. 什麼是網路大數據
大數據應用程序需要處理大規模信息,而且在出於彈性的考慮將數據復制到多個位置時,信息的規模變得越來越大。但是,大數據的最重要屬性並不在於它的規模,而在於它將大作業分割成許多小作業的能力,它能夠將處理一個任務的資源分散到多個位置變為並行處理。
關鍵因素
1.網路彈性與大數據應用程序
如果有一組分布式資源必須通過互聯網路進行協調時,可用性就變得至關重要。如果網路出現故障,那麼造成的後果是出現不連續的壞計算資源與數據集。
2.解決大數據應用中的網路擁塞問題
大數據應用程序不僅僅是規模大,而且還有一種我稱為突發性的特性。當一個作業啟動之後,數據就開始流轉。在高流量時間段里,擁塞是一個嚴重的問題。然而,擁塞可能引起更多的隊列延遲時間和丟包率。此外,擁塞還可能觸發重轉,這可能讓本身負載繁重的網路無法承受。因此,網路架構設計時應該盡可能減少擁塞點。按照可用性的設計標准,減少擁塞要求網路具有較高的路徑多樣性,這樣才能允許網路將流量分散到大量不同的路徑上。
3.大數據中網路一致性要比遲延性更重要
實際上,大多數大數據應用程序對網路延遲並不敏感。如果計算時間的數量級為幾秒鍾或幾分鍾,那麼即使網路上出現較大延遲也是無所謂的——數量級大概為幾千毫秒。然而,大數據應用程序一般具有較高的同步性。這意味著作業是並行執行的,而各個作業之間較大的性能差異可能會引發應用程序的故障。因此,網路不僅要足夠高效,而且要在空間和時間上具有一致的性能。
4.現在就要准備大數據未來的可伸縮性
可能讓人有點意外的是,大多數大數據集群實際上並不大。
可伸縮性並不在於現在集群現在有多大規模,而是說如何平衡地擴展支持未來的部署規模。如果基礎架構設計現在只適合小規模部署,那麼這個架構將如何隨著節點數量的增加而不斷進化?在將來某一個時刻,它是否需要完全重新設計架構?這個架構是否需要一些近程數據和數據位置信息?關鍵是要記住,可伸縮性並不在於絕對規模,而是更關注於實現足夠規模解決方案的路徑。
5.通過網路分割來處理大數據
網路分割是創建大數據環境的重要條件。在最簡單的形式上,分割可能意味著要將大數據流量與其他網路流量分離,這樣應用程序產生的突發流量才不會影響其他關鍵任務工作負載。除此之外,我們還需要處理運行多個作業的多個租戶,以滿足性能、合規性和/或審計的要求。這些工作要求在一些場合中實現網路負載的邏輯分離,一些場合則還要實現它們的物理分離。架構師需要同時在兩個方面上進行規劃,但是初始需求最好統一在一起。
6.大數據網路的應用感知能力
雖然大數據的概念與Hadoop部署關系密切,但是它已經成為集群環境的代名詞。根據不同應用程序的特點,這些集群環境的需求各不同相同。有一些可能對對帶寬要求高,而有一些則可能對延遲很敏感。總之,一個網路要支持多應用程序和多租戶,它就必須要能夠區分自己的工作負載,並且要能夠正確處理各個工作負載。