大數(shù)據(jù)培訓-Hadoop相關知識

來源：奇酷教育發(fā)表于：2019-05-24 09:58:06

奇酷教育-大數(shù)據(jù)培訓_大數(shù)據(jù)培訓班_大數(shù)據(jù)培訓機構

　　大數(shù)據(jù)培訓-Hadoop相關知識。如何理解Hadoop知識？很多人聽說過大數(shù)據(jù)，但對于大數(shù)據(jù)所包含的核心技術卻并不了解，今天qiku大數(shù)據(jù)培訓老師就給大家介紹一下大數(shù)據(jù)工程師必須要掌握的技術——Hadoop相關知識。
大數(shù)據(jù)培訓-Hadoop相關知識

　　Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎架構。整個Hadoop家族由以下幾個子項目組成：

　　1、Hadoop Common：Hadoop體系最底層的一個模塊，為Hadoop各子項目提供各種工具，如：配置文件和日志操作等。

　 2、HDFS：是Hadoop應用程序中主要的分布式儲存系統(tǒng)， HDFS集群包含了一個NameNode(主節(jié)點)，這個節(jié)點負責管理所有文件系統(tǒng)的元數(shù)據(jù)及存儲了真實數(shù)據(jù)的DataNode(數(shù)據(jù)節(jié)點，可以有很多)。

　　3、MapReduce：是一個軟件框架，用以輕松編寫處理海量(TB級)數(shù)據(jù)的并行應用程序，以可靠和容錯的方式連接大型集群中上萬個節(jié)點(商用硬件)。

　　4、Hive：Apache Hive是Hadoop的一個數(shù)據(jù)倉庫系統(tǒng)，促進了數(shù)據(jù)的綜述(將結構化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表)、即席查詢以及存儲在Hadoop兼容系統(tǒng)中的大型數(shù)據(jù)集分析。

　　5、Pig：Apache Pig是一個用于大型數(shù)據(jù)集分析的平臺，它包含了一個用于數(shù)據(jù)分析應用的高級語言以及評估這些應用的基礎設施。Pig應用的閃光特性在于它們的結構經(jīng)得起大量的并行，也就是說讓它們支撐起非常大的數(shù)據(jù)集。Pig是SQL-like語言，是在MapReduce上構建的一種高級查詢語言，把一些運算編譯進MapReduce模型的Map和Reduce中，并且用戶可以定義自己的功能。

　　6、HBase：Apache HBase是Hadoop數(shù)據(jù)庫，一個分布式、可擴展的大數(shù)據(jù)存儲。其核心是Google Bigtable論文的開源實現(xiàn)、分布式列式存儲。它是Apache Hadoop在HDFS基礎上提供的一個類Bigatable。

　　7、ZooKeeper：Zookeeper是Google的Chubby一個開源的實現(xiàn)。它是一個針對大型分布式系統(tǒng)的可靠協(xié)調系統(tǒng)，提供的功能包括：配置維護、名字服務、分布式同步、組服務等。

　　8、Avro：Avro是doug cutting主持的RPC項目，有點類似Google的protobuf和Facebook的thrift。avro用來做以后hadoop的RPC，使hadoop的RPC模塊通信速度更快、數(shù)據(jù)結構更緊湊。

　　9、Sqoop:Sqoop是一個用來將Hadoop和關系型數(shù)據(jù)庫中的數(shù)據(jù)相互轉移的工具，可以將一個關系型數(shù)據(jù)庫中數(shù)據(jù)導入Hadoop的HDFS中，也可以將HDFS中數(shù)據(jù)導入關系型數(shù)據(jù)庫中。

　　10、Mahout:Apache Mahout是個可擴展的機器學習和數(shù)據(jù)挖掘庫，當前Mahout支持主要的4個用例：推薦挖掘、聚集、分類和頻繁項集挖掘。

　　11、Cassandra：Apache Cassandra是一個高性能、可線性擴展、高有效性數(shù)據(jù)庫，可以運行在商用硬件或云基礎設施上打造完美的任務關鍵性數(shù)據(jù)平臺。

　　12、Chukwa：Apache Chukwa是個開源的數(shù)據(jù)收集系統(tǒng)，用以監(jiān)視大型分布系統(tǒng)。建立于HDFS和Map/Reduce框架之上，繼承了Hadoop的可擴展性和穩(wěn)定性。Chukwa同樣包含了一個靈活和強大的工具包，用以顯示、監(jiān)視和分析結果，以保證數(shù)據(jù)的使用達到最佳效果。

　　13、Ambari：Apache Ambari是一個基于Web的工具，用于配置、管理和監(jiān)視Apache Hadoop集群，支持Hadoop HDFS,、Hadoop MapReduce、Hive、HCatalog,、HBase、ZooKeeper、Oozie、Pig和Sqoop。Ambari同樣還提供了集群狀況儀表盤，比如heatmaps和查看MapReduce、Pig、Hive應用程序的能力，以友好的用戶界面對它們的性能特性進行診斷。

　　14、HCatalog：Apache HCatalog是Hadoop建立數(shù)據(jù)的映射表和存儲管理服務，包括提供一個共享模式和數(shù)據(jù)類型機制，以及提供一個抽象表，這樣用戶就不需要關注數(shù)據(jù)存儲的方式和地址。

　　15、Chukwa：Chukwa是基于Hadoop的大集群監(jiān)控系統(tǒng)，由yahoo貢獻。

　　大數(shù)據(jù)培訓需要掌握的知識點很多，由淺入深、由易到難是一個比較長期的過程。如果你想快速而系統(tǒng)的掌握大數(shù)據(jù)技術，最有效的方式就是參加培訓班。

　　以上就是奇酷為大家分享的“大數(shù)據(jù)培訓-Hadoop相關知識”謝謝大家觀看，如果對大數(shù)據(jù)感興趣的話，想學大數(shù)據(jù)培訓的，也可以在線咨詢，我們將竭誠為你解答。

下一篇:鄭州大數(shù)據(jù)培訓,鄭州大數(shù)據(jù)培訓班, 上一篇:大數(shù)據(jù)培訓如何成為大數(shù)據(jù)人才？

Python交流群
635448130點擊加入群聊
UI設計交流群
579150876點擊加入群聊
Unity交流群
495609038點擊加入群聊
HTML5交流群
645591648點擊加入群聊

天堂呦呦成人AV片国产,精品黄网在线,国产亚洲精品无码,久久99精品色欲国产天美

大數(shù)據(jù)培訓-Hadoop相關知識

欄目導航

奇酷熱點

常見問題

奇酷技術交流中心

相關文章