Awesome
BigData-Notes
<div align="center"> <img width="444px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/bigdata-notes-icon.png"/> </div> <br/>大数据入门指南
<table> <tr> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/hadoop.jpg"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/hive.jpg"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/spark.jpg"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/storm.png"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/flink.png"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/hbase.png"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/kafka.png"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/zookeeper.jpg"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/flume.png"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/sqoop.png"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/azkaban.png"></th> <th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/scala.jpg"></th> </tr> <tr> <td align="center"><a href="#一hadoop">Hadoop</a></td> <td align="center"><a href="#二hive">Hive</a></td> <td align="center"><a href="#三spark">Spark</a></td> <td align="center"><a href="#四storm">Storm</a></td> <td align="center"><a href="#五flink">Flink</a></td> <td align="center"><a href="#六hbase">HBase</a></td> <td align="center"><a href="#七kafka">Kafka</a></td> <td align="center"><a href="#八zookeeper">Zookeeper</a></td> <td align="center"><a href="#九flume">Flume</a></td> <td align="center"><a href="#十sqoop">Sqoop</a></td> <td align="center"><a href="#十一azkaban">Azkaban</a></td> <td align="center"><a href="#十二scala">Scala</a></td> </tr> </table> <br/> <div align="center"> <a href = "https://github.com/heibaiying/Full-Stack-Notes"> <img width="150px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/weixin.jpg"/> </a> </div> <div align="center"> <strong> 如果需要离线阅读,可以在公众号上发送 “bigdata” 获取《大数据入门指南》离线阅读版! </strong> </div> <br/>:black_nib: 前 言
一、Hadoop
- 分布式文件存储系统 —— HDFS
- 分布式计算框架 —— MapReduce
- 集群资源管理器 —— YARN
- Hadoop 单机伪集群环境搭建
- Hadoop 集群环境搭建
- HDFS 常用 Shell 命令
- HDFS Java API 的使用
- 基于 Zookeeper 搭建 Hadoop 高可用集群
二、Hive
- Hive 简介及核心概念
- Linux 环境下 Hive 的安装部署
- Hive CLI 和 Beeline 命令行的基本使用
- Hive 常用 DDL 操作
- Hive 分区表和分桶表
- Hive 视图和索引
- Hive 常用 DML 操作
- Hive 数据查询详解
三、Spark
Spark Core :
- Spark 简介
- Spark 开发环境搭建
- 弹性式数据集 RDD
- RDD 常用算子详解
- Spark 运行模式与作业提交
- Spark 累加器与广播变量
- 基于 Zookeeper 搭建 Spark 高可用集群
Spark SQL :
Spark Streaming :
四、Storm
- Storm 和流处理简介
- Storm 核心概念详解
- Storm 单机环境搭建
- Storm 集群环境搭建
- Storm 编程模型详解
- Storm 项目三种打包方式对比分析
- Storm 集成 Redis 详解
- Storm 集成 HDFS/HBase
- Storm 集成 Kafka
五、Flink
- Flink 核心概念综述
- Flink 开发环境搭建
- Flink Data Source
- Flink Data Transformation
- Flink Data Sink
- Flink 窗口模型
- Flink 状态管理与检查点机制
- Flink Standalone 集群部署
六、HBase
- Hbase 简介
- HBase 系统架构及数据结构
- HBase 基本环境搭建 (Standalone /pseudo-distributed mode)
- HBase 集群环境搭建
- HBase 常用 Shell 命令
- HBase Java API
- HBase 过滤器详解
- HBase 协处理器详解
- HBase 容灾与备份
- HBase的 SQL 中间层 —— Phoenix
- Spring/Spring Boot 整合 Mybatis + Phoenix
七、Kafka
八、Zookeeper
- Zookeeper 简介及核心概念
- Zookeeper 单机环境和集群环境搭建
- Zookeeper 常用 Shell 命令
- Zookeeper Java 客户端 —— Apache Curator
- Zookeeper ACL 权限控制
九、Flume
十、Sqoop
十一、Azkaban
十二、Scala
- Scala 简介及开发环境配置
- 基本数据类型和运算符
- 流程控制语句
- 数组 —— Array
- 集合类型综述
- 常用集合类型之 —— List & Set
- 常用集合类型之 —— Map & Tuple
- 类和对象
- 继承和特质
- 函数 & 闭包 & 柯里化
- 模式匹配
- 类型参数
- 隐式转换和隐式参数