1.掌握Mysql,Oracle等数据库的使用
2.掌握使用Spark、SparkSQL、StructuredStreaming完成分布式数据计算。
3.掌握Java,Scala编程语言
4.熟悉Hadoop框架,理解HDFS存储、YARN运行以及MR计算流程,能够依赖ZK搭建维护 高可用集群环境。
5.熟悉Ogg、Canal数据采集平台。
6.熟悉Flume、Sqoop、Kettle、Impala等大数据工具。
7.熟悉Kudu,Hive、CK,Hbase等数据支撑平台。
8.熟练使用Azkaban、Oozie等任务调度管理工具。
9.了解基本的shell命令并编写基本的shell脚本。
10.熟悉Linux系统命令 项目一