課程簡介:大數(shù)據(jù)(big data,mega data)或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
課程目標:用完全零基礎(chǔ)的大數(shù)據(jù)課程,不斷更新緊隨技術(shù)發(fā)展浪潮,更真實深度還原企業(yè)應(yīng)用場景,更全面典型技術(shù)的點線面橫向擴展,拓寬就業(yè)領(lǐng)域。
課程大綱:
第一章 操作系統(tǒng)基礎(chǔ)
1.1 計算機基礎(chǔ)知識
1.2 Linux環(huán)境搭建
1.3 數(shù)據(jù)庫環(huán)境搭建
1.4 SQL語言
1.5 Superset部署和開發(fā)
1.6 案例架構(gòu)
第二章 Java語言編程
2.1 Java程序基礎(chǔ)數(shù)據(jù)類型
2.2 Java異常處理機制
2.3 Jsoup的網(wǎng)絡(luò)爬蟲開發(fā)
2.4 JDBC操作
2.5 ETL數(shù)據(jù)處理和BI報表開發(fā)
第三章 Hadoop技術(shù)棧
3.1 shell編程
3.2 ZooKeeper原理及應(yīng)用
3.3 HDFS的使用和MapReduce編程
3.4 Yarn的原理和調(diào)優(yōu)
3.5 Hive的使用和調(diào)優(yōu)
第四章 數(shù)據(jù)微服務(wù)接口開發(fā)
4.1 SpringBoot整合SpringMVC開發(fā)
4.2 SpringBoot整合MyBatis開發(fā)
4.3 Eureka搭建
4.4 Feign的應(yīng)用
第五章 實時生態(tài)圈
5.1 Redis原理及架構(gòu)
5.2 Hbase原理及架構(gòu)
5.3 Phoneix二級索引優(yōu)化查詢
5.4 ELK開發(fā)
5.5 基于Flink進行實時和離線數(shù)據(jù)處理和分析
第六章 Spark技術(shù)棧
6.1 Scala語言基礎(chǔ)、數(shù)據(jù)結(jié)構(gòu)
6.2 Spark Streaming整合Kafka完成實時數(shù)據(jù)處理
6.3 park Streaming偏移量管理及Checkpoint
6.4 Structured Streaming整合多數(shù)據(jù)源完成實時數(shù)據(jù)處理