2019 年全国职业院校技能大赛GZ-2019032 大数据技术与应用(高职组)赛题库
目录
任务一:Hadoop 平台及组件的部署管理
一、 Hadoop 全分布部署
二、 Hadoop 伪分布部署
三、 Hadoop HA 部署
四、 Hive 组件部署
五、 Sqoop 组件部署
六、 Hbase 组件部署
七、 Flume 组件部署
八、 Spark 组件部署
九、 Kafka 组件部署
十、 Storm 组件安装部署
十一、 Zookeeper 集群部署
任务二:数据采集
一、 数据源 1(交通运输)
二、 数据源 2(web,招聘)
三、 数据源 3(web,酒店)
四、 数据源 4(web,零售)
任务三:数据清洗与分析
一、 数据源 1(交通运输)
二、 数据源 2(招聘)
三、 数据源 3(酒店)
四、 数据源 4(零售)
任务四、数据可视化
一、 数据源 1(交通运输)
二、 数据源 2(招聘)
三、 数据源 3(酒店)
四、 数据源 4(零售)
任务五、综合分析
一、 数据源 1(交通运输)
二、 数据源 2(招聘)
三、 数据源 3(酒店)
四、 数据源 4(零售)

Logo

Kafka开源项目指南提供详尽教程,助开发者掌握其架构、配置和使用,实现高效数据流管理和实时处理。它高性能、可扩展,适合日志收集和实时数据处理,通过持久化保障数据安全,是企业大数据生态系统的核心。

更多推荐