Spark机器学习实战(二)电影评分数据获取与可视化
https://www.jianshu.com/p/7a49d1981189

基于Spark和Hive进行的豆瓣电影数据分析
https://blog.csdn.net/gamer_gyt/article/details/52142375

大数据Spark+Kafka实时数据分析案例
https://www.cnblogs.com/zhaojinyan/p/9360873.html

Spark上数据的获取、处理与准备
https://blog.csdn.net/suixinlun/article/details/81740516

用Spark分析Amazon的8000万商品评价(内含数据集、代码、论文)
https://yq.aliyun.com/articles/69165
minimaxir/amazon-spark
https://github.com/minimaxir/amazon-spark?spm=a2c4e.11153940.blogcont69165.13.5e556790fnm7R3

子雨大数据之Spark入门教程(Scala版)
http://dblab.xmu.edu.cn/blog/spark/

Spark–最全面详解从理论、实践到案例
http://www.aboutyun.com/thread-24883-1-1.html

《Spark机器学习》笔记——基于MovieLens数据集使用Spark进行电影数据分析
https://blog.csdn.net/csj941227/article/details/78951286

Spark 实践——音乐推荐和 Audioscrobbler 数据集
http://www.mamicode.com/info-detail-2312685.html

libaoquan95/aasPractice
https://github.com/libaoquan95/aasPractice

数据集:
https://registry.opendata.aws/

Logo

Kafka开源项目指南提供详尽教程,助开发者掌握其架构、配置和使用,实现高效数据流管理和实时处理。它高性能、可扩展,适合日志收集和实时数据处理,通过持久化保障数据安全,是企业大数据生态系统的核心。

更多推荐