农行一面:(线上面试,10min)

自我介绍
项目介绍+挖研究点
系统中用HIve的版本,用的是什么引擎?进入系统后,提示什么?
命令行连接进入hive是什么命令?
hive在实际应用中会出现什么问题?有什么可以优化的?如何优化?
数据倾斜问题出现的原因?如何解决?为什么?
建外部表语句是create table +()什么东西?为什么?
kafka是怎么消费数据的?
kafka的time-wait 参数默认是开启的还是关闭的?
sql和RDD的区别?
dataset和rdd的区别?
sparkstreaming代码是怎么拉取数据并实现实时统计的?
能够引起shuffle的算子有哪些?
给你一张大表、一张小表,如何连接?

农行二面:(线上面试,8min)

自我介绍
介绍项目+挖研究点
项目一中,承担了什么工作?用的框架是什么?
前端用的是什么语言?控件如何实现?接口如何连接?
kafka到hive的持久化保存怎么实现的?
spark发生故障如何容错?
hr:你更倾向于做管理还是做技术?

希望大家都能拿到满意的offer 攒人品~ 攒人品~攒人品~好运快来~

Logo

Kafka开源项目指南提供详尽教程,助开发者掌握其架构、配置和使用,实现高效数据流管理和实时处理。它高性能、可扩展,适合日志收集和实时数据处理,通过持久化保障数据安全,是企业大数据生态系统的核心。

更多推荐