1. hive执行哪些操作时会触发MR,哪些操作不能触发MR?
2. hive触发MR转换过程?
3. 如何处理数据倾斜?
4. RDD的五大特性是哪几特性?
5. spark作业执行流程?
6. spark sql与RDD之间如何转换?
7. flume生产中如何设计?
8. flume的三个组件?
9. kafka架构?
10. 生产中数据量?
11. 介绍工作中项目选型、数据量?
12. 介绍广播变更?
13. yarn的工作流程?
14. 介绍spark中的隐式转换与使用?
打个小小的广告哟
1.若泽数据 官网:
www.ruozedata.com
微信不支持链接跳转,单击下方[阅读全文]
2.面试题/博客汇总:
https://github.com/ruozedata/BigData
微信不支持内链接跳转,浏览器拼写一下
3.若泽大数据 微信公众号:
每周3篇大数据相关原创文章
4.若泽数据 小程序:
5.若泽大数据--星星: ruoze_star ,加我邀请进群
单击下方【阅读全文】,进入官网!