科脉
- 一去就笔试,没人监考,但是外面人来人往的
- 自我介绍,着重问了离职原因,还聊了下上家公司基本情况,我们组多少人
- linux常用命令
- HDFS读、写流程,着重问了写流程的块大小,块在哪里切分
- Shuffle的优化(我没说完就让停了),MapReduce的全流程(包括Shuffle过程)
- yarn的参数调优有哪些
- hive的调优(按大方向分有哪几类,我按大保健上的回答了)
- kafka的架构(我给他画的大保健上的,他说不够深入),kafka有哪些优点为什么用kafka
- 离线的数仓建模思路
- ods层的数据是怎么倒过去的(他建议所有数据用sqoop导入)
- sqoop怎么导增量表
- 除了mapjoin ,其他的还有什么join方式
- dws和dwd层有什么区别,ads层是干啥的
- 还问了数仓里面什么销售主题、用户主题怎么分的
- 还问了其他的我题目都不懂的问题,印象不深忘记了