如何跟一个非相关性的人解释你是做大数据的,你是做大数据的哪一部分工作,从求职者角度,如何从jd描述中估摸大概率做哪一块,从猎头角度,如何从一份简历中看出你更匹配哪个jd
1.相关技术
大数据开发的技术名词无非是下面几种,
Hadoop,Hive,Spark,Kafka,Sqoop,Flink,Oozie,Hbase,hue
但是大数据架构根据每个厂的基础建设不同,可能会有不同的方案,但是总的流程是大致一致的
涉及的语言一般是:Java, Scala, Python, Go 其中前两者是必须掌握的主语言,后两者是平台或者业务多
2.流程
粗略地来讲,应用角度,最终有两种服务去向,一种是返回给用户,一种是做业务决策,虽说业务决策最终大概率也是返回给用户,但是这是一个隐含的很长的链,所以假设不考虑这个,返给用户又包括:实时返回,定时返回,运营结果返回,
其他就是辅助上面数据流转的框架引擎,监控系统等等,调度系统
数据采集
自己后台业务数据,埋点数据,第三方数据
数据同步
将业务数据库数据或者kafka等日志拉到数仓
数据开发
将原始ods层数据根据数仓划分一层层加工
数据展示
将最后的数据再导入到业务数据库
3.岗位分类
基础平台团队
主要负责搭建稳定、可靠的大数据存储和计算平台。
核心成员包括: