常见面试提问

在数据开发过程中,遇到数据量特别大的情况下,你一般会做那些优化?

数据分区分片:分批处理,避免一次性加载太多数据导致内存溢出
SQL优化:优化sql,join优化,大小表join,小表采用广播join,避免shuffle;将复杂子查询拆分为临时表,提升可读性和性能;
数据预处理:提前计算常用聚合数据,减少实时计算压力;将数据分为原始层、清洗层和聚合层,逐层处理。

你在开发过程中 遇到最棘手的问题是什么? 怎么解决的?

数据倾斜:定位数据倾斜的key,随机值+撒盐
数据量大:分片,算法优化

如何解决数据质量问题?

可以设置一些数据质量规则,比如数据的完整性、准确性、一致性等方面的规则,然后通过工具或者代码来检查数据是否符合这些规则。还可以对数据进行抽样检查,或者对比不同数据源的数据是否一致。

什么是维度建模?

维度建模‌是一种用于数据仓库和商业智能系统的数据建模方法,旨在优化查询性能和分析效率。其核心思想是将数据组织为易于理解和分析的结构,通常包括事实表和维度表两部分。‌

数据库和数据仓库的区别?

数据库通常是面向事务处理的,主要用于存储和管理日常业务数据。
而数据仓库则是面向分析的,它整合了来自不同数据源的数据,经过清洗、转换等处理后,为数据分析和决策支持提供数据基础。

Java中的多态、继承、封装?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

文文鑫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值