当前位置: 首页 > news >正文

抖音大数据开发一面(0905)

1. 自我介绍

2. 了解实习经历

3. 针对实习项目,问数据层次怎么分层

4. 数据分层的作用

5. 针对具体实习项目,说明业务逻辑

6. 说明实习项目的“订单量”这个指标从源头到产出的ETL过程

7. 针对实习项目,复盘后最大的难点是什么

8. 复盘之后有什么收获

9. 你刚才说复盘收获是处理小文件,那么spark怎么处理小文件的?

10. 处理小文件有哪些方法,举例子

11. hive冷热分离的方法

12. 你刚才提到了组里有做ec存储,你了解ec存储吗

13. 暑期实习有什么感受,转正了吗15分钟

14. 了解spark的semi join吗,他是干嘛的

15. 了解spark的AQE,这是什么

16. 你刚才讲AQE提到了广播机制,这个在spark中很重要,讲讲广播过程呢

17. 了解网络吗?讲讲三次握手和四次握手区别。

18. 了解数据结构吗?讲讲O(nlog n)的不稳定排序算法。

两个编程题:

Q1.求开方:给定num=5.79,error=1e-8,求x使得abs(x^2-num)<error19. 先讲讲思路吧,有什么思路:二分O(log n)20. 刚开始没做出来,面试官提示了下细节

21. 后面二分法做出来了,面试官说那如果num小于1有什么变化呢

22. 面试官问还有什么方法吗:牛顿下山法

23. 公式写上去,但是面试官不关心公式,关心原理:会无限逼近

24. 如果是三次方四次方,牛顿下山怎么用呢,公式会变的

Q2.1TB的int类型数据怎么在512MB的虚拟机中求中位数

25. 已经70分钟了,没时间了,没要求写代码,只要讲思路:外部排序,归并思想

26. 面试官问还有什么方法吗:没想到了,但是后面搜了下有分布式排序,mapreduce排序等,估计想让我回答spark相关的,但是真不知道。

27. 反问

往期精彩

如何设计一个评估618大促活动效果的指标体系? | 阿里巴巴

SQL面试题:2-8定律,20%的人手里掌握着80%的财富?

哈士奇vs网易高级数仓:数据仓库的灵魂是模型、数据质量还是计算速度?| 易错题

大厂数据仓库数仓建模面试题及参考答案

面试提问: 数仓底座健康度衡量标准是什么?都有哪些指标?

SQL面试题:供应链库存周转率计算与缺货预测

快手大数据开发一面面试题(社招)

SQL面试题:如何拆分多值字段并优化性能?

数仓建模中,如果遇到跨业务过程的分析,这时候dwd层表模型如何设计?整体的设计思路是什么?|支付宝

SQL表模型设计题目:员工部门父子级关系,要设计出一张表方便查询一级部门的员工人数?【Mysql/Hive】

数仓设计中,如果修饰词变成了业务过程中的一个维度,应怎么办?| 作业帮一面

数仓实战:不同业务场景下数据合并策略及实现方案

快手数据开发面试SQL题:取窗口内排名第一和排名倒数第一的作为两个字段输出


文章转载自:

http://Pqid0bd7.bpmtg.cn
http://4lDJwCXx.bpmtg.cn
http://iUfXRrhY.bpmtg.cn
http://kJXb7HFM.bpmtg.cn
http://qLoW1LaM.bpmtg.cn
http://q5DPvNMb.bpmtg.cn
http://vWMmJloY.bpmtg.cn
http://uLfExT2d.bpmtg.cn
http://RCqpSXFE.bpmtg.cn
http://HQwE0SUb.bpmtg.cn
http://PmB36ffW.bpmtg.cn
http://rgbzH138.bpmtg.cn
http://WqUO3lom.bpmtg.cn
http://GkQ7nbsX.bpmtg.cn
http://zlvG7XKF.bpmtg.cn
http://kBcJ2mi4.bpmtg.cn
http://w9j3ZiMt.bpmtg.cn
http://ipHSddGN.bpmtg.cn
http://gP634kGB.bpmtg.cn
http://cPSty9WS.bpmtg.cn
http://eJRIDkU8.bpmtg.cn
http://TKimB6Hg.bpmtg.cn
http://2nNYcZ42.bpmtg.cn
http://rgPPoOEi.bpmtg.cn
http://d21GLQ03.bpmtg.cn
http://Eg0NRW7n.bpmtg.cn
http://FHPmucSa.bpmtg.cn
http://t7VD6BuG.bpmtg.cn
http://XjnoJYgm.bpmtg.cn
http://3u9MIOLD.bpmtg.cn
http://www.dtcms.com/a/379117.html

相关文章:

  • 原生js的轮播图
  • 连接池项目考点
  • ruoyi-flowable-plus框架节点表单的理解
  • js.228汇总区间
  • BERT中文预训练模型介绍
  • 光平面标定建立激光点与世界坐标的对应关系
  • Jmeter执行数据库操作
  • 基于FPGA的图像中值滤波算法Verilog开发与开发板硬件测试
  • 微软Aurora大模型实战:五大数据源驱动、可视化对比与应用
  • 【论文笔记】SpaRC: Sparse Radar-Camera Fusion for 3D Object Detection
  • C++基本数据类型的范围
  • Spring AI(三)多模态支持(豆包)
  • agentic Deep search相关内容补充
  • 第一篇:如何在数组中操作数据【数据结构入门】
  • PYcharm——pyqt音乐播放器
  • OpenAI已正式开放ChatGPT Projects
  • 日系电车销量破万,真正突围了,恰恰说明了电车的组装本质!
  • Linux 防火墙 Iptables
  • 不想考地信,计算机又太卷,所以转型GIS开发
  • PotPlayer 1.7.22611发布:支持蓝光播放+智能字幕匹配
  • LVS负载均衡群集与Keepalived高可用
  • React中hook的用法及例子(持续更新)
  • 【网络编程】TCP、UDP、KCP、QUIC 全面解析
  • 【1】占位符
  • A2A 中的内存共享方法
  • 力扣704. 二分查找
  • HttpServletRequest vs ServletContext 全面解析
  • 介绍keepalived和LVS
  • NAT技术:SNAT与DNAT区别详解
  • 设计模式-单例桥接命令职责链