当前位置：首页 > news >正文

Sql刷题日志（day8）

news 2025/11/3 16:01:53

一、笔试

1、right:提取字符串右侧指定数量的字符

right(string,length)
/*string：要操作的字符串。length：要从右侧提取的字符数
*/

2、curdate():返回当前日期，格式通常为 `YYYY-MM-DD`

二、面试

1、自变量是不良体验反馈，因变量是留存率，方法论是ABtest，二者相关性该注意什么?

需要注意可能存在幸存者偏差现象。

有些用户在有不良体验后会进行反馈，这种反馈在一定程度上可能解释了用户留存率下降的原因，但同时应该注意到，能进行反馈的用户通常是对平台有感情的用户，希望能通过反馈改善平台环境，继而留下来；
很多真正失望的用户可能一言不发便直接流失，所以可能出现不良反馈的数量减少但留存率却下降的情况。

2、AB Test有什么缺点？

所需样本量大，要有足够的样本
只适用于短期即时的验证
前期数据收集工作量大，后期维护成本高，ROI低
AB测试受场景限制，一旦产品版本发布，无法增加和改变AB测试场景

3、AB测试在什么平台上进行？介绍一下主要步骤？

AB测试可以在多种平台上进行，包括专业的AB测试平台如GrowthBook、火山引擎 A/B 测试平台、神策数据等，以及一些开源工具。
步骤参考day7

4、算法部门上线了新的推荐算法，在ab-test中败给了老算法，让你找出其中的原因，需要说出具体思路和框架

电商平台的商品推荐中，商品历经曝光、点击、加购物车、下单这一系列漏斗。应该分别比较两个算法推荐商品在各环节的转化率，并针对不同环节寻找原因。如果较老算法而言，新算法推的商品从曝光至点击的转化率很低，则应该从推荐推送客群的画像思考，说明推荐算法推送的商品并不适合推送的客群，以此为依据重新调整算法逻辑。

5、简要介绍AB测，并给出样本量计算公式

概念：A/B测试是建立在假设检验的基础上，通过单变量控制法，常用来检验新版本和旧版本之间是否存在显著性差异，是提升业务最有效、最实用的方法
步骤：1.现状分析并建立假设，2.设定目标并制定方案，3.设计与开发，4.流量的分配，5.收集并分析数据，6.得出结果，确定最终是否上线新版本样本量计算：功效分析
样本量的计算是比较重要的内容，A/B 测试所需的时间 = 总样本量 / 每天可以得到的样本量。从公式就能看出来，样本量越小，意味着实验所进行的时间越短。另外，我们做 A/B 测试的目的，就是为了验证某种改变是否可以提升产品、业务，当然也可能出现某种改变会对产品、业务造成损害的情况，所以这就有一定的试错成本。那么，实验范围越小，样本量越小，试错成本就会越低。实践和理论上对样本量的需求，其实是一对矛盾。所以，我们就要在统计理论和实际业务场景这两者中间做一个平衡：在 A/B 测试中，既要保证样本量足够大，又要把实验控制在尽可能短的时间内。样本量的计算公式如下：

6、拼多多最近在测试两个不同的推荐算法，其中A比B好，从哪几个方面可以分析好的原因

A组用户下单转化率明显高于B组

正向指标增加：A组用户人均订单量增加、GMV提升、用户活跃时间更长、物品的收藏率和分享率更高、用户拉新拉活数量更多
负向指标减少：A组用户退款率下降、用户差评率降低

7、ABtest, 为了提高点击率，对界面进行了小幅度修改，有两个组一组1000个人，有100个人点击，另一组1000个人，120人点击，怎么判断好不好

在比例类别指标的假设检验中，可以使用卡方检验方法。

进行假设，设H0为两组实验的点击率无明显差异，H1为第二组点击率要高于第一组
计算点击率
- A组1000人中有100人点击，则点击率为10%
- B组1000人中有120人点击，则点击率为12%
计算差异
- 差异 = 组B点击率 - 组A点击率 = 12% - 10% = 2%
统计显著性检验
- 使用Z值查找对应的P值。如果P值大于0.05，则功效不足；如果P值小于0.05，并且功效足够高，可以认为界面修改有效，显著提高了点击率。

8、选择AB实验的样本的时候，应该注意什么

选择AB实验的样本的时候，我们最要考虑的是样本量的选择，影响样本量选择通常有4个因素：显著性水平（α）、标准差（1 – β）、统计功效（μA-μB）、均值差异（σ）

显著性水平：显著性水平越低，对AB实验结果的要求也就越高，越需要更大的样本量来确保精度
标准差：标准差越小，代表两组差异的趋势越稳定。
统计功效：统计功效意味着避免犯二类错误的概率，统计功效越大，需要的样本量也越大
均值差异：如果真实值和测试值的均值差别巨大，也不太需要多少样本，就能达到统计显著越容易观测到显著的统计结果

将这四个值带入样本计算量公式就能得到需要的样本量，通常有网站专门计算AB实验的样本量，所以只要搞清楚上面四个值，就能计算出你需要的样本量

9、怎么验证你的改进办法有没有效

常见的方法就是去关注一下关键性指标，因为大多数ABtest在确认做之前都会指定一些关键性指标，比如，点击率、留存率、复购率和转化率等等，所以在上线后就可以直接关注这些指标是否有提高，如果有就说明办法有效，如果没有提高就需要看看办法哪里出了问题。
其次也能够通过计算ROI来比对不同的方案。对于 ROI 的计算，成本方面，每个实验组成本可以直接计算；对于收益方面，就要和对照组相比较，假定以总日活跃天（即 DAU 按日累计求和）作为收益指标，需要假设不做运营活动，DAU 会是多少，可以通过对照组计算，即： ● 实验组假设不做活动日活跃天 = 对照组日活跃天 * （实验组流量 / 对照组流量） ● 实验组收益 = 实验组日活跃天 - 实验组假设不做活动日活跃天。这样就可以量化出每个方案的 ROI。

10、A/B test场景问题，第一类错误，第二类错误具体是什么，你觉得哪个更严重

第一类错误：原假设正确但是拒绝原假设，弃真错误
第二类错误：原假设错误但是接受原假设，取伪错误
第一类错误更严重，由于报告了本来不存在的现象，则因此现象而衍生出的后续研究、应用的危害将是不可估量的。

11、DAU下降，如何分析？

两步分析法：定位问题+找到原因

首先定位问题原因，这里可以通过计算各个维度DAU的变动系数=（该维度下异常前DAU-该维度下异常后DAU）/该维度下异常前DAU，选出变动系数较大的前几个维度，对其进行分析。
然后可以从内部和外部进行分析，内部从产品（版本更新）、技术（卡顿，闪退）、运营（运营活动）分别沟通看是否能找到原因。外部从政策和竞品的角度找原因。

查看全文

http://www.dtcms.com/a/176991.html