0314 byte¶
FYI:我当天就被挂了。还是太菜了,统计学忘的比较多。有待加强~
面试官人很好。循循善诱,很有礼貌。
面试官先介绍了他们组的情况,在算法推荐大组里的数科组。主要关注几个方向的数分:
- UCG:评论区之类的
- PCG:高质量内容产出者
- 投稿
- 。。。
我的简历上数科相关的简历不多,所以主要问的都是比较通用的统计学问题。
AB Test¶
给了一个具体的场景:一波人增加知识区内容推荐,另外一波对照组。
- 了解AB Test吗?
- 如何设计实验?我说对照试验
- 如何选取metrics?我说点赞率、留存率
- 如何检验知识区推荐行为是否有效?我说t检验
- t检验怎么做?不是正态分布可以t检验吗?==> 中心极限定理
- CLT的条件?
- p值是什么,有何含义?原假设成立的情况下p值的分布是什么?
- 有什么方差缩减技术?
- 我说bootstrapping
- 这个也忘掉了
- 针对GMV的比较问题,可能有很多的0,正态假设不成立了,应该如何检验?我说非参数检验
- 非参数检验和参数检验的比较?有什么优劣?
- 同样都是大样本的情况下?我说非参数检验效力更弱
- 比值类型的统计量(总点赞数/总观看数)如何的检验? ==> Delta Method
- 这个我是真忘了
因果推断¶
另外一个具体场景:版本更新是否能优化用户体验?
- 了解因果推断吗?其实不是很了解
- 如何分析版本更新对用户体验的影响?
- 直接回归有什么问题?【是否更新版本是0-1变量】
SQL¶
最后做了一个SQL题目。
fan_id | author_id |
---|---|
1 | 1 |
1 | 2 |
2 | 2 |
3 | 2 |
4 | 1 |
4 | 2 |
每一行是每个粉丝喜欢的作者。
现在需要查询:对于每个作者,其他的作家中和他共同粉丝最多的前三位。
最后更新: 2025-03-14 15:45:47
创建日期: 2025-03-14 15:45:47
创建日期: 2025-03-14 15:45:47