Skip to content

0314 byte

FYI:我当天就被挂了。还是太菜了,统计学忘的比较多。有待加强~

面试官人很好。循循善诱,很有礼貌。

面试官先介绍了他们组的情况,在算法推荐大组里的数科组。主要关注几个方向的数分:

  1. UCG:评论区之类的
  2. PCG:高质量内容产出者
  3. 投稿
  4. 。。。

我的简历上数科相关的简历不多,所以主要问的都是比较通用的统计学问题。

AB Test

给了一个具体的场景:一波人增加知识区内容推荐,另外一波对照组。

  1. 了解AB Test吗?
    • 如何设计实验?我说对照试验
    • 如何选取metrics?我说点赞率、留存率
  2. 如何检验知识区推荐行为是否有效?我说t检验
  3. t检验怎么做?不是正态分布可以t检验吗?==> 中心极限定理
  4. CLT的条件?
  5. p值是什么,有何含义?原假设成立的情况下p值的分布是什么
  6. 有什么方差缩减技术
    • 我说bootstrapping
    • 这个也忘掉了
  7. 针对GMV的比较问题,可能有很多的0,正态假设不成立了,应该如何检验?我说非参数检验
  8. 非参数检验和参数检验的比较?有什么优劣?
    • 同样都是大样本的情况下?我说非参数检验效力更弱
  9. 比值类型的统计量(总点赞数/总观看数)如何的检验? ==> Delta Method
    • 这个我是真忘了

因果推断

另外一个具体场景:版本更新是否能优化用户体验?

  1. 了解因果推断吗?其实不是很了解
  2. 如何分析版本更新对用户体验的影响?
  3. 直接回归有什么问题?【是否更新版本是0-1变量】

SQL

最后做了一个SQL题目。

fan_id author_id
1 1
1 2
2 2
3 2
4 1
4 2

每一行是每个粉丝喜欢的作者。

现在需要查询:对于每个作者,其他的作家中和他共同粉丝最多的前三位。


Last update: 2025-03-14 15:45:47
Created: 2025-03-14 15:45:47

Comments