0318 pdd¶
一面很烂,居然还有二面?感觉没戏。
- 自我介绍
- 讲了在投的文章和组内的方向,提到了可解释机器学习
- 可解释是怎么个可解释?
- 讲了CBM
- 手撕:下一个排列
- 没做出来,瞎写了个递推,还得多练
-
分类任务的损失函数?指标?F1 Score是什么?
- 分类任务:CE
- 指标:混淆矩阵
- F Score忘记咋算了: $$ F_\beta = (1+\beta^2) \times \frac{\text{Precision} \times \text{Recall}}{\beta^2\cdot\text{Precision} + \text{Recall}} $$
- 其中
- 准确率(Accuracy)定义为$(TP+TN)/ALL$,就是模型的正确率。
- 精准率(Precision)也叫查准率定义为$TP/(TP+FP)$,意思就是在预测为正样本的结果中,我们有多少把握可以预测正确。
- 召回率(Recall)也叫查全率定义为$TP/(TP+FN)$,意思就是所有相关的样本,有多少我们可以预测出来。
- P-R曲线:描述精确率/召回率变化的曲线
- 如果是多分类问题,还可以做Macro平均或者Micro平均。
- 此外在医学场景下,常用:
- 灵敏度(Sensitivity)也叫真阳性率,定义为$TP/(TP+FN)$,其实就是召回率(生病的人,检测出疾病的概率)。
- 特异度(Specificity)也叫真阴性率,定义为$TN/(TN+FP)$(没生病的人,检测出没病的概率)。
- FPR、TPR
- ROC曲线:Receiver Operating Characteristic,横坐标为假正率(FPR),纵坐标为真正率(TPR),曲线围成的面积是AUC(Area Under Curve)。
-
分割任务的指标?常用模型的架构?
-
了解搜推吗?如何用模型进行推荐,点击率?如何衡量模型推荐的效果?
- (其实不是很了解,正在学)
- 答得不是很好
最后更新: 2025-03-20 13:25:40
创建日期: 2025-03-19 17:57:13
创建日期: 2025-03-19 17:57:13