在线学习

案例

行为数据logging -> 消息队列 -> 特征pipeline -> 消息队列 -> 训练服务器

问答

推荐系统在线学习时如何应对延迟反馈(delayed feedback)问题?
- 历史数据进行标签修正
- 建立一个延迟模型，预测每个样本的反馈到达时间分布。基于预测的延迟时间，可以对实时数据进行推断和修正。
- 使用生存分析方法预测某一行为（如点击或购买）是否会发生以及何时发生。对于未发生反馈的样本，可以用生存概率进行估计，避免简单地将其视为负样本。

Reference

Previous特征工程 Next硬件 cuda/triton

Last updated 2 months ago