在线学习

案例

行为数据logging -> 消息队列 -> 特征pipeline -> 消息队列 -> 训练服务器

问答

  • 推荐系统在线学习时如何应对延迟反馈(delayed feedback)问题?

    • 历史数据进行标签修正

    • 建立一个延迟模型,预测每个样本的反馈到达时间分布。基于预测的延迟时间,可以对实时数据进行推断和修正。

    • 使用生存分析方法预测某一行为(如点击或购买)是否会发生以及何时发生。对于未发生反馈的样本,可以用生存概率进行估计,避免简单地将其视为负样本。

Reference

Last updated