从头开发一个工业级的ctr prediction系统都需要做哪些工作?

关注者
69
被浏览
2,519
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

试着回答一下

ctr预测分几部分 一是数据流 二是算法 三是校验,但是整体是一个系统,需要一起考虑

数据流,和算法是结合的,如果用fm算法,也就是特征值互相作用,可以直接扔内存,如果是按离散矩阵存储,可以转换成01的比特序列

算法,一般是fm+cnn或者gbrt+lr,总之是数据先处理一遍,然后再分类或者回归。回归的思路确实可以。

算法校验都是那些,roc什么的,自定规则即可

但是切忌用人工筛选特征,然后加lr,这种传统思路已经不行了,要做就要用深度学习或者起码是boosting。

相关的,搜ctr预测,google、facebook和很多广告商都有论文和方案,可以人肉实现一下,坑不是很多。

相关新手,请轻拍