从头开发一个工业级的ctr prediction系统都需要做哪些工作?

关注者
69
被浏览
2,519
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

看你的数据和参数规模,设计对应规模的系统。

模型没什么特别的地方,基本上是大量特征工程+浅层模型(LR、FM) 或 少量特征工程+深层模型(DNN)。还不行,就两个combine一下。

参数超过单机存储能力或计算超过单机能力就需要多机,一般会选择一些异步分布式优化算法,题主要从头开发,则需要自己设计通信、存储、同步、监控这些。实际上,很多组件可以用开源的包,严格意义上并不需要从零开发。

看标签中有计算广告,ctr很多时候是计算广告的一部分,还有其他上下游的系统,系统之间需要配合。