Wide&Deep

  1. Wide&Deep
    1. 介绍
      1. wide模型介绍
      2. deep 模型介绍
      3. Wide&Deep模型,平衡Wide模型和Deep模型的记忆能力和泛化能力。
    2. 模型结构
      1. wide侧
      2. deep侧
    3. Wide&Deep联合训练

Wide&Deep

介绍

wide模型介绍

在目前大规模线上推荐排序系统中,通用的线性模型如LR被广泛应用。线性模型通常输入二进制的one-hot稀疏表示特征进行训练。比如特征“user_installed_app=netflix”为1,表示用户已安装netflix。交叉特征AND(user_installed_app=netflix,impresion_app=Pandora)表示既安装了netflix app同时又浏览过Pandora的用户特征为1,否则为0。wide模型可以通过利用交叉特征高效的实现记忆能力,达到准确推荐的目的。wide模型通过加入一些宽泛类特征实现一定的泛化能力。但是受限与训练数据,wide模型无法实现训练数据中未曾出现过的泛化。

deep 模型介绍

像FM和DNN这种Embedding类的模型,可以通过学习到的低纬度稠密向量实现模型的泛化能力,包括可以实现对未见过的内容进行泛化推荐。当模型query-item矩阵比较稀疏时,模型的会过分泛化,推荐出很多无相关性的内容,准确性不能得到保证

Wide&Deep模型,平衡Wide模型和Deep模型的记忆能力和泛化能力。

模型结构

wide侧

$$
\phi_k(x) = \prod_{i=1}^{d}x_i^{c_{ki}}\ \ \ c_{ki}\in {0,1}
$$

deep侧

$$
a^{l+1}=f(w^{(l)}a^{(l)}+b^{(l)})
$$

Wide&Deep联合训练

$$
P(Y=1|x)=\sigma(W^T_{deep}a^{l}+W^T_{wide}\phi_k(x)+b)
$$

Wide选择FTRL,Deep选择Adam分别进行优化


转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 zoubinbf@163.com

×

喜欢就点赞,疼爱就打赏