Triangle Graph Interest Network for Click-through Rate Prediction

发布时间 2023-10-15 17:06:46作者: 馒头and花卷

Jiang W., Jiao Y., Wang Q., Liang C., Guo L., Zhang Y., Sun Z., Xiong Y. and Zhu Y. Triangle graph interest network for click-through rate prediction. WSDM, 2022.

'图'用于精排, 但是这里的图的使用主要是基于图抽取 triangles 作为'特征', 这么做可以避免在大规模图数据集上推理所带来的时间成本 (当然代价是额外的存储开销).

TGIN

Motivation: Triangle 的重要性

  • 图上的推理, 很大程度上依赖于 homophily 假设, 即彼此连接的结点相似. 这个假设可以推广到 k-Clique (k-Clique 指的是结点数为 \(k\) 的完全子图).

  • 作者做了一个统计: 可以发现, 4-Clique (即 triangle) 对于 homophily 的假设是最好的. 即倘若三个角度彼此连接, 则它们大概率具有相同的属性特征.

  • 但是, 不同的 triangles 之间的特征往往是不同的, 这实际上就说了 triangle 是很好的特征, 应当被加以好好利用.

Model

  • 首先, 每个结点周围的 triangles 需要提前抽取出来, 然后 triangles 的采样是通过经典的 DPP (Determinatal Point Process) 实现的 (主要是为了满足采样的 triangles 的多样性的需求).

  • 之后的处理, 如上图所示, 分为 user 和 item 的建模.

  • item 的建模利用到 k-order triangles, 每一阶的 triangles 经过类似的处理.

  • user 的建模就是普通的 embedding 加上一些上下文信息.

  • item 的最后建模时不同阶的 triangles 以及 user 的 embedding 共同融合而成.

  • 最后通过简单的 MLP 进行预测.

代码

[official]