How Can Recommender Systems Benefit from Large Language Models: A Survey 阅读笔记

发布时间 2023-08-28 22:20:27作者: South1999

论文主要从LLM应用在推荐系统哪些部分以及LLM如何应用在推荐系统中,还讨论了目前LLM应用在RS中的一些问题。

Where?

推荐系统哪些部分哪里可以应用到大模型?文章中提到了特征工程、特征编码、评分/排序函数、推荐流程控制。

  • LLM for Feature Engineering

    • 用大模型做特征工程:利用原始的输入信息生成额外的辅助信息,可以是对item或user的描述、标签、知识图谱补全等等。
  • LLM as Feature Encoder

    • 用大模型进行编码:进一步用语义信息丰富user/item表示,例如将item标题、描述编码,根据用户评论为其编码;用大模型作为桥梁进行跨域推荐。
  • LLM as Scoring/Ranking Function
    使用LLM作为评分或者排序函数

    • Item Scoring Task
      • item评分任务:可以将user和item信息输入LLM,再将LLM的输出输入到传统的推荐模型中;直接训练一个二分类LLM,通过模型回答yes or no进行预测。
    • Item Generation Task
      • item生成任务:直接生成排序后的item列表(非常依赖LLM的推理能力)。
    • Hybrid Task
      • 混合任务:大模型以多任务的方式提供服务,可以通过使用不同的提示执行多个任务。
  • LLM for Pipeline Controller

    • 用大模型进行推荐流程控制:大模型随着参数数量增大后,出现了一些之前在小模型中所观察不到的行为,例如上下文学习和逻辑推理。可以利用大模型管理推荐流程,例如使用大模型作为对话界面和传统推荐系统的桥梁,通过大模型判断是否调用推荐接口、重排推荐结果等等。

How?

主要分为四类:
1.对LLM调参、在推理阶段使用CRM(传统推荐模型)。第一象限。
2.不对LLM调参、在推理阶段使用CRM。第二象限。
3.不对LLM调参、在推理阶段不使用CRM。第三象限。
4.对LLM调参、在推理阶段不使用CRM。第四象限。

  • Tune LLM; Infer with CRM (Quadrant 1)
    • 通常模型较小,将LLM用作特征编码器,将编码输入进传统的推荐模型进行预测。
  • Not Tune LLM; Infer w/o CRM (Quadrant 3)
    • 主要应用在少样本或零样本推荐,效果较差。
  • Not Tune LLM; Infer with CRM (Quadrant 2)
    • 利用LLM进行特征工程,例如提取新闻摘要等等,效果通常比Q3好。
  • Tune LLM; Infer w/o CRM (Quadrant 4)
    • 利用LLM进行评分/排序,主要通过推荐训练数据进行微调LLM。
  • Discussion
    • 需要协同知识,可以通过调整LLM或者使用CRM推理实现;LLM擅长对Hard Samples进行重排。

Challenges

  • Training Efficiency
    • 训练效率:现有的推荐系统通过大量训练数据和及时更新推荐系统来获取好的推荐效果,它们对训练效率有较高的要求。但是LLM的更新成本很高,包括计算资源和时间。一种解决方法,减少训练数据量,降低LLM更新频率,保持CRM高频率更新。
  • Inference Latency
    • 推理延迟:在线推荐系统通常是实时服务的并且对时延敏感,但是大模型的推理需要不少时间。解决方法,预存推理结果、使用更小的模型、模型蒸馏等。
  • In-Domain Long Text Modeling
    • 域内长文本建模:在调整LLM时,通常需要提示、指令等等,推荐系统需要更多的用户行为、特征等,这可能会导致LLM的输入非常长。而LLM不擅长处理长文本。为此,需要正确过滤、选择和排列文本信息作为LLM的输入。
  • ID Indexing & Modeling
    • ID索引与建模:推荐系统中ID特征并不含任何语义信息,但是它在推荐系统中十分重要,如果将它直接输入进LLM中,LLM并不能理解它的含义,因此部分基于LLM的推荐方法直接放弃了ID特征。目前这仍是一个未解决的问题。
  • Fairness
    • 公平性:LLM可能会受到有偏差的语料库误导,生成有害或冒犯的内容。

Summary

本文主要从两个方面讲述了RS如何收益于LLM,RS借助LLM的知识以及推理能力可以提供更好的推荐,但是LLM在RS中的应用也存在着延迟、公平性等问题,这个方向还有许多内容值得探索,文章中也指出了两个内容:1.统一的公共基准。2.专门为推荐领域定制的LLM。