300字范文 > 【论文阅读】Advances and challenges in conversational recommender systems: A survey

【论文阅读】Advances and challenges in conversational recommender systems: A survey

时间：2022-07-19 01:18:14

原文标题：Advances and challenges in conversational recommender systems: A survey源：/science/article/pii/S2666651021000164

文章目录

摘要1.引入 Introduction1.1 静态模型的问题 Inherent disadvantages of static recommendations1.2 CRS的介绍 Introduction of CRSs1.3 和互动推荐的联系 Connections with interactive recommendations1.4 和其他AI对话系统的联系 Connections with other conversational AI systems1.5 本文重点 Focuses of this survey1.6 和现有相关综述区别 Differences with existing related surveys1.7 组织结构 Survey organization2. 基于问题的用户偏好引出2.1 Asking about items2.2 Asking about Attributes3.CRS的多轮对话策略4.CRS的对话理解和生成5. exploration和exploitation 权衡6.评估和用户仿真7.未来的方向和机遇8.结论

摘要

推荐系统通过交互历史来研究用户的偏好已经有很长的历史，并在各个领域有广泛应用。然而静态推荐系统有两个重要问题难以解决：

用户究竟喜欢什么为什么用户喜欢某个物品

这是由于静态模型学习用户偏好的方式导致的（没有与用户交互反馈）。CRS的兴起解决了这个局面（通过自然语言交互，反馈，探求用户真实准确偏好）

本文系统性介绍现有的CRS技术，从五个方向介绍挑战：

Question-based user preference elicitationmulti-turn conversational recommendation strategiesdialogue understanding and generationexploitation-exploration trade-offs(E&E)evaluation and user simulation

这些研究包括了IR/NLP/HCI等方向

1.引入 Introduction

推荐系统已经成为信息检索不可或缺的工具。各大公司都需要建立用户商品之间的联系。

传统的推荐系统(static recommendation)通过过去的行为(offline training )，例如点击，浏览记录等预测用户偏好。早期的一些方法，例如协同过滤、逻辑回归、factorization machine、GDBT等已经广泛应用在实际应用中。最近，也有研究使用更复杂但是有效的神经网络。

1.1 静态模型的问题 Inherent disadvantages of static recommendations

难以解决Two important questions:

（1）用户究竟喜欢什么？

使用历史数据进行学习会出现稀疏（sparse）和噪音（noisy）。静态模型一个基本假设是所有的历史行为表示了用户的偏好。

因此会导致以下几个问题：

1. 由于用户可能选错了，而导致他们并不喜欢他们选择的物品。

2. 用户的对于商品的态度可能随着时间而改变，因此，从有偏差的历史数据中推断用户的喜欢将会十分困难。

3. 冷启动问题。

总之，通过静态模型很难得到用户精确地偏好。

（2）为什么用户喜欢这个商品？

找出用户为什么喜欢某个物品对于提到推荐模型机制，提高推断用户偏好的能力十分重要。在现实生活中，有很多因素影响用户的选择。例如，用户可能处于好奇或者受他人影响购买商品；也可能是经过仔细思考后购买。购买相同商品的用户的动机可能不同。因此，用同样的方式处理不同的用户，或者用同样的方式对待同一用户的不同行为并不合适。静态模型很难推断用户消费行为背后的不同动机。

尽管之前有很多研究通过引入大量的辅助数据，例如社交网络、知识图谱的方法，希望可以解决这些问题，但是他们的假设都十分受限。在实际应用中，这些辅助数据也可能存在incomplete和noisy的情况。我们认为坚决问题的关键点在于静态模型（static model）的机制问题。没有交互的建模从根本上限制了用户意图的表达，造成机器学习模型与用户之间的信息不平衡。

1.2 CRS的介绍 Introduction of CRSs

定义：可以通过实时的多轮交互来推断用户的偏好，并给予用户当下的需求采取行动的推荐系统。

狭义上，conversation意味着通过书写或口头的方式进行多轮对话；广义上，conversation意味着人机之间的互动，不仅限于书写，表格、按键或者是手势都可以。对话是长期解决信息不对称问题的一种自然的方式。通过互动，CRS可以很容易地推断出用户当先的需求、理解其消费行为背后的动机。

结合用户之前的偏好和对话中推断出来的偏好进行推荐，即使得到的推荐并不适合用户，也可以及时修正。

截止，CRS论文的统计数据

1.3 和互动推荐的联系 Connections with interactive recommendations

自从推荐系统诞生起，学者就意识到人机交互的重要性。一些之前研究提出的互动推荐系统（interactive recommendation）和基于评论的推荐系统（critiquing-based recommender systems）可以看成CRS的早期形式，他们通过用户对于之前推荐的商品的反馈来提高推荐的策略。

Interactive recommendation

每一个推荐都有一个反馈来表明用户是否喜欢，有多喜欢这个推荐。由于商品过多，interactive recommendation十分低效。（可以利用商品的属性信息，理解用户意图，缩小候选商品范围，提高效率）

critiquing-based recommender systems

让用户对于某种属性进行反馈，而不是某个商品。根据对于属性的feedback，进行推荐。每次收到feedback都会进行推荐，但是这种推荐应当在confidence比较高的情况下进行。（CRS通过对话策略来决定什么时候进行询问和推荐）

无论是Interactive recommendation还是critiquing-based recommender systems，都只能通过提前设定（predefined）的问题进行互动，而CRS考虑到了更灵活的活动形式。

1.4 和其他AI对话系统的联系 Connections with other conversational AI systems

其他的conversational AI systems是希望优化自然语言处理，使其更加人性化，因此和CRS的核心任务不同。CRS可以不必局限于NL，端对端的对话CRS也并未呈现良好的效果，CRS更重要的应当是推荐和language generation。

也可以通过应用场景不同来区分CRS和其他对话系统。CRS注重feedback，而其他的注重用户的问题；CRS进行多轮对话，其他只进行单轮。

1.5 本文重点 Focuses of this survey

CRS通用结构

CRS通常由一个user interface、conversation strategy module、recommender engine组成。

User interface:人机之间的翻译。

Conversation strategy module:决定如何推断用户偏好，进行多轮对话。

Recommendation engine:建立实体之间的联系，学习用户对于商品和商品属性的偏好，检索所需信息。

五个方向的挑战

1. Question-based user preference elicitation

两个需要解决的问题：

（1）问什么（获取尽可能多的信息）

（2）如何基于回答调整推荐（利用回答中获得的信息尽可能推荐更合适的）

2. multi-turn conversational recommendation strategies

需要考虑何时问并进行、何时推荐。即让模型在（1）继续问问题减少不确定性（2）基于用户当前偏好进行推荐中进行选择。

由于顾客耐心有限，CRS需要通过尽可能少的轮数完成问答。

复杂的CRS会主导对话。

3. natural language understanding and generation

如何向人类一样交流到今天仍是CRS中最大的挑战之一。为了理解用户的偏好和意图，CRS通过：（1）定义预先设定标签（2）shot filling提取用户语义信息，理解用户的话；CRS通过（1）直接提供推荐列表（2）端对端来生成对话。

4. exploitation-exploration trade-offs

不进行全部数据的exploration，只利用局部信息（exploitation）进行推荐得到的只是局部最优结果；过多的exploration会耗费大量时间。

推荐系统存在一个问题，交互过程中，用户无法了解到所有感兴趣的商品。冷启动的用户这种现象更加严重。基于交互，CRS可以主动提供用户未了解的商品，进而更好地捕捉用户偏好。用户可以表达自己的偏好，得到更好的推荐。（通过增加exploration解决exploitaion仅仅使用部分数据）（exploration问题）用户与系统互动的精力和时间有限；相较于基于已经获得的用户偏好的推荐，无关的推荐会削弱用户的偏好。

5. evaluation and user simulation

CRS需要从turn-level和conversation-level进行评估，用online数据进行评估（但是难以获得）——对应解决方案：off-policy和用户仿真。

和利用offline data的静态模型不同，CRS重视用户在多轮互动中的体验。因此在评估时，不仅要考虑（互动）轮数（推荐和回答的生成），还有对话。除此之外，用于评估CRS的大量online 用户互动数据难以获得。解决的方法包括：（1）利用off-policy评估：包括利用历史记录数据的target policy（2）引入用户仿真代替真实用户进行评估。

（off-policy:策略和采用策略不一致。）