当前位置: 首页 > news >正文

Hierarchical Reinforcement Learning for Course Recommendation in MOOCs论文阅读

论文1简介

标题:Hierarchical Reinforcement Learning for Course Recommendation in MOOCs

作者:Jing Zhang, Bowen Hao, Bo Chen, Cuiping Li, Hong Chen, Jimeng Sun

单位: 中国人民大学教育部数据工程与知识工程重点实验室、 中国人民大学信息学院

佐治亚理工学院计算科学与工程学院

发表会议:AAAI

发表时间:2019年

论文研究主题归类:强化学习在推荐系统中应用

1.论文解决什么问题

在以往的基于注意力机制的推荐系统中,当用户对许多不同的课程都有兴趣时,对目标推荐课程有贡献的课程的影响效果被不同兴趣的其他的历史课程节点影响所干扰,注意力机制表现不佳,因而导致推荐系统误判。作者使用强化学习方法对推荐课程系统中的原始数据进行噪声处理,减小噪声对推荐的影响。

2.是否有公开的数据集及源代码

数据集来自慕课app后台的数据,公开了一部分。

源代码:GitHub-jerryhao66/HRL

3.论文的主要观点

将用户资料的修改过程形式化为一个由智能体进行的分层顺序决策过程。遵循一个修改策略,执行一个高级任务和一个低级任务来修改资料。在修改了用户的整个资料之后,代理从环境中获得一个延迟的奖励,根据这个奖励更新其策略。可以将环境视为数据集和前一节介绍的预训练的基本推荐模型。策略更新后,根据代理修改的资料重新训练基本推荐模型。

相关文章:

  • leetcode 74. 搜索二维矩阵
  • Java从入门到“放弃”(精通)之旅——启航①
  • Ubuntu远程连接Mysql数据库(图文详解)
  • HashMap为什么扩容为原来2倍呢?
  • 栈和队列详细讲解
  • HDCP(五)
  • 【进程通信】 Linux下使用共享内存实现跨进程通信:基于C++的完整示例
  • rancher 采用ingerss ssl 部署nginx+php项目
  • c# 使用NPOI将datatable的数据导出到excel
  • OSPF不规则区域和LSA
  • 【Java学习】AI时代下如何学习Java语言开发
  • 【算法学习计划】回溯 -- 记忆化搜索
  • StringTemplate修仙指南:字符串处理的“言出法随“大法
  • 智能物联网网关策略部署
  • vue3+vite+js项目引入electron构建跨平台桌面应用
  • Excel 自动执行全局宏
  • 项目进度延误的十大原因及应对方案
  • 4-10记录(
  • 聊天室项目Day3之服务器的http的get和post回复实现
  • 软件信息安全性测试如何进行?有哪些注意事项?
  • wordpress网站更改主题信息/网络平台怎么创建
  • 旅游网站建设目的/今日的重大新闻
  • 用户体验比较好的网站/营销型网站建设公司
  • 湖南微网站营销/成都seo达人
  • 德州市建设小学网站/国际足联世界排名
  • 郑州网站建设咨询/网络营销的种类