机器学习(ML)(十九) — 强化学习探析
机器学习(ML)(十八) — 强化学习探析
介绍
强化学习(Reinforcement Learning, RL
)是一种机器学习的范式,主要关注智能体(agent
)如何通过与环境的互动来学习最优策略,以最大化累积奖励。与监督学习和无监督学习不同,强化学习并不依赖于标注数据,而是通过试错(trial and error
)的方法来优化决策。在强化学习中,主要涉及以下几个核心要素:智能体(Agent
),执行动作以影响环境的实体;环境(Environment
),智能体所处的外部系统,它对智能体的动作做出反应并提供反馈;状态(State
),描述环境在某一时刻的情况,智能体根据当前状态做出决策;动作(Action
),智能体在特定状态下可以选择的行为;奖励(Reward
),环境对智能体行为的反馈信号,通常是一个标量值,用于评估该行为的好坏;策略(Policy
),定义了智能体在特定状态下选择动作的规则,可以是确定性的也可以是随机性的;价值函数(Value Function
),用于评估在某一状态下,智能体能够获得的长期回报期望。
机器学习(ML)(十七) — 搜索引擎探析
机器学习(ML)(十六) — 推荐系统探析
机器学习(ML)(十五) — 推荐系统探析
机器学习(ML)(十四) — 推荐系统探析
机器学习(ML)(十三) — 推荐系统探析
机器学习(ML)(十二) — 推荐系统探析
机器学习(ML)(十一) — 推荐系统探析
介绍
推荐系统(Recommendation system
)的商业影响和实际使用案例数量甚至远远超过学术界的关注程度。每次你访问京东app
、淘宝app
、美团app
等或腾讯视频等电影流媒体网站,或者访问提供短视频(抖音、快手)应用时,这类应用都会向你推荐他们认为你可能想买的东西、他们认为你可能想看的电影或他们认为你可能想尝试的餐馆。对于许多公司来说,很大一部分销售额是由他们的推荐系统(Recommendation system
)推动的。因此,对于许多公司来说,推荐系统(Recommendation system
)带来的经济效益或价值非常大。因此,我们很有必要深入了解一下什么是推荐系统(Recommendation system
)。