UMBRELLA

机器学习(ML)(十八) — 强化学习探析

发表于 2024-11-25 分类于人工智能本文字数： 15k 阅读时长 ≈ 49 分钟

介绍

强化学习(Reinforcement Learning, RL)是一种机器学习的范式，主要关注智能体(agent)如何通过与环境的互动来学习最优策略，以最大化累积奖励。与监督学习和无监督学习不同，强化学习并不依赖于标注数据，而是通过试错(trial and error)的方法来优化决策。在强化学习中，主要涉及以下几个核心要素：智能体(Agent)，执行动作以影响环境的实体；环境(Environment)，智能体所处的外部系统，它对智能体的动作做出反应并提供反馈；状态(State)，描述环境在某一时刻的情况，智能体根据当前状态做出决策；动作(Action)，智能体在特定状态下可以选择的行为；奖励(Reward)，环境对智能体行为的反馈信号，通常是一个标量值，用于评估该行为的好坏；策略(Policy)，定义了智能体在特定状态下选择动作的规则，可以是确定性的也可以是随机性的；价值函数(Value Function),用于评估在某一状态下，智能体能够获得的长期回报期望。

阅读全文 »

机器学习(ML)(十七) — 搜索引擎探析

发表于 2024-11-15 分类于人工智能本文字数： 14k 阅读时长 ≈ 46 分钟

介绍

搜索引擎是一种根据用户需求，通过特定算法和策略从互联网上检索信息并反馈给用户的系统。搜索引擎可以被定义为一个自动化系统，它通过计算机程序从互联网收集信息，经过组织和处理后，为用户提供检索服务。搜索引擎的发展经历了多个阶段：第一代搜索引擎(1994)：以人工分类为主，代表有Yahoo；第二代搜索引擎：利用关键字进行查询，Google是其代表；第三代搜索引擎：强调个性化和智能化，结合人工智能技术；第四代搜索引擎：应对信息多元化，采用更精确的特征提取和文本处理技术。

阅读全文 »

机器学习(ML)(十六) — 推荐系统探析

发表于 2024-11-11 分类于人工智能本文字数： 13k 阅读时长 ≈ 44 分钟

重排 - 多样性算法(DPP)

行列式点过程(determinantal point process, DPP)是一种概率模型，最早引入于量子物理学中，用于描述费米子系统的分布。DPP的核心思想是能够有效地从一个全集中抽取出具有高相关性和多样性的子集，广泛应用于推荐系统、机器学习等领域，DPP是目前推荐系统重排多样性公认最好的多样性算法。

阅读全文 »

机器学习(ML)(十五) — 推荐系统探析

发表于 2024-11-06 分类于人工智能本文字数： 10k 阅读时长 ≈ 34 分钟

特征交叉 - 因式分解机(FM)

假设有个特征，记作，这是个线性模型，记作，其中是偏移项，叫做bias，第二项是个特征的连加，其中表示每个特征的权重，是线性模型的输出，它是对目标的预估。这个线性模型有个参数，是权重，是偏移项。线性模型的预测是特征的加权和。特征之间没有交叉，在推荐系统中，特征交叉是很有必要的，可以让模型的预测更准正确。

阅读全文 »

机器学习(ML)(十四) — 推荐系统探析

发表于 2024-11-04 分类于人工智能本文字数： 7.1k 阅读时长 ≈ 24 分钟

排序 - 多目标模型

我们先回顾一下推荐系统的链路，分为召回，粗排、精排、重排。有很多条召回通道，从几亿个物品选出几千个物品，做完召回之后，要从中选出用户最感兴趣的物品，这就要用到粗排和精排，粗排会给召回的物品逐一打分，保留分数最高的几百个物品，然后使用精排模型给粗排选中的几百个物品打分但不做截断，让几百个物品全都带着精排分数进入重排，最后一步是重排，做多样性抽样，并且把相似内容打散，最终由几十个物品被选中展示给用户。

阅读全文 »

机器学习(ML)(十三) — 推荐系统探析

发表于 2024-10-29 分类于人工智能本文字数： 15k 阅读时长 ≈ 49 分钟

召回 - 双塔模型

训练双塔模型需要正样本和负样本，选对正、负样本大于改进模型结构。选择正样本：如果物品给用户曝光之后，会有点击行为，就说明用户对物品感兴趣。把用户和物品二元组作为作为正样本，但是选取正样本有个问题需要解决，就是少部分物品占据了大部分点击，正样本是有点击的物品，导致正样本属于热门物品。拿过多的热门物品作为正样本，会对冷门物品不公平，这样会使热门物品更热，冷门物品更冷。解决方案是：对冷门物品过采样，或降采样热门物品。过采样(up-sampling)：一个样本出现多次；降采样(down-sampling)：一些样本被抛弃，以一定概率抛弃一些样本。抛弃的概率与样本的点击次数正相关。

阅读全文 »

机器学习(ML)(十二) — 推荐系统探析

发表于 2024-10-22 分类于人工智能本文字数： 13k 阅读时长 ≈ 42 分钟

概念介绍

推荐系统(Recommendation system)的链路包括两个重要的步骤：检索（称召回）和排名（分为粗排，精排和重排）检索或召回主要用于衡量系统从全量信息中找出相关内容的能力。它的核心目的是在用户查询的背景下，尽可能多地返回与之相关的信息。如下图所示：

阅读全文 »

机器学习(ML)(十一) — 推荐系统探析

发表于 2024-10-16 分类于人工智能本文字数： 14k 阅读时长 ≈ 46 分钟

介绍

推荐系统(Recommendation system)的商业影响和实际使用案例数量甚至远远超过学术界的关注程度。每次你访问京东app、淘宝app、美团app等或腾讯视频等电影流媒体网站，或者访问提供短视频(抖音、快手)应用时，这类应用都会向你推荐他们认为你可能想买的东西、他们认为你可能想看的电影或他们认为你可能想尝试的餐馆。对于许多公司来说，很大一部分销售额是由他们的推荐系统(Recommendation system)推动的。因此，对于许多公司来说，推荐系统(Recommendation system)带来的经济效益或价值非常大。因此，我们很有必要深入了解一下什么是推荐系统(Recommendation system)。

阅读全文 »

机器学习(ML)(十) — 探析

发表于 2024-10-13 分类于人工智能本文字数： 12k 阅读时长 ≈ 39 分钟

因子分析(Factor Analysis)

因子分析(Factor Analysis)是一种统计方法，旨在通过识别潜在的变量（因子）来解释观测变量之间的相关性。它广泛应用于心理学、社会科学、市场研究和其他领域，以简化数据结构、减少维度和发现潜在的关系。因子分析(Factor Analysis)原理是将多个观测变量归结为少数几个潜在因子。这一过程通常包括以下步骤：1.数据收集与准备,收集相关的数据集，确保数据的质量和适用性；2.相关矩阵计算，计算观测变量之间的相关矩阵，以了解变量之间的关系；3.因子提取，使用统计方法（如主成分分析或最大似然估计）提取因子；因子旋转，为了使因子更易于解释，通常会对提取的因子进行旋转。旋转方法包括正交旋转（如Varimax）和斜交旋转（如Promax）；因子解释，根据因子的载荷（即每个观测变量与因子的关系）来解释每个因子的含义；模型评估，通过各种统计指标（如KMO检验和Bartlett球形检验）评估模型的适用性和有效性。

阅读全文 »

机器学习(ML)(九) — 探析

发表于 2024-10-09 分类于人工智能本文字数： 11k 阅读时长 ≈ 35 分钟

密度估计

密度估计(Density Estimation)是一种用于估计随机变量的概率密度函数(PDF)的非参数统计方法。它通过对样本数据进行分析，提供一个平滑的函数，以表示数据在不同值上的分布情况。密度估计(Density Estimation)在数据分析、机器学习、信号处理等多个领域中具有广泛应用。

阅读全文 »