UMBRELLA

OpenAI Gym（PyTorch）

发表于 2024-02-21 分类于人工智能本文字数： 397 阅读时长 ≈ 1 分钟

OpenAI Gym

OpenAI Gym就像一个智能游戏平台，帮你把复杂环境规则打包成一个易用接口。它就像这样：

——> reset()：一键重启游戏，返回新场景给AI看
——> step(action)：AI选择动作，执行后，Gym会反馈：
- 新鲜出炉的观测结果（就是新的游戏画面）
- 动作带来的奖励分
- 游戏是否过关
- 还有额外的小贴士（info）

简而言之，Gym简化了环境交互，让你专心训练AI算法，无需研究背后的实现。

阅读全文 »

模型的泛化能力（PyTorch）

发表于 2024-02-21 分类于人工智能本文字数： 525 阅读时长 ≈ 2 分钟

模型的泛化能力

模型的泛化能力（generalization capability）是指一个机器学习和深度学习模型在未见过的新数据上的表现如何，即他能否有效地将从训练集学到的知识迁移到测试集或实际应用中去。如果一个模型对训练数据拟合的非常好，但在新的未知数据上表现糟糕，我们说这个模型过拟合了，它的泛化能力较弱；反之如果模型在保持训练数据良好拟合的同时，在新数据上也能保持较好的性能，则说明具有良好的泛化能力。下面的代码是通过一个基于PyTorch框架的简单线性回归模型示例来直观展示模型泛化能力的概念。

阅读全文 »

GPT与传统模型的区别（PyTorch）

发表于 2024-02-21 分类于人工智能本文字数： 767 阅读时长 ≈ 3 分钟

GPT与传统模型的区别

在GPT之前，已经有多年的自然语言处理（NLP）研究和应用，但是传统的模型和方法往往面临一些挑战，例如大量标注数据的依赖、模型的可解释性较差，难以处理复杂的语义关系等。说人话就是得益于预训练无监督技术的发展。GPT获得无监督学习和零杨本学习能力主要依赖于预训练（Pre-training）技术。预训练技术一种通过对大量无标注文本数据（即无监督数据）进行学习，从而得到一种通用的语言表示能力的方法。在GPT中，预训练是预测给定前文（context）的下一个词（target）实现的，这是一个自回归任务（Autoregressive task）。通过在大量无标注文本数据上进行预训练，GPT可以学习到语言的语法、语义和上下文信息，从而具备了强大的语言生成和理解能力。

GPT的两样本学习能力来自于其预训练的通用性和微调（Fine-tuning）的能力。在微调阶段，可以将GPT用于具体的任务，例如文本分类、命名实体识别等，这通常需要在有标注的数据集上进行。通过微调，GPT可以在特定的任务上获得更好的性能，而不需要从头开始训练模型。这种微调过程类似于“迁移学习”，使得GPT可以在不同任务之间共享知识和经验，从而实现零样本学习。然而，以前没有这种技术的主要原因在于数据规模和计算资源的限制。无监督学习需要大量的无标注数据，而零样本学习需要模型具有强大的泛化能力。在GPT之前，由于数据规模较小和计算资源有限，很难训练出具有这样能力的模型。随着大数据和云计算的发展，现在可以训练出更大规模和更加强大的模型，这使得无监督学习和零样本学习成为可能。因此，GPT的出现标志着自然语言处理领域的一个重大突破。

阅读全文 »

CUDA让训练加速（PyTorch）

发表于 2024-02-21 分类于人工智能本文字数： 375 阅读时长 ≈ 1 分钟

CUDA让训练加速

CUDA是英伟达推出的并行计算平台和编程模型，它能让开发者利用GPU的强大计算能力执行通用计算任务，而不仅仅处理图形数据。就像CPU是计算机的“大脑”，执行各种指令；GPU则是“超级助手”，尤其擅长同时处理大量相似数据。这在科学计算、机器学习和深度学习中的矩阵运算等计算密集型场景中非常高效。没有CUDA，用CPU运行深度学习模型可能会非常耗时。但有了CUDA和cuDNN这样的库，我们可以把计算密集型任务分发到GPU上并行处理，大大加速训练速度。

阅读全文 »

对抗训练（PyTorch）

发表于 2024-02-21 分类于人工智能本文字数： 583 阅读时长 ≈ 2 分钟

对抗训练

在智能化技术的核心领域，对抗训练堪称一种砥砺模型鲁棒性的精妙策略，尤其在自然语言处理（NLP）和计算机视觉的广阔天地中绽放异彩。在深度学习的锤炼过程中巧妙地融入“对抗样本”，犹如模拟实战中的潜在敌意攻击情境，旨在确保模型即使面对精心构建的为饶数据亦能坚守准确预测的阵地。对抗样本这一概念，蕴含了对机器智能深层逻辑的挑战与启迪：它们是对原有数据进行近乎难以察觉的微妙篡改，尽管人类感知上的语义完整性得以保留，却足以使最紧密的机器学习架构陷入判断失误的迷局——如在文本世界里，仅凭一字一句的微妙变换，即可颠覆原本精准无比的分类结果。对抗训练的实施步骤可以凝练如下：

针对正常输入样本：首先抽丝剥茧般计算模型预测输出的梯度信息。
运用特定法则，在梯度指引的方向上。限制性调整输入样本来孕育对抗样本。
最后，讲这些对抗样本纳入训练集的核心，共同雕琢模型的认知结构，使其习得识别并从容应对对抗样本的能力，从而实现模型预测性能的根本强化。
阅读全文 »

保存和加载模型（PyTorch）

发表于 2024-02-21 分类于人工智能本文字数： 387 阅读时长 ≈ 1 分钟

保存和加载模型

当我们在训练深度学习模型时，经常会遇到训练周期较长的情况，或者我们需要对模型进行反复调整和优化。为了节省时间，提高效率，我们可以将训练好的模型保存下来，然后在需要时加载模型进行推理和继续训练。在PyTorch中，保存和加载模型的过程非常简单，我们可以使用torch.save()和torch.load()函数来实现。

阅读全文 »

动态计算图（PyTorch）

发表于 2024-02-21 分类于人工智能本文字数： 544 阅读时长 ≈ 2 分钟

动态计算图

动态计算图是一种编程模型，特别适用于深度学习框架PyTorch中。在动态计算图中，每一步操作（比如矩阵乘法、加法、神经网络层的前向传播）都会即时构建并执行一个“子图”，这个子图会随着代码的运行而动态地变化。这意味着当你在程序中修改了数据或者改变了计算流程时，计算图也会相应的更新。相比之下，静态计算图在执行前需要预先定义完整的计算流程，然后后运行时依次执行所有操作，不支持事实改变计算结构。通过这段代码，可以看到PyTorch中的动态图是如何随代码执行顺序动态构建，并能够自动追踪计算历史来完成梯度计算的过程。这种灵活性使得研究者和开发者可以更加直观和便捷地调试和实验不同的模型架构和优化策略。

阅读全文 »

Dropout正则化（PyTorch）

发表于 2024-02-21 分类于人工智能本文字数： 689 阅读时长 ≈ 2 分钟

Dropout正则化

Dropout正则化是一种在训练深度神经网络时防止过拟合的技术。它的工作原理就像是每次训练时随机让一部分神经元“休息”，即暂时不参与计算，具体来说，每个神经元按照预设的概率p被临时从网络丢弃（其输出值被置0）。这样做的目的是避免模型对某些特征或特征组合过度依赖，从而提高模型的泛化性能。想想一个场景，如果一个团队过分依赖某几个核心成员，在这些关键人物不在场时，整个团队的表现可能大幅下滑。同样地，在神经网络结构中，通过Dropout技术，模型不会对一组局部特征过分敏感，这会促使网络学习更加稳定，多样化的特征表示。在实际代码实现上，nn.Dropout(p)是一个模块，当模型在训练模式下运行时，该模块会议给定的概率p随机丢弃输入信号的某些元素。值得注意的是，再适用PyTorch时。无需手动开关Dropout功能，因为框架会根据.train()和.eval()方法智能地控制Dropout在训练阶段和评估阶段的行为。

阅读全文 »

数据加载器（PyTorch）

发表于 2024-02-21 分类于人工智能本文字数： 712 阅读时长 ≈ 2 分钟

数据加载器

数据加载器（DataLoader）在机器学习和深度学习中就像一个智能的“快递员”，负责将训练数据高效、有序地送达模型进行学习。它主要做两件事情：

批量处理数据：数据加载器会按照你设定的批次大小（batch_size），从整个数据集中取出一部分样本（如一批图片以及对应的标签）送给模型训练。这样做的好处是能够利用举证运算加速计算，并且有助于稳定训练过程。
数据预处理与管理：数据加载器可以结合数据预处理操作，比如对图像进行归一化、裁剪、或增强等，使得原始数据满足模型输入要求。同时，他可以实现数据集的随机读取（shuffle），多线程或多进程加载（num_workers），从而提高数据度取效率。

简答来说，数据加载器就是帮你把硬盘上的大量原始数据组织好，变成一小块喂给模型吃，还负责把这些数据调整成合适的形式，让模型吃的舒服，学的更快。

阅读全文 »

损失函数（PyTorch）

发表于 2024-02-20 分类于人工智能本文字数： 586 阅读时长 ≈ 2 分钟

损失函数

损失函数（Loss Function）：通俗来讲，就像是一个衡量工具或者说‘打分老师’，在机器学习和深度学习中用来评价模型的预测结果有多接近或者说符合实际的真实答案。想象以下，你正在教一个小孩做数学题，每做完一道题，你会检查他的答案与正确答案之间的差距，并且基于这个差距给出反馈。如果完全答对了，那就给满分；如果答错了，错的越多得分就越低。

在模型训练的过程中，损失函数就是一个”打分机制“。比如模型预测房价、识别图像或翻译句子时，他会生成一个预测值，然后损失函数会对这个预测值与已知真实值，计算出一个误差值（也就是损失）。模型的目标就是通过不断调整内部参数，使得每次预测后的损失尽可能小，即预测结果越来越贴近真实结果。损失函数的主要作用：

评估模型性能：量化模型预测的好坏，损失越小表示预测越准确。
指导优化过程：在训练的过程中，通过梯度下降等优化算法，依据损失函数计算出模型参数应如何更新，从而改进模型预测能力。
模型选择与调参：不同的任务会选择不同的损失函数，合适的损失函数有助于提升模型在特定问题上的表现。
阅读全文 »