UMBRELLA

人工智能领域正在快速发展，算法不断发展以匹配甚至超越人类的能力，例如ChartGPT及其最近发布的新功能。我们今天使用的大多数人工智能工具，例如谷歌翻译等虚拟协助机器人，都是基于深度学习框架构建。深度学习（DL）是机器学习的高级子领域。深度学习模型可以自行演化，无需持续编程。深度学习网络具有无限的学习能力，可以理解数量惊人的数据，并为全新的分析水平打开大门。这些算法可以增强计算机视觉、语音识别、自然语言处理和分析任务，其应用范围从自动驾驶汽车到医学研究和诊断。

阅读全文 »

有效地处理从pandas到Pytorch的表格数据集中的数千个特征

发表于 2024-02-27 分类于人工智能本文字数： 2.6k 阅读时长 ≈ 9 分钟

在实践中，传统的表格数据的形状为(batch_size, feat_1, feat_2,…feat_N)，其中N是任意大的。当有数千个特征（例如，N>1000）时，很难知道Pytorch张量中的哪些列索引对应于哪个特征。以及如何为神经网络架构应用适当的Pytorch模块。

阅读全文 »

Markdown常用LaTex数学公式

发表于 2024-02-27 分类于人工智能本文字数： 1.7k 阅读时长 ≈ 6 分钟

众所周知，数据挖掘、机器学习以及深度学习等，在学习与运用过程中，会涉及到大量的数学公式，而公式的编辑往往比较繁琐。LaTeX公式有两种，一种是用在正文中的，一种是单独显示的。正文中的公式如下:

$...$

单独一行显示的时候使用如下命令：

$$...$$

其中，$符号中间包含的三个点表格的是LaTex的公式命令。

阅读全文 »

随机森林（PyTorch）

发表于 2024-02-27 分类于人工智能本文字数： 339 阅读时长 ≈ 1 分钟

随机森林

随机森林原理：随机森林，是一种基于决策树的集成学习算法。它通过构建多棵决策树，并将它们的预测结果进行投票或平均，从而提高预测的准确性和稳定性。每棵树都是在随机抽取的数据样本和特征上构建的，因此可以有效减少过拟合，提高模型的泛化能力。
应用场景：随机森林在许多领域都有广泛应用，如金融领域的信用评分、医疗领域的疾病预测、电商领域的推荐系统等它能够处理高维数据和缺失值，对异常值具有较强的鲁棒性，因此在实际问题中表现出色。
阅读全文 »

反向传播（PyTorch）

发表于 2024-02-26 分类于人工智能本文字数： 487 阅读时长 ≈ 2 分钟

反向传播

想象一下，你正在玩一个猜数字的游戏，你需要猜一个数字，这个数字是正确答案。每次猜完后，都会有人告诉你猜的数字是偏大还是偏小了。根据这个反馈，你可以调整你的猜测，直到猜正确为止。这就是反向传播算法的基本思想。反向传播是一种用于训练神经网络的算法。它通过计算损失函数关于网络参数的梯度，从而对网络参数进行更新，以达到减小损失函数值的目的。这个过程中，算法会从输出层开始，逐层计算每一层的梯度，知道输入层。这个例子中，我们定义了一个简单线性模型，并使用随机梯度下降法进行训练。在每次迭代中，我们首先进行前向传播，计算输出和损失；然后进行反向传播，计算梯度；最后更新模型参数。通过这个例子，我们可以看到反向传播算法在神经网络训练中的重要作用。

阅读全文 »

Pathway

发表于 2024-02-26 分类于人工智能本文字数： 1.4k 阅读时长 ≈ 5 分钟

Pathway

阅读全文 »

UMBRELLA

数据可视化（Seaborn）

机器学习（中级）

介绍

缺失值（Missing Values）

机器学习可解释性

模型见解的用例

机器学习（初级）

基础数据探索

Pandas

十大深度学习(DL)框架

有效地处理从pandas到Pytorch的表格数据集中的数千个特征

Markdown常用LaTex数学公式

随机森林（PyTorch）

随机森林

反向传播（PyTorch）

反向传播

Pathway

Pathway