UMBRELLA

未雨绸缪,举重若轻

卷积分类器(The Convolutional Classifier)

  • 使用现代深度学习网络通过Keras构建图像分类器。
  • 使用可重复使用的块设计您自己的自定义卷积网络。
  • 了解视觉特征提取背后的基本思想。
  • 掌握迁移学习的艺术来提升您的模型。
  • 利用数据增强来扩展数据集。
    阅读全文 »

介绍

预测可能是机器学习在现实世界中最常见的应用。企业预测产品需求,政府预测经济和人口增长,气象学家预测天气。对未来事物的理解是科学、政府和工业界的迫切需求,这些领域的从业者越来越多地应用机器学习来满足这一需求。时间序列预测是一个广阔的领域,有着悠久的历史。

  • 工程师对主要时间序列组成部分(趋势、季节和周期)进行建模。
  • 使用多种时间序列图可视化时间序列。
  • 创建结合互补模型优势​​的预测混合体。
  • 使机器学习方法适应各种预测任务。
    阅读全文 »

介绍

什么是深度学习?

近年来,人工智能领域最令人印象深刻的一些进展出现在深度学习领域。自然语言翻译、图像识别和游戏都是深度学习模型已经接近甚至超过人类水平的表现。那么什么是深度学习呢?深度学习是一种以深度计算堆栈为特征的机器学习方法。这种计算深度使得深度学习模型能够理清最具挑战性的现实数据集中发现的各种复杂和分层模式。神经网络凭借其强大的功能和可扩展性,已成为深度学习的定义模型。神经网络由神经元组成,其中每个神经元单独执行简单的计算。神经网络的力量来自于这些神经元可以形成的连接的复杂性。

阅读全文 »

介绍

特征工程的目标

特征工程的目标很简单,就是让您的数据更适合当前的问题。考虑“表观温度”测量,例如炎热指数和风寒。这些量试图根据我们可以直接测量的气温、湿度和风速来测量人类感知的温度。您可以将表观温度视为一种特征工程的结果,试图使观察到的数据与我们真正关心的内容更相关。你可以使用特征工程来实现:

  • 提高模型的预测性能。
  • 减少计算或数据需求。
  • 提高结果的可解释性。
    阅读全文 »

介绍

  • 处理现实世界数据集中常见的数据类型(缺失值、分类变量)。
  • 设计管道以提高机器学习代码的质量。
  • 使用先进的技术进行模型验证(交叉验证)。
  • 构建最先进的模型,广泛用于赢得Kaggle比赛(XGBoost)。
  • 避免常见且重要的数据科学错误(泄漏)。

缺失值(Missing Values)

您将学习三种处理缺失值的方法。然后,您将在现实数据集上比较这些方法的有效性。

阅读全文 »

模型见解的用例

许多人说机器学习模型是“黑匣子”,从某种意义上说,它们可以做出很好的预测,但你无法理解这些预测背后的逻辑。这种说法是正确的,因为大多数数据科学家还不知道如何从模型中提取见解。

  • 模型认为数据中哪些特征最重要?
  • 对于模型的任何单个预测,数据中的每个特征如何影响该特定预测?
  • 每个特征如何从大的角度影响模型的预测(考虑大量可能的预测时,其典型效果是什么)?
    阅读全文 »

基础数据探索

Pandas

任何机器学习项目的第一步都是熟悉数据。 为此,您将使用Pandas库。 Pandas是数据科学家用于探索和操作数据的主要工具。大多数人在代码中将pandas缩写为pd。我们用命令来做到这一点。

1
import pandas as pd
阅读全文 »
0%