第01章 深度学习概述 课堂互动 显示答案 | 返回首页

作者:欧新宇(Xinyu OU)
当前版本:Release v2.0

最后更新:2024-08-29


【课前自测01】

1. 在深度学习中,机器学习的主要任务是什么?( )。
A. 识别图像中的物体
B. 将输入映射到目标
C. 预测股票价格
D. 编写计算机程序

2. 深度学习作为一种极具变革性的方法,已经被用来解决许多实际问题,但依然没有普及到改变实际的产品和流程中。由此可见,深度学习注定会成为人工智能的第三次寒冬。( )

3. SVM的目标是通过在属于两个不同类别的两组数据间找到良好的决策边界来解决分类问题,它首先将原始特征映射到( )。
A. 高维空间
B. 低维空间
C. 等维度的其他空间
D. 向量空间

4. 一般来说,想要预测连续变量会使用下列( )方法。
A. 逻辑回归
B. 线性回归
C. KMeans
D. 以上都行

5. 损失函数的主要任务是什么?( )
A. 控制神经网络的输出
B. 计算预测值与期望值之间的距离
C. 初始化权重
D. 激活神经元

6. 在神经网络中,什么被称为神经元?
A. 数据点
B. 权重
C. 网络层
D. 基本的计算单元

7. 随机梯度下降(SGD)是优化神经网络参数的唯一方法。( )

8. 梯度是( )运算的导数,它是导数从一元函数向多元函数的推广。
A. 标量
B. 向量
C. 张量
D. 函数


【课堂互动1.1】 人工智能的基本概念及发展简介@1.1

1. (多选)人工智能、机器学习和深度学习三者之间的关系是( )
A. 深度学习是机器学习的一种实现方法
B. 三个不同的领域,分别独立但互有交叉
C. 计算机视觉、语音识别和自然语言处理都是深度学习的具体应用,也都属于机器学习和人工智能的范畴
D. 人工神经网络是深度学习最近代表性的一种方法,它与人工智能和机器学习无关

2. 人工智能诞生于20世纪50年代的( )。
A. 博鳌论坛
B. 达特茅斯会议
C. 世界人工智能大会
D. MIT人工智能研究小组内部会议

3. (多选)深度学习已经在很多任务上获得了重大突破,以下属于这一类的包括:( )。
A. 接近人类水平的图像分类
B. 更好的机器翻译
C. 接近人类水平的逻辑判断与推理
D. 自动文本到语音的转换

4. 到目前为止,人工智能已经经历了( )次寒冬,这几次寒冬都给人工智能的发展带来了几乎毁灭性的影响。
A. 一次
B. 二次
C. 三次
D. 四次

5. 人工智能的第一次寒冬是由于( )并没有完成它所被期望任务。
A. 专家系统
B. 支持向量机
C. 多层感知机
D. 符号主义

6. 人工智能的第二次寒冬是由于( )并没有完成它所被期望任务。
A. 专家系统
B. 支持向量机
C. 多层感知机
D. 符号主义


【课堂互动1.2】 机器学习概述@1.2.1

1. 与经典的程序设计相似,在机器学习的范式中,数据也是最主要的输入,不同的是在机器学习范式中,输出是( )。
A. 答案
B. 规则
C. 数据
D. 以上都不是

2. 机器学习(特别是深度学习)呈现出相对较少的数学理论,并且以工程为导向。因此,研究机器学习应用不需要数学知识。( )

3. 机器学习(深度学习)的核心问题在于:( )。
A. 完整地输入数据,确保所有的数据都起到作用
B. 有意义地转换数据,使其更容易被理解和使用
C. 对每个数据都有正确的输出,以确保数据利用的有效性
D. 获取数据更多的特征,以更充分地利用数据

4. 机器学习中的学习是指( )。
A. 更好地将输入数据转换为有用的表示
B. 讲数据转换为更有代表性的特征
C. 寻找更好的数据表示的搜索过程
D. 使用机器实现人工算法的自动化

5. 在使用深度神经网络在对图像样本进行建模的过程中,越深的层( )。
A. 所得到的表示与原始图像越接近
B. 包含原始图像的信息越多
C. 其语义信息越丰富
D. 其所包含的信息越有价值


【课堂互动1.3】 机器学习的历史和辉煌@1.2.2

1. 概率建模是统计学原理在数据分析中的应用,是最早的机器学习形式之一,最著名的算法之一就是支持向量机。( )

2. 逻辑回归被认为是现代机器学习的“Hello World”,它是一种基于概率的算法,它是典型的( )算法。
A. 回归模型
B. 分类模型
C. 既是回归模型,也是分类模型
D. 既不是回归模型,也不是分类模型

3. 1989年,第一次将卷积神经网络应用到手写数字识别的研究者是( )。
A. Geoffrey Hinton(杰夫瑞辛顿)
B. Yoshua Bengio(约书亚·本吉奥)
C. Yann LeCun(燕乐坤)
D. Andrew Ng(吴恩达)

4. 20世纪90年代,支持向量机成为最具影响力的机器学习算法,这主要得益于它是基于( )的算法。
A. 概率统计
B. 逻辑推理
C. 线性模型
D. 核方法

5. (多选)以下模型原生就属于融合模型(Boosting)的包括( )。
A. 随机森林
B. 支持向量机
C. 梯度提升机
D. 决策树

6. 与传统机器学习不同的是,深度学习不需要手工从数据中选择并提取特征,整个特征工程完全是自动化的,这种学习方法被称为端到端学习法。( )


【课堂互动1.4】 深度学习的概述@1.3

1. 神经网络的训练总是需要大量的计算资源。( )

2. 深度学习与传统机器学习相比,最大的不同是摒弃了特征工程的繁琐,使得模型能够完全自动化地从原始数据获取信息,这种方法称为()。
A. 去特征化学习
B. 端到端学习
C. 无监督学习
D. 自动特征抽取学习

3. (多选)深度学习能在计算机视觉和语音识别等感知任务上具有非凡的效果,最重要的原因是来源于两个思想( )。
A. 基于概率的数学推导
B. 卷积神经网络
C. 决策边界理论
D. 反向传播

4. (多选)深度学习在2012年后取得了成功,这主要是因为三种技术推动了机器学习的进步,它们包括:( )。
A. 硬件,尤其是高性能的图形芯片GPU的出现
B. 数据集和基准
C. 先进的数学理论的产生
D. 算法上的改进

5. (多选)下列数据源对计算机视觉任务具有较大帮助的包括:( )。
A. Flickr
B. 维基百科
C. YouTube
D. Imagenet

6. (多选)除了硬件和数据之外,一些可靠的方法用于实现较深的神经网络,它们包括:( )。
A. ReLU激活函数
B. Xavier权重初始化方案
C. 随机梯度下降SGD
D. 批标准化BatchNorm

7. 以下编程语言最适合人工智能,特别是深度学习领域的是( )。
A. Java
B. PHP
C. Python
D. Html


【课堂互动1.5】 深度学习的工作原理@1.4.1

1. 深度学习中,什么函数用于衡量预测值与期望值之间的差距?( )
A. 激活函数
B. 损失函数
C. 优化器
D. 梯度下降

2. 以下描述神经网络的工作原理正确的是( )。
A. 通过观察示例学习数据变换
B. 将输入映射到目标的过程
C. 通过一系列简单的数据变换实现输入到目标的映射
D. 通过观察示例学习权重

3. 机器学习学习过程的本质是( )。
A. 找到一组模型参数,使得损失函数最大化
B. 找到一组模型参数,使得损失函数最小化
C. 找到一组模型参数,使得损失函数等于0
D. 找到一组模型参数,使得损失函数等于1

4. 在深度学习中,用于调节权重的核心算法是什么?
A. 梯度下降
B. 反向传播
C. 前向传播
D. 线性回归


【课堂互动1.6】 神经网络工作原理的关键点@1.4.2

1. 以下哪个部件是神经网络的核心元素?( )
A. 权重和激活函数
B. 全连接层和softmax
C. 神经元和权重
D. 张量和ReLU

2. 神经网络中每层对输入数据所做的操作都保存在( )。
A. SQL Server或Oracle等关系型数据库中
B. 输入样本的附加张量中
C. 该层的权重中
D. 一般不进行保存

3. 反向传播算法是深度学习的核心,它利用( )作为反馈信号来对模型进行微调,从而降低损失值。
A. 最后一层的权重
B. 任意层的权重
C. 预测值与真实值之间的距离
D. 预测值

4. 感知机在执行训练时,有如下任务:(1)初始化权重;(2)更新权重;(3)输入数据,获得输出;(4)反复迭代;(5)计算预测值与真实值的误差。这些任务的正确执行顺序是( )。
A. 1, 3, 5, 2, 4
B. 1, 2, 3, 4, 5
C. 3, 1, 2, 5, 4
D. 3, 1, 5, 2, 4

5. 在神经网络训练开始时,权重通常如何初始化?
A. 设置为1
B. 设置为0
C. 随机初始化
D. 设置为无穷大

6. 以下哪个选项与神经网络的优化无关?( )
A. 梯度下降
B. 反向传播
C. 线性回归
D. 批量梯度下降

7. 神经网络的层数越多,其性能一定越好。( )

8. 在神经网络中,每个神经元都接收来自前一层所有神经元的输出。( )


【课堂互动1.7】 神经网络的基本原理:导数及梯度@1.4.3

1. 基于多层感知机的神经网络使用( )层来构建网络模型。
A. 卷积层
B. 全连接层
C. 池化层
D. 半连接层

2. 神经网络的权重称为可训练参数,它反映了训练数据的内在特征,这些权重通常需要在( )时进行随机初始化。
A. 第一次迭代训练开始前
B. 每次迭代训练开始前
C. 每次迭代训练结束后
D. 最后一轮迭代训练结束后

3. 在对神经网络的权重矩阵进行初始化时,通常会将这些权重初始化为( )。
A. 全0的值
B. 全1的值
C. 很小的随机值
D. 很大的随机值
E. 任意随机值

4. 若存在一个连续的光滑函数 f(x)f(x),若存在点M,当点M的导数为w<0w<0时,x在点M附近的微小变化将导致函数f(x) ( )。
A. 不变
B. 减小
C. 增大
D. 无法确定

5. 下列公式能够正确表示函数ff在距离起始点W0W_0附近的点W1W_1的梯度的是( )。
A. W1=w0step*gradient(f)(w0)W_1=w_0-\text{step*gradient}(f)(w_0)
B. W1=W0step*gradient(f)(W0)W_1=W_0-\text{step*gradient}(f)(W_0)
C. W1=step*gradient(f)(w0)W_1=\text{step*gradient}(f)(w_0)
D. W1=step*gradient(f)(W0)W_1=\text{step*gradient}(f)(W_0)

6. 关于神经网络中权重更新的描述,说法正确的是( )。
A. 权重更新的方向取决于预测值与期望值的差值
B. 权重更新的方向总是沿着梯度的正方向
C. 权重更新的方向是沿着梯度的反方向,以减小损失
D. 权重更新的大小与网络参数的数量无关


【课堂互动1.8】 神经网络的基本原理:随机梯度下降@1.4.4

1. 解析法又称分析法是使用解析式求解数学模型的常用方法。这种方法对于求解神经网络模型同样适用。( )

2. 随机梯度下降算法是利用梯度的微小变化来优化损失函数的一种方法,下列哪种随机梯度下降算法最适合于面向大数据的神经网络。
A. 真随机梯度下降,每次只迭代一个样本
B. 全样本梯度下降,每次迭代都在所有数据上运行
C. 随机随机梯度下降,每次迭代时随机选取一定数量的样本进行处理
D. 小批量随机梯度下降,每次迭代都在固定量(通常都不大)的样本上进行

3. 局部最大值不一定是全局最大值,但极大值通常都是全局最大值。( )

4. 关于深度学习的原理,下列描述正确的一项是( )
A. 学习是指找到一种最优的模型,使其能够较好地学到数据的内在知识
B. 一个模型的损失是指输入样本的真实值和基于样本获得的预测值之间的距离,它是在训练过程种需要最大化的量
C. 优化神经网络无法使用解析法,但是可以通过求导的链式法则来获得梯度函数,并利用随机梯度下降等方法来实现模型的优化
D. 随机梯度下降算法能够有效解决局部最优的问题

5. 神经网络的训练过程总是能找到全局最优解。( )


【课堂互动1.9】 常用工具软件和开发环境@1.5

1. (多选)以下工具包可以用于深度学习应用的是( )。
A. Caffe及Caffe2
B. scikit-learn
C. PaddlePaddle
D. TensorFlow
E. Pytorch
F. OpenCV

2. 以下程序开发语言中,在深度学习中最流行的是( )。
A. Html5+CSS3
B. Javascript语言
C. Python语言
D. C语言
E. Java语言

3. (多选)以下哪些集成开发环境属于常用深度学习应用开发工具的是( )。
A. Visual Studio Code
B. JupyterLab
C. Photoshop
D. PyCharm

4. Python在深度学习中被广泛使用,主要因为它的语法简单易懂和拥有丰富的库和框架。( )

5. Anaconda是一个功能丰富的Python集成开发环境,特别适用于软件包的管理和安装。( )


【拓展练习01】

1. 深度神经网络通过( )来实现输入到目标的映射。
A. 一系列简单的数据变换
B. 单一复杂的数据变换
C. 编程逻辑
D. 线性函数

2. 深度学习的“深度”指的是模型有多少个逻辑层,只要能堆叠起来,无论它的功能如何,都可以作为模型的“深度”来计算。( )

3. 神经网络这一术语来源于神经生物学,它是目前深度学习最主要的核心算法。它的基本原理与人类大脑的工作原理基本相同,它是对大脑模型的计算机化的产物。( )

4. 现阶段,OCR文字识别应用的后台,通常使用的算法是( )。
A. 随机森林
B. 逻辑回归
C. 支持向量机
D. 卷积神经网络

5. 神经网络的产生过程中,以下哪个步骤是用于衡量预测值和真实值之间的差距?( )
A. 抽取训练样本
B. 前向传播
C. 计算损失
D. 更新权重

6. 要能控制神经网络的输出就需要获得神经网络模型的损失值,这个值一般使用损失函数来进行求取,它是( )之间的距离。
A. 预测值与真实目标值
B. 输入层表示与输出层表示
C. 输入层权重与输出层权重
D. 任意两层权重

7. 以下哪个函数不是激活函数?( )
A. ReLU
B. Sigmoid
C. Tanh
D. Linear

8. 在神经网络中,( )决定了每一层实现的变换。
A. 激活函数
B. 权重
C. 输入数据
D. 损失函数

9. 在神经网络的上下文中,'权重'是指神经元之间的连接强度。( )

10. 前向传播是神经网络训练过程中唯一的步骤。( )

11. 神经网络的权重初始化对训练结果没有影响。( )

12. 损失函数用于衡量神经网络的预测值与实际值之间的差异。( )

13. 迁移学习是一种使用预训练模型来加速新模型训练的方法。( )

14. 神经网络中的每一层都有相同的神经元数量。( )

15. 神经网络训练中的批大小(batch size)是一个重要的超参数。( )

16. 神经网络的输出层通常使用Sigmoid激活函数。( )

17. 在神经网络的训练过程中,更新权重是一个关键步骤。以下哪种方法通常用于确定权重的更新方向?
A. 仅通过考虑预测值和期望值之间的损失
B. 利用梯度下降法计算损失函数对网络系数的梯度,并沿梯度的反方向更新权重
C. 随机改变权重,直到找到最优解
D. 通过解析法直接求解最优权重

18. 若存在一个连续的光滑函数 f(x)=2x2+1f(x)=2x^2 + 1,在函数ff上存在一个点M(x=M)M(x=M),该点的瞬时斜率为ww,则在点M+ϵmM+\epsilon_m (假设ϵm\epsilon_m 是一个很小的值)的位置处的函数值为:( )
A. 2ϵx2+12 \epsilon_x^2 + 1
B. 2x2+wϵx+12x^2 + w*\epsilon_x + 1
C. 2ϵm2+12 \epsilon_m^2 + 1
D. 2M2+wϵm+12M^2 + w*\epsilon_m + 1

19. 下列神经网络的训练过程顺序正确的一组是( )。
Step1:在X上运行网络执行前向传输,得到预测值y_pred;
Step2:反复迭代过程,最终得到的网络(权重)在训练数据上具有非常小的损失argmin(loss), 即预测值y_pred和预期目标y之间的距离非常小。此时训练结束。
Step3:更新网络的所有权重(Wb),使网络在这批数据上的损失loss略微降低;
Step4:计算网络在这批数据上的损失loss,用于衡量y_pred和y之间的距离;
Step5:抽取训练样本X和对应目标y组成的数据批量;

A. 51342
B. 15423
C. 15432
D. 51432

20. MNIST手写字体识别数据集是机器学习领域的一个经典数据集,它包含0-9十种数字,其中训练集包含( )个。
A. 10
B. 10000
C. 60000
D. 70000

21. 反向传播算法使用链式法则来计算梯度。( )

22. 随着深度学习的发展,很多投资被吸引进来,其中最重要的投资来源于( )。
A. 有权势的个人投资
B. 中小企业主
C. 政府、高校和科研机构
D. 大型互联网公司、科技巨头企业

23. (多选)深度学习的一些重要特性证明它是人工智能的革命,并且能长盛不衰,它们主要包括:( )。
A. 简单
B. 可扩展性
C. 多功能与可复用
D. 大量的资本注入

24. 以下哪个软件是深度学习框架,并且由Facebook开发?( )
A. TensorFlow
B. Jupyter Notebook
C. PyTorch
D. Caffe

25. Keras是一个深度学习框架,它支持哪种后端?( )
A. TensorFlow
B. MATLAB
C. Adobe
D. SQL

26. Caffe是一个基于Python的深度学习框架。( )

27. 在深度学习的发展历程中,最常见的编程语言包括()。
A. C++
B. python
C. HTML
D. Java

28. 深度学习的“深度”是指这种学习方法能从数据中获取更具有意义的信息。()

(多选)29. 在深度学习发展过程中,三大支柱分别是()。
A. 算力
B. 算法
C. 数据
D. 框架

第01章 深度学习概述 课堂互动 显示答案 | 返回首页