第4章 图像数据集和数据预处理 课堂互动 显示答案 | 返回首页

作者:欧新宇(Xinyu OU)
当前版本:Release v1.0

最后更新:2023-01-01


【课堂互动一】经典数据集简介@4.1

1. 在计算机视觉应用开发中,第一步通常是做什么的?
A. 数据处理
B. 构建神经网络
C. 应用部署
D. 获取数据集


2. 现有一幅分辨率为640×480的RGB彩色图像,则该图像文件的字节大小为()。
A. 900KB
B. 921.6KB
C. 307.2KB
D. 300KB


3. 如果现在需要搭建一个可以识别多种物体的图像识别系统,那么下列选项中最有可能用来训练模型的数据集是()。
A. MNIST
B. MS-COCO
C. PASCAL VOC
D. ImageNet


4. (多选)开放图像数据集为我们带来了极大的便利,下列关于图像数据集说法错误的是()
A. CIFAR-10图像的识别难度比MNIST高很多
B. ImageNet数据集都是32×32的彩色图像
C. Cityscapes数据集里包含21841个类别
D. PascalVOC是目标检测数据集


5. 下列关于MNIST数据集的描述正确的是()。
A. MNIST数据集的数据都是32×32的彩色图像
B. 每张图像都进行了边框标注
C. 该数据集全是关于手写字体的图像
D. 该数据集包含60000张训练图像和10000张测试图像


6. 以下数据集被认为是计算机视觉界的“Hello World”数据集的一个是()。
A. MNIST
B. CIFAR
C. Pascal VOC
D. ImageNet


【课堂互动二】数据准备@4.2

1. (多选)图像清洗是计算机视觉最重要的操作之一,以下哪一项属于数据清洗的目的()。
A. 消除图像中无关的信息
B. 删除数据集中无法访问的样本
C. 获取更美观的图像
D. 制作训练数据集

2. 数据集信息字典 dataset_info 可以使用如下的json形式进行存储和传输。如果需要通过字典方式来获取类别“其他垃/烟蒂”的值,并修改为“其他垃圾/烟蒂”,下列正确的是:()。

dataset_info = {
    "dataset_name":"Garbage",
    "num_train":12944,
    "num_val":1458,
    "num_test":400,
    "class_dim":40,
    "label_dict":{
        "0":"其他垃圾/一次性快餐盒",
        "1":"其他垃圾/污损塑料",
        "2":"其他垃/烟蒂",
        "3":"其他垃圾/牙签",
    }
}

A. dataset_info['label_dict']["2"] = '其他垃圾/烟蒂'
B. dataset_info.keys()['label_dict']['2'] = '其他垃圾/烟蒂'
C. dataset_info['label_dict'] = {'2':'其他垃圾/烟蒂'}
D. dataset_info = {'label_dict':{'2':'其他垃/烟蒂'}}

3. OpenCV库常用于图像处理,通过OpenCV读取图片至变量img后,使用img.size函数是设置图像的形状。
A. 正确
B. 错误

4. 图像处理技术用于将图像处理为适合进入机器学习模型的输入。
A. 正确
B. 错误

5. 数据划分是对数据集进行处理的重要操作,以下数据子集可以在训练过程中用来进行模型评估的包括()。
A. 训练集
B. 验证集
C. 测试集
D. 训练验证集

6. 以下计算机视觉任务中,通常使用一个类别标签来进行标识的任务是()。
A. 图像分类
B. 目标检测
C. 图像分割
D. 目标跟踪

7. (多选)以下描述,属于原始数据样本常见问题的包括()。
A. 样本无法读取
B. 图片尺度不相同
C. 图片颜色通道不一致
D. 样本存在冗余
E. 样本目标倾斜

8. 深度学习的训练过程如以下几点,请将这几点按照正确的顺序进行排序。()
a. 使用训练验证集对模型进行训练
b. 使用训练集对模型进行训练
c. 使用测试集对模型进行评估
d. 使用验证集对模型进行评估
e. 将原始数据集划分为训练集、验证集、测试集和训练验证集
A. eadbc     B. ebdac     C. ebcad     D. eacbd


【课堂互动三】数据读取@4.3

1. OpenCV中默认的色彩空间存储格式是()。
A. RGB
B. HSV
C. BGR
D. HSL

2. 通过OpenCV的 cv2.imread() 函数读取指定图片,若要指明OpenCV以灰度图模式读入图像,可以使用下面的()参数。
A. cv2.IMREAD_GRAY
B. cv2.IMREAD_GRAYPIC
C. cv2.IMREAD_GRAYSCALE
D. cv2.IMREAD_GRAYNUMPY

3. [判断题] readline() 是python的内置函数,使用 readline() 方法可以一行一行地读取文件中的数据。
A. 正确
B. 错误

4. (多选)OpenCV库常用于图像处理,现通过OpenCV读取图片至变量 img,执行 img.shape 函数后返回的结果是 (300, 600, 3),我们能够得知()。
A. 图像的形状为(300, 600)
B. 图像的通道数为3
C. 图像的行数为300
D. 图像的列数为300

5. 对于一个神经网络模型,规定它的输出为28×28的RGB图像,输入张量形状为[8,3,28,28],这里8表示()。
A. batch_size
B. channel
C. height
D. epoch

6. (多选)以下描述符合异步数据读取的包括:()。
A. 适合数据量较大、数据读取较慢的场景
B. 数据的读取和模型的训练以串行方式进行
C. 模型直接从缓存队列获取数据
D. 在进行模型训练前需要一次性读取整个数据集的样本

7. 以下函数可以用来实现小批量数据迭代读取的是()。
A. paddle.reader.shuffle
B. paddle.vision.transforms
C. paddle.io.DataLoader
D. cv2.imread
E. paddle.reader.xmap_reader

8. 在对训练数据和测试数据进行处理的时候,都需要将原始样本Resize到模型要求的固定尺寸(例如224×224)。那么,对于训练集和验证集来说,它们所使用的Resize方法必须保持一致。
A. 正确
B. 错误

9. (多选)在创建小批量数据迭代读取器的时候,通常需要将批次数进行打乱操作,下列哪些数据子集必须执行打乱。()
A. 训练集
B. 验证集
C. 测试集
D. 训练验证集


【课堂互动四】数据增广@4.4

1. 图像缩放是图像的基本几何变换,那么要改变图像的大小,使用()函数。
A. cv2.resize()
B. cv2.imread()
C. cv2.warpAffine()
D. cv2.getAffineTransform()

2. 一幅宽度为1024像素,高度为768像素的彩色图像image.jpg,通过OpenCV读入后获取图像结构,下面代码得到的a,b,c的正确结果是()。

import cv2
img = cv2.imread('image.jpg')
a,b,c = img.shape

A. 1024, 768, 1
B. 768, 1024, 1
C. 1024, 768, 3
D. 768, 1024, 3

3. 图像img的宽度为w,高度为h,需要进行缩放,生成高度为500像素,长宽比例不变的图片,下列代码正确的是()。
A. res = cv2.resize(img, (w, 500))
B. res = cv2.resize(img, (500, w))
C. res = cv2.resize(img, (int(500H/W), 500))
D. res = cv2.resize(img, (500, int(500
W/H)))

4. 通过OpenCV读取图片至变量img后,通过OpenCV中的img.size函数,我们可以得到图像的()。
A. 色彩空间
B. 通道数目
C. 数据类型
D. 元素个数

5. OpenCV是一种开放源代码的()库。
A. 计算机视觉
B. 自然语言处理
C. 深度学习
D. 数据挖掘

6. OpenCV库常用于图像处理,现通过OpenCV读取图片至变量img,再通过函数()可以得到图像的数据类型信息。
A. img.size
B. img.shape
C. img.data
D. img.dtype

7. (多选)HSV是一种将RGB色彩空间中的点在倒圆锥体中的表示方法。HSV色彩空间的三个坐标分别为()。
A. 色相
B. 饱和度
C. 明度
D. 亮度

8. (多选)RGB颜色空间以三种基本色为基础,进行不同程度的融合,产生丰富而广泛的颜色,RGB色彩空间的三个基本原色是()。
A. 红
B. 绿
C. 黄
D. 蓝

9. OpenCV的默认图像形状为()。
A.(通道,高度,宽度)
B.(宽度,高度,通道)
C.(高度,宽度,通道)
D.(高度,通道,宽度)

10. Python的OpenCV库提供了颜色空间转换功能,具体函数名是()。
A. cvtColor()
B. convertColor()
C. setColor()
D. getColor()

11. 计算机显示器的颜色模型为()。
A. CMYK
B. HIS
C. RGB
D. YIQ

第4章 图像数据集和数据预处理 课堂互动 显示答案 | 返回首页