第一章 认识数据与大数据 检测练习(含答案)-2023—2024学年人教中图版(2019)高中信息技术必修1
2023-11-28 18:34:56 学考宝 作者:佚名
Word文档版
学考宝(xuekaobao.com)友情提示:html格式不完整,如有需要请根据文末提示下载并进行二次校对Word文档。
第一章 认识数据与大数据 检测练习
一、选择题
1.下列关于信息编码的描述,正确的是( )
A.用手机扫二维码支付是信息编码的过程
B.只有数字化的数据才能被保存和处理
C.已知大写字母“I”的ASCII值是49H,则大写字母“J”的ASCII值是50H
D.n进制表达式(6)n+(1)n的计算结果为两位n进制数,则n一定为7
2.下列关于大数据和数据安全的说法,不正确的是( )
A.大数据可以处理非结构化的数据
B.可以通过数据校验来提高数据的保密性
C.利用大数据进行数据处理时,个别数据不准确不影响分析结果
D.大数据的应用和发展可以帮助人们更好地利用数据,但同时也增加了数据泄露风险
3.下列关于数据和信息的说法,正确的是( )
A.经加工处理后的假消息价值较低
B.被删除到计算机中回收站的数据中没有信息存在
C.残缺的竹简无法还原历史文献,说明了载体依附性
D.大数据中数据结构很多,因此要求每个数据保证准确
4.语音识别技术,目标是将人类的语音中的词汇内容转换为计算机可读的输入。语音识别的流程包括信号处理(模数转换等)、信号表征(特征提取等)、模式识别。其中特征提取、模式匹配和模型训练都离不开大量训练数据的积累和匹配, 随着大数据时代的来临,带来了大量文本或语音方面的语料数据。语音识别技术还引入深度神经网络技术,更逼近人脑的思维能力,同时借助于大数据,极大地提升了语音识别准确率。下列关于数据和大数据的说法不正确的是( )
A.识别的语音为模拟信号
B.语音识别结果在计算机内一般是以十六进制数存储
C.大部分文本或语音方面的语料资源数据属于非结构化数据
D.大数据价值密度低,需要对其“提纯”才能获得用于训练的语料数据
5.下列关于大数据的说法,不正确的是( )
A.处理大数据时,一般采用分治思想
B.社交网络数据可采用图计算进行处理
C.速度快是大数据的特征之一,仅指数据的产生速度快
D.价值密度的高低与数据总量的大小成反比
6.下列关于信息的说法,不正确的是( )
A.计算机只能处理数字化后的信息 B.虚假广告的出现,说明信息具有真伪性
C.数据灾备系统可以提高信息的安全性 D.通过计算机获取的信息都是真实可信的
7.将十六进制数225 转换成二进制数是( )
A.1000100101B B.100100110B C.11100001B D.100100111B
8.将声音数字化的过程需要对声音进行采样,一般采用三个参数来衡量,其中不包括( )
A.采样频率 B.色彩位数 C.声道数 D.量化位数
9.数据压缩是我们常用的文件存储方式,关于数据压缩,下列说法正确的是( )
A.WAV格式音频压缩为MP3格式,是无损压缩
B.MPEG是常用的图片压缩格式
C.因为有损压缩会产生失真,所以都使用无损压缩
D.压缩比是衡量压缩技术的一个指标
10.将二进制的数字“1000”转化十进制应该是( )
A.4 B.6 C.8 D.10
11.我们在选择数据采集方法时,既可以选择传感器采集数据,也可以使用网络获取数据。对于生活中获取到的各种各样的数据或信息,我们会将其进行数字化,从而更好的帮助我们去进行数据分析,而“数字化”的过程就是将生活中的“模拟量”转换成“数字量”,在下列设备中,( )能够将“模拟量”转换成“数字量”。
①打印机 ②数码摄像机 ③扫描仪 ④绘图仪 ⑤录音笔
A.①②③ B.②③⑤ C.②④⑤ D.②③④
12.若对视频数据进行压缩,通常是为了( )
A.声音更动听 B.存储容量更小 C.色彩更丰富 D.图像更清晰
13.下列关于模拟信号数字化过程的说法不正确的是( )
A.数字化过程一般需要经过采样、量化与编码
B.数据在计算机中以二进制方式存储
C.将模拟信号转换成数字信号,会引起失真
D.量化值的范围是0~256,则量化位数最少是8位
14.下列数据中,属于合法二进制数的是( )
A.1011 B.202 C.12B D.ACE
15.手机中的短视频应用,能够根据用户的浏览喜好,自动推荐相关视频,这主要体现了数据的( )特征。
A.数据变化速度快 B.数据体量巨大
C.数据类型多 D.价值密度低
16.将6个灯泡排成一行,用 和表示灯亮和灯不亮,下图是这一行灯的五种情况,分别表示五个数字:1,2,3,4,5,那么表示的数是( )
A.22 B.89 C.105 D.113
17.下列关于大数据的说法,不正确的是( )
A.大数据处理数据一般采用分治思想
B.文本数据处理是大数据处理的重要分支之一
C.大数据技术可以处理非结构化数据
D.大数据处理的数据整体价值密度高
18.下列有关大数据处理的说法,不正确的是( )
A.处理大数据一般采用分治思想
B.Hadoop架构适用于处理实时数据
C.对历史数据一般采用批处理方式
D.对社交网络、网购行为等数据一般采用图计算方式
19.下列不属于大数据4V特征的是( )
A.真实性 B.数据量 C.处理速度 D.多样性
20.如图所示的是一张可回收物图片及其属性信息。若对此图片文件进行压缩,以下选项正确的是( )
A.将此文件拓展名改为tif属于有损压缩
B.将此文件用WinRAR软件进行压缩属于无损压缩
C.将此文件重命名为玻璃瓶.zip属于有损压缩
D.将此文件另存为jpg格式属于无损压缩
二、填空题
21.进制转换:11011011B=① D=② H
22.一位八进制数可转换为 位二进制数。
23.二进制数1011101100.011对应的十六进制数为 。
24.两位同学传递一个9*9格的十字绣图案,并约定走线的格子“■”记为1,不走线的格子“□”记为0。1与0的个数用二进制数表示。换行用“00”表示。例如,“111”即表示连续的3个“■”“011”即表示连续的3个“□”。编码顺序按照从左到右,自上而下的规律进行逐行编写。右侧图案前三行编码为:01001 00 011 111 011 00 00。
25.在微型计算机系统中,一个英文字符占1个字节,一个汉字占 字节
三、判断题
26.“人体正常体温平均在36~37℃之间”,此处的“37℃”是知识。( )
27.多媒体计算机能够处理文字、声音、图像等信息。主要是因为这些信息都已被网络化。( )
28.1个字节可以存放2个0~255之间的整数。( )
29.分别使用44.1kHz和22.05kHz的采样频率对同一段声音进行数据编码,前者的声音保真度更高。( )
30.大数据价值密度低,不会造成个人隐私的泄露。( )
四、操作题
31.哈夫曼编码:哈夫曼编码(Huffman Coding),又称霍夫曼编码,是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,也称霍夫曼(Huffman)编码。
霍夫曼编码的基本方法是先对数据(如:文章)扫描一遍,计算出各数据元素(文字)出现的概率,按概率的大小指定不同长度的唯一码字,由此得到的一张霍夫曼码表。
如:某文章只包含了“我”、“爱”、“中”、“国“四个字,它们出现的概念分别为0.125、0.125、0.2、0.3,那么它们的编码可以分别设为1000、1001、101和11。
问题:
(1)计算机科学中,数据编码是将数据转换为几进制数?
(2)如果不采用哈夫曼编码,你知道还有哪些汉字编码系统?
(3)你能把四个汉字的哈夫曼码转换为十进制数吗?
32.编写VB程序,实现如下功能:在文本框Text1中输入二进制数,单击“转换”命令按钮Command1,在文本框Text2中输出对应的十六进制数。程序运行界面如图所示,请回答下列问题:
(1)如果输入的二进制数为“1101010”,则得到的结果为 。
(2)实现上述功能的 VB 程序如下,请在划线处填入合适代码。
Private Function bw(x As Integer, y As String) As String
'函数bw功能:若二进制位数不足,通过在前面添"0"使得位数为4的倍数
Dim r As Integer, i As Integer
r = x Mod 4
If r <> 0 Then
For i = 1 To 4 - r
y = "0" + y
Next i
x = Len(y)
End If
bw =
End Function
Private Sub Command1_Click()
Dim m As String, n As Integer, i As Integer, a As Integer
Dim s As Integer, s1 As String, j As Integer
m = Text1.Text
n = Len(m)
Text2.Text = ""
m = '调整m的位数为4的倍数
For i = 1 To n - 3 Step 4
s = 0
For j = i To i + 3
a = Val(Mid(m, j, 1))
s =
Next j
If s >= 10 Then
s1 = Chr(Asc("A") + s - 10)
Else
s1 = CStr(s) '函数CStr类似于Str,但无前导空格
End If
Text2.Text = Text2.Text + s1
Next i
End Sub
参考答案
1.D
2.B
3.C
4.B
5.C
6.D
7.A
8.B
9.D
10.C
11.B
12.B
13.D
14.A
15.A
16.A
17.D
18.B
19.A
20.B
21.219 DB
22.3
23.2EC.6
24.010 101 011 101 010或010 11 011 11 010
25.2
26.错误
27.错误
28.错误
29.正确
30.错误
31.(1)二进制
(2)GB2312 GBK1.0
(3)(1000)2=8 (1001)2=9 (101)=5 (11)=3
32.6A y bw(n,m) s*2+a