高中生、艺考生、留学生的好帮手-学考宝
莫等闲,白了少年头,空悲切 因学习而成长,因学习而成熟

第五单元 数据分析与人工智能 单元测试(含答案)2022-—2023学年教科版(2019)高中信息

Word文档版

学考宝(xuekaobao.com)友情提示:html格式不完整,如有需要请根据文末提示下载并进行二次校对Word文档。

第五单元 数据分析与人工智能 单元测试
一、选择题
1.数据分析是用适当的统计分析方法,对采集的大量数据进行分类、整理、统计、分析,发现有用信息以形成结论。下列软件中,通常不具备数据分析功能的是( )
A.图像处理软件 B.电子表格软件 C.在线数据分析平台 D.程序设计语言
2.数据分析广泛应用于社会的各个领域,发挥着重要作用,下列哪项不是数据分析的作用( )
A.了解事物发展的现状 B.识别事物发生的数据来源
C.剖析事物的发展历程 D.预测事物的未来走向
3.在日常考试成绩分析中,以下不属于常用的数据分析方法的是( )
A.横向对比 B.纵向对比 C.平均分析法 D.编程分析法
4.为了获得有价值的信息,需要对数据做进一步的分析,以下关于数据分析作用说法不正确的是( )
A.了解事物现状 B.剖析事物的发展历程
C.预测事物的未来走向 D.发现重复数据
5.现要了解同一家公司的商品数量与目标数量的差距情况,主要采用下列哪一种数据分析方法( )
A.对比分析法 B.平均分析法 C.结构分析法 D.构成分析法
6.matplotlib库中的pyplot子库主要用于绘制图表,其中用来绘制散点图的函数是( )
A.plot( ) B.scatter( ) C.title( ) D.bar( )
7.下列选项中不能体现数据分析作用的是( )
A.剖析事物的发展历程 B.了解事物的现状 C.预测事物的未来走向 D.对数据进行组织和管理
8.小申根据如图所示的七月份日平均风速异常情况检测可视化图形撰写数据分析报告,他对该图的分析正确的是( )
A.该月的日平均风速数据中存在异常值
B.可以进一步分析用小圆圈表示的这个数据
C.必须立即删除用小圆圈表示的这个数据
D.该月的日平均风速数据中存在缺失值
9.小张采集了运动会的报名数据录入到Excel文件,每位同学最多参加两个项目,部分界面如下图所示。他先使用Excel软件整理数据,存储为“运动会报名.xlsx”文件后,编写Python程序完成后续处理。小张编写了如下程序,实现输出跳高人数最多的3个班级的功能。
import pandas as pd
df=pd.read_excel("运动会报名.xlsx")
g=df.groupby("班级").跳高. ①
df1=pd.DataFrame({"班级":g.index,"跳高人数":g.values})
df2=df1.sort_values("跳高人数", ② )
print(df2. ③ )
划线处的代码应填( )
A.①count() ②ascending=False ③tail(3)
B.①sum() ②ascending=True ③head(3)
C.①count() ②ascending=True ③tail(3)
D.①sum() ②ascending=False ③head(3)
10.有如下Python程序段:
import pandas as pd
data={'姓名':['小明','夏丽','晶晶','李华'],'语文':[90,66,80,78],'数学':[92,86,75,80]}
dfl=pd.DataFrame(data,columns=['姓名','语文','数学'])
df2=df1[df1.语文>=80]
ans=df2['数学'].mean()
执行该程序段后,ans的值为( )
A.83 B.83.5 C.85 D.92
11.下列关于数据处理与应用的说法,正确的是( )
A.采集数据不能通过人工的方法采集
B.采集数据后均可直接对采集到的数据进行处理和分析
C.只能使用计算机程序语言编程进行数据处理
D.文本数据处理主要包括:分词、特征提取、数据分析、结果呈现等
12.数据集部分内容如图所示,小申发现其中存在着大量待处理的( )
A.缺失值 B.重复值 C.异常值
13.某中学食堂部署了一套刷脸支付系统,学生在食堂消费并通过刷脸支付后,系统可根据累积的消费数据分析每个学生的口味及最喜爱的菜品,食堂据此来改进服务。为获取上述分析结果,系统采用的关键技术是( )
A.数据挖掘 B.虚拟现实 C.智能代理 D.数据压缩
14.某学校引进了一个在线智慧教学平台,经过若干学期的线上教学实践积累了学习资源、教学互动、学情信息等大量教学数据。为了不断提高线上教学质量,在线智慧教学平台可根据当前积累的教学数据,采用( )技术来估计学生的学习效果,并生成综合的改进方案,完善线上教学方法。( )
A.数据存储与加密 B.数据索引与排序
C.数据分析与预测 D.数据共享与保护
15.下列选项中,不是数据分析作用的是(  )
A.了解事物的现状 B.方便数据的获取
C.剖析事物的发展历程 D.预测事物的未来走向
16.想要横向比较两条公交线路的客流量,分析哪一条线路更加繁忙,需要用哪种数据分析方法?
A.对比分析法 B.平均分析法 C.关联分析法 D.聚类分析法
17.下列关于数据分析报告的说法不正确的是(  )
A.数据分析报告是项目研究结果的展示
B.数据分析报告可以为决策者提供科学、严谨的决策依据
C.数据分析报告中的数据可以用文本、表格、图形等多种形式呈现
D.数据分析报告中只能体现出数据分析结果,不能展示数据分析的起因和过程
18.关于数据分析,说法正确的是(  )
A.数据分析是指用适当的统计分析方法对收集来的少量数据进行分析
B.针对调查问卷收集的数据,我们只能针对一个指标进行分析
C.一般情况下,调查平台不提供分析功能
D.针对调查问卷收集的数据,我们可以对问卷指标进行交叉分析
19.某调查机构准备做一份关于《在校学生视力情况数据分析报告》,下列说法正确的是( )
A.学生视力情况分析的目的与背景在报告中可以忽略
B.该报告中涉及的数据呈现方式必须用图表
C.该报告报告重点呈现数据分析的过程,可以没有结论
D.该报告要重点呈现数据分析过程、结论和建议
20.某同学将自己在高三和高一年级时填写的霍兰德职业倾向调查数据进行分析,发现所有采集的数据在六个维度上与之前的变化不大。该同学使用的数据分析方法是( )
A.横向对比 B.纵向对比 C.平均分析 D.词云分析
二、填空题
21.根据问题的实际,不断寻找可利用的知识,构造一条推理路线解决问题,这个过程就是 。盲目搜索是按预定的 进行搜索,而不考虑 的搜索。这种搜索一般适用于求解比较简单的问题。启发式搜索是在搜索过程中加入 等启发信息,不断 搜索方向,加速求解进程。
22.神经网络是目前人工智能领域的研究热点之一,是一种模拟 行为特征,进行并行信息处理的 。
23.BP(back propagation)神经网络是目前应用最广泛的的算法,它是一种按照 逆向传播算法训练的多层前馈神经网络。神经网络的算法由信息的 与误差的 两部分组成,它们由可修正的 互连。在正向传播过程中,输入信息从输入层经 逐层计算传向输出层,当前层神经元的状态只影响 神经元的状态。如果输出层没有得到期望的输出,则 输出层的误差变化值,然后转向 传播,通过网络将误差信号沿原来的连接通路 ,修改各层神经元的 直至达到期望目标。
24.动态热力图一般用于数据关系分析中 的可视化呈现。
25.大数据是以 大、 多、 快、 高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行 、 和 ,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
三、判断题
26.贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类算法,利用朴素贝叶斯算法可以实现新闻敏感词的屏蔽功能。贝叶斯分类属于大数据分析技术中的数据分类技术。( )
27.智能手机上利用指纹识别来鉴定人的身份从而解锁手机,这属于人工智能的一个应用。( )
28.人工智能将引发机器人控制人类、毁灭人类的问题,所以我们不能再使用人工智能,要消灭人工智能。( )
29.数据也会过时,过时了的数据没有任何价值。( )
30.欧姆定律的实验数据,利用Python工具进行分析、建模和验证,能够比较精确地发现规律,从而获得知识。( )
四、操作题
31.小明学校每期都会对学生的青年大学习数据进行统计,确保人人都参与,图 a是某期学习数据:
(1)小明发现“xm”列数据是混杂数据,他就利用Python语言编程将此列数据的姓名和班级分别提取,再存储到新的Excel文件进行数据整理,下列说法正确的是 (单选题)
A.如果表格中出现数据缺失,可以直接删除
B.通过公式统计每班学习人数属于数据整理
C.数据整理的目的是共享数据资源
D.进一步审核后可对重复的数据进行删除
(2)在 Excel 软件中统计各班学习人数,小明选择单元格 H3 输入公式,然后通过 H3 对 H4:H16 进行 自动填充,但发现计算结果有误。请输入正确的公式 。
(3)小明利用Pandas模块读取数据,统计出各班学习人数,并获取学习人数最少的10个班级,结果如图c,最后进行可视化处理,结果如图d,请在划线处补充代码:
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
df = pd.read_excel("qndxx。xlsx")  
dfl = df. #按班级列进行分组
df2=df1.学校.count(  ) #统计各班级学习人数
df2=df2.rename(columns= {"学校":"人数"})  
df3=df2.sort_values ("人数",ascending=True).head(10) print(df3) #筛选前 10 名
#绘制柱形图
plt.title("学习人数最少的 10 个班级") #设置图表标题
plt.show(  )  
32.项目:探究高一各学科相关性分析
【项目情境】
在信息化浪潮的推动下,互联网技术不断发展,云计算、移动互联网、大数据和人工智能等新兴技术崭露头角。使用数据挖掘相关技术对中学教学活动中产生的数据进行收集与处理,获取有利于教学的相关信息,也是推进智慧教育的举措之一。在教学过程中,学科考试成绩能够在一定程度反映学生的认知发展水平,某校对高一年级学生的成绩进行数据处理,分析各学科之间的关联度找出优势学科,对教学及学生选科有重要的参考价值。
【项目综述】
概述项目目的、方法和过程。根据要求,回答问题。
(1)数据分析需要使用恰当的方法和工具,对数据进行各种分析。我们可以通过 寻找数据之间的关联性或相关性,可以通过 在分类标准未知的情况下进行数据自动分类,可以根据分类准则通过 对未知数据进行预测。(选填:数据分类、关联分析、聚类分析)
(2)本项目主要通过模拟大数据采集与分析方法,采用 (选填:数据分析关联分析、聚类分类)的方法进行数据分析,试图分析高一年级学生各学科之间的关联度,找出两到三门优势学科,作为指导教学及学生选科的重要参考依据。
(3)确定需要收集的数据为历年高-年级期中期末的各学科成绩,在数据收集、发布、传播、共享时,为保护学生的隐私应采用 (选填:数据精度处理、人工干扰、匿名处理、访问控制)等技术手段。
(4)选用Python语言作为数据分析工具,需要通过调用诸如标准模块、自定义模块以及第三方扩展库的支持,从而高效的完成数据采集处理分析、可视化。数据分析步骤有①数据呈现②数据分类/关联分析/聚类分析③数据采集④分析报告⑤数据预处理,正确的顺序是 。(写出序号即可)
【项目实施】
(一)数据采集与预处理
图1为记录历年高中各科成绩的部分文件,图2为获取所有高一成绩并写入指定文件“高一考试成绩总.xlsx”的部分程序代码。图3为获取的高一考试成绩的部分数据内容。根据要求,回答问题。

图1

图2

图3
(5)观察图2,该程序用 结构嵌套 结构(选填:顺序、选择、循环)描述算法,实现从若干个xlsx文件中筛选出高一成绩并保存为数据文件,其中在Python语言中表示判断数据大小关系的运算符“==”表示 (选填:不等于、等于)。补充程序代码中缺失的语句,应在下划线处填写 。
(6)对采集的数据进行有效存储,以便对数据进行分析和使用。海量的数据几乎包含一切形式的结构化、半结构化以及非结构化的数据。网络中的音视频图片、地理位置、网络日志等数据属于 数据,如图133-3,“高一考试成绩_总.xlsx”中的数据属于 数据。(选填:结构化、非结构化)
(7)在数据分析之前,需要运用 方法(选填:特征探索关联分析、聚类分析、数据分类)对数据进行预处理,发现和处理缺失值以保证数据的完整,还需要对异常数据进行清理,分析是否有冗余数据等。观察图3,“201”属于 数据,虚线部分属于 数据(选填:缺失值、异常值、冗余值),应当删除数据所在 (选填:行、列)。
(8)观察图33-3表格的数据,在收集数据的过程中,你认为哪些数据可以不采集?为什么?
(二)数据分析与可视化
运用Python语言编程进行数据分析与可视化表达,分析部分结果如图4、5。根据要求,回答问题。

图4

图5
(9)观察图4,该校学生地理、物理、生物同时优秀的概率最 ,政治、物理、化学同时优秀的概率较低。
(10)为便于理解数据之间的关系,使用数据可视化工具可以图表形式直观呈现。如折线图可以表示关于 的分析、散点图可以表示关于 的分析、数据地图可以表示关于 的分析(选填;逻辑关系空间关系、趋势)。如图5所示选用 图将数据分析可视化呈现。
(11)下列关于数据可视化的描述中,正确的是 (多选)
A.可视化也可以将数据以地图动画等形式表示
B.可视化可以有效提升数据分析的效率
C.可视化可以让人们快速抓住要点信息
D.可视化可以帮助人们发现数据背后的价值
(三)分析报告
在数据分析中,使用数据可视化工具可以直观的呈现数据之间的关系,寻找数据之间的内在规律,最终实现数据的应用。
(12)观察图5,说说你从图中发现了什么?挖掘出哪些信息 ?
(13)结合自己的学习和生活,谈一谈数据的重要性。(100字左右)
参考答案
1.A
2.B
3.D
4.D
5.A
6.B
7.D
8.AB
9.D
10.B
11.D
12.A
13.A
14.C
15.B
16.A
17.D
18.D
19.D
20.B
21.搜索 控制策略 问题本身特性 估价函数 自动调整
22.动物神经网络 算法模型
23.误差 正向传递 反向传播 权值 隐藏层 下一层 计算 反向 反传回来 权值
24.空间关系
25.容量 类型 存取速度 应用价值 采集 存储 关联分析
26.正确
27.正确
28.×
29.×
30.√
31. D =COUNTIF(C$3:C$1512,G3)或=COUNTIF($C$3:$C$1512,G3) groupby ("班级",as_index=False) plt.bar(df3.班级,df3.人数)
32.关联分析 聚类分析 数据分类 关联分析 匿名处理 ③⑤②①④ 循环 选择或分支 等于 ”高一” 非结构化 结构化 特征探索 异常值 缺失值 行 姓名和班级数据可以不采集,原因是这两列数据不影响数据分析结果,而且涉及个人隐私。 高 趋势 逻辑关系 空间关系 柱形(状) ABCD 由图5可知,后三项均包含物理科目,所在的组合优秀率均比较高,可挖掘出该班学生物理科目均比较优秀。 略

图片资源预览

第五单元 数据分析与人工智能 单元测试(含答案)2022-—2023学年教科版(2019)高中信息

第五单元 数据分析与人工智能 单元测试(含答案)2022-—2023学年教科版(2019)高中信息

第五单元 数据分析与人工智能 单元测试(含答案)2022-—2023学年教科版(2019)高中信息

第五单元 数据分析与人工智能 单元测试(含答案)2022-—2023学年教科版(2019)高中信息

第五单元 数据分析与人工智能 单元测试(含答案)2022-—2023学年教科版(2019)高中信息

第五单元 数据分析与人工智能 单元测试(含答案)2022-—2023学年教科版(2019)高中信息

下载Word文档到电脑,方便收藏和打印~

资源下载相关推荐

1.感受我们的呼吸 教学设计(表格式)-2024-2025学年科学四年级上册教科版

教学课题 《感受我们的呼吸》课型 新授 授课时间教学目标 学生能够准确描述呼吸的过程是气体交换的过程,理解氧气对生命的重要意义。 认识参与呼吸的主要器官,包括鼻腔、口腔、气管、肺等,并了解它们在呼吸过程中的作用。 学会通过体验活动和模拟实验,感受呼吸时身体各部分的变化,掌握正确的呼吸方法。 能够
1.感受我们的呼吸 教学设计(表格式)-2024-2025学年科学四年级上册教科版
2024年09月16日

专题01 数据与信息-2024-2025学年高中信息技术一轮复习(浙教版)

专题01 数据与信息【学习目标】理解数据与信息的概念及其发展历史:学生应能够描述数据和信息的区别,并了解从远古时代到现代,人类如何使用不同的工具和方法来记录、存储和处理数据。这包括对石器刻画图案、结绳记事法、文字与数字的出现、造纸术与印刷术的发明等关键历史节点的了解。掌握数据采集和数字化的基本
专题01 数据与信息-2024-2025学年高中信息技术一轮复习(浙教版)
2024年09月16日

山东省临沂市罗庄区2023-2024学年六年级上学期期末英语试题(图片版,含答案,含听力原文,无音频)

2023一2024学年度上学期期末学业水平调研试题六年级英语(分值:100颗☆书写:A/B/C/D时间:40分钟)题号三四五六七九十书写等级折得☆听力部分(30☆)P一、听录音,选择恰当的答语。(10☆)()1.A.He likes going hiking.
山东省临沂市罗庄区2023-2024学年六年级上学期期末英语试题(图片版,含答案,含听力原文,无音频)
2024年09月16日

人教版数学七年级上册 2.2 有理数的乘法与除法 同步练习(无答案)

人教版数学七年级上册 2.2 有理数的乘法与除法一、单选题1.计算,正确的结果是( )A.6 B. C.5 D.2.有理数的倒数是( )A. B. C.或 D.3.下列运算正确的是( )A. B. C. D.4.下面乘积结果符号为正的是(  )A. B.C. D
人教版数学七年级上册 2.2 有理数的乘法与除法 同步练习(无答案)
2024年09月16日

2023-2024学年甘肃省武威市凉州区和平镇教研联片六年级(上)期末数学模拟试卷(二)(含答案)

2023-2024学年甘肃省武威市凉州区和平镇教研联片六年级(上)期末数学模拟试卷(二)一、填空题(每空1分,共23分)1.(4分)   ÷40=40:   ==   %=0.625。2.(1分)一个三角形的一个内角的度数是60°,另两个内角的度数的比是1:2,这个
2023-2024学年甘肃省武威市凉州区和平镇教研联片六年级(上)期末数学模拟试卷(二)(含答案)
2024年09月16日

统编版二年级语文上学期期末测试题 含答案

统编版二年级语文上学期期末测试题 (二)含答案我会选,我会连。(22分)给加点字选择正确的读音,打“√”。(3分)休息的时候他总是吃葡萄干【gān gàn】,干【gān gàn】活时他总是很卖力。那个门前新开的店铺【pū pù】门前铺【pū pù】着大红地毯。爱好【hǎo hào】读
统编版二年级语文上学期期末测试题 含答案
2024年09月16日

2024冀人版五年级上册科学期末综合测试卷(含答案)

冀人版五年级上册科学期末综合测试卷(热传递)时间:45分钟 满分100分题号 一 二 三 四 五 六 总分得分一、填空题。(每空1分共23分1.空气是由 气体混合而成的,其中氧气大约占空气体积的 。2.燃烧是生活中一种常见的 。物
2024冀人版五年级上册科学期末综合测试卷(含答案)
2024年09月15日

4.观察洋葱表皮细胞 教学设计-(表格式)2024-2025学年科学六年级上册教科版

教学内容 《观察洋葱表皮细胞》教学设计 课时教学目标 学生能够准确描述洋葱表皮细胞的结构特点,包括细胞壁、细胞膜、细胞质、细胞核、液泡等部分。 掌握制作洋葱表皮玻片标本的方法和步骤,能够独立制作出合格的玻片标本。 学会正确使用显微镜观察洋葱表皮细胞,能够用图画和文字准确记录观察到的细胞结构。 了
4.观察洋葱表皮细胞 教学设计-(表格式)2024-2025学年科学六年级上册教科版
2024年09月15日
没有更多了?去看看其它内容

热门文章

  • 关于旅行英语作文汇编十篇
    关于旅行英语作文汇编十篇在日常学习、工作抑或是生活中,许多人都有过写作文的经历,对作文都不陌生吧,作文是人们以书面形式表情达意的言语活动。还是对作文一筹莫展吗?以下是小
  • 2025年云南各大学寒假放假时间 几月几号开始放寒假
    2025年云南部分大学寒假放假时间已经发布,其中昆明理工大学寒假开始放假时间是2025年1月13日,结束时间是2月21日;昆明医科大学学生寒假开始放假时间是2025年1月13日,结束时间是2月20日。具体内容大家关注学校发布的通知。
  • 入村原文、翻译和赏析
    出郭方知雾,登舟始辨风。水生虾眼赤,霞过雁翎红。浣渚喧游女,芦洲息钓翁。人家苍翠里,鲜艳一枝枫。
  • 少年游(别韩叔夏)原文、翻译和赏析
    去年同醉,酴醿花下,健笔赋新词。今年君去,酴醿欲破,谁与醉为期。旧曲重歌倾别酒,风露泣花枝。章水能长湘水远,流不尽、两相思。
  • 驻马店幼儿师范高等专科学校简介 驻马店幼儿师范高等专科学校师资及专业
    双学网为大家提供驻马店幼儿师范高等专科学校简介、驻马店幼儿师范高等专科学校师资、驻马店幼儿师范高等专科学校开设专业等信息,欢迎大家参考了解。
  • 广东省揭阳市惠来县2023-2024学年九年级上学期期中化学试题(含答案)
    2023-2024学年度第一学期期中质量监测九年级化学说明:1.全卷共6页,满分100分,考试用时60分钟。2.答题前,考生务必用黑色字迹的钢笔或签字笔将自己的学校、班级、姓名、考生号、考场号、考场座号,填写在答题卡相应位置上,并用2B铅笔在答题卡“考场号”、“考场座号”栏涂上自己的考场号和考
  • 2024文科男生有哪些专业就业前景好 什么专业吃香
    2024文科男生前景好的专业有:投资学专业、汉语言文学专业、经济统计专业、会计专业、金融专业、软件工程专业、资产评估专业、数字媒体专业、法学专业等。具体内容跟小编一起来看看吧。
  • 2024年安徽双一流大学名单 有哪些院校
    2024年安徽双一流大学有中国科学技术大学、合肥工业大学、安徽大学三所院校,双一流大学拥有非常强大的教学资源,可以更容易地获得来自国家、教育部、省市政府等多方面的资金支持,从而提供更好的教学条件。
  • 在复合句中名词与代词谁先谁后
    有人认为在主从复合句中,名词总是用于主句中,相应的代词总是用于从句中(即使从句位于主句之前,也往往如此)。如: After she got married, Mary changed completely. 玛丽结婚以后完全变了。 When
  • 太原出国留学需要哪些条件?
    出国留学是许多人实现梦想、追求学业和职业发展的重要途径,但同时也需要面对各种挑战和考验。太原出国留学需要哪些条件?这是许多人比较关心的问题,下面小编就来为大家解答一下,感兴趣的可以一起来看看。

精选推荐
外语

  • 资源下载
  • 留学