第四章 数据处理与应用 测试卷(含答案)2023—2024学年浙教版(2019)高中信息技术必修1
2023-11-16 12:58:27 学考宝 作者:佚名
Word文档版
学考宝(xuekaobao.com)友情提示:html格式不完整,如有需要请根据文末提示下载并进行二次校对Word文档。
第四章 数据处理与应用 测试卷
一、选择题
1.在WPS表格中,下图所示的数据处理过程通常称为( )
A.查找 B.排序 C.筛选 D.分类汇总
2.“二维码编码及应用”情境问题,请结合生活实际,信息技术知识和下图完成此题。
小强同学周末回到家,都要向班主任老师发送周末期间的健康码和行程码等信息,健康码分别有以下三种颜色显示。身处大数据时代,下列没有涉及到大数据应用的是( )
A.个人通信行程卡 B.通过手机购买高铁票
C.从手机中拷贝视频文件到电脑 D.高速路出入口用ETC系统进行自动收费
3.下列选项中,不属于大数据应用的是( )
A.电商网站搜集客户的社交数据 B.图书管理员手工整理图书
C.新零售线上线下购物体验 D.智慧导航随时呈现各条道路通畅情况
4.数据可视化可以帮助人们快速获取想要的信息,以下图表更能表示每部分所占比例的是( )
A.柱形图 B.折线图 C.饼图 D.条形图
5.为了解贵州省某地区11月的气温变化情况,最恰当的图表是( )
A.词云图 B.折线图 C.饼图 D.热力图
6.在WPS表格中,计算单元格中数据平均值的函数是( )
A.AVERAGE B.SUM C.COUNT D.MAX
7.在WPS表格中,利用IF函数可以实现判断赋值的数据处理工作。下图中,如果在C3单元格中输入公式“=IF(B3>=92,“一级”,(IF(B3>=80,“二级”,(IF (B3>=60,“三级”,“未入级”))))”,回车确定后C3单元格中显示的值是( )
A.一级 B.二级 C.三级 D.未入级
8.求单元格B3-B7的平均值,选用的公式( )
A.SUM(B3:B7) B.AVERAGE(B3:B7) C.SIN(B3:B7) D.RANK(B3:B7)
9.词云图是一种数据可视化的表达方式,下列关于词云图的说法错误的是( )
A.词云图是目前常见的关键词数据可视化表达的一种方式
B.可以通过词云图快速获取文本数据中所蕴含的关键信息
C.可以通过词云图直观呈现《红楼梦》书中关键词的出现频次
D.词云图只能通过字体的大小表示关键词的重要程度
10.某品牌牛奶企业实现大数据管理,比如利用数据分析如何配比黄金比例的饲料,帮助奶牛达到最大产奶量,下列选项中关于大数据描述正确的是( )
A.大数据管理平台提供数据采集,数据计算,数据存储,数据分析,数据可视化等大量开放能力
B.大数据管理平台只进行数据监察,不配备自动预警提示
C.大数据管理平台不需要容纳海量的数据
D.尽管大数据管理平台中已有数据分析功能,但是还需要考虑专家的建议
11.下列关于大数据基本特征的描述正确的是( )
A.浙江省学籍管理平台中,所有的学生身份信息数据属于大数据
B.大数据辅助商家更精准的广告投放,说明大数据的价值密度很高
C.气象卫星收集的数据太多了,导致进行大数据处理时,无法及时满足天气预报的需求
D.大数据的数据类型比较丰富,普遍存在各种结构化、半结构化和非结构化数据共存的现象
12.下列选项中,不属于大数据为人们日常生活带来便利的是( )
A.移动支付 B.网络约车出行 C.网络购物 D.论文编辑
13.下列选项中,属于大数据应用的是( )
①基于个人信息、行为、位置等数据而进行的个性化推荐、广告 ②流感、登革热等流行病预测应用平台可以提前一周发现疫情暴发状况 ③公交信息查询软件实时反馈公交车辆的运行信息,提升乘客的出行效率 ④景区获取游客来源,分析游客密度、景点的人流趋势等为智能化管理提供参考
A.①②③ B.②③④ C.①②④ D.①②③④
14.下列关于大数据的说法,正确的是( )
A.大数据使人们注重事物的相关性
B.大数据的数据量庞大,价值密度高
C.大数据的应用降低了用户隐私信息泄露的风险
D.对大数据进行分析时,即可分析全体数据,也可分析抽样数据
15.按照处理数据类型的不同,采取的可视化数据分析类型也不同,下面说法正确的是( )
A.饼图最适合描述数据之间的大小
B.柱形图适用于比较数据大小
C.条形图最适合描述数据之间的变化趋势
D.折线图适用于描述数据的比例
16.下列关于文本数据处理描述不正确的是( )
A.文本数据处理主要应用在搜索引擎、情报分析、自动摘要、自动校对、自动应答等方面
B.基于词典的分词方法、基于统计的分词方法和基于规则的分词方法是常用的中文分词算法,其中基于规则的统计方法在实际应用中较多
C.标签云用词频表现文本特征,将关键词按照一定的顺序和规律排列,并以文字大小的形式代表词语的重要性
D.典型的中文文本处理过程主要包括:分词、特征提取、数据分析、结果呈现等
17.ChatGPT是一款聊天机器人程序。ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。它使用了Transformer神经网络架构,这是一种用于处理序列数据的模型,它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT上知天文下知地理,还能具备根据聊天的上下文进行互动的能力,实现与真正人类几乎无异的聊天场景。下列关于大数据的说法,正确的是( )
A.利用大量的语料库训练模型需要大数据的支持
B.ChatGPT的语料库因数据体量大,只能抽样处理
C.语料数据中蕴含着巨大的价值,其价值密度高
D.Hadoop 适用于实时数据的流计算
18.下列关于大数据与大数据处理的说法,不正确的是( )
A.处理大数据时,一般采用分治思想
B.大数据的处理对象是全体数据,而不是抽样数据
C.大数据的特点是数据量大、速度快、数据类型多、价值密度低
D.Hadoop是一个可运行于大规模计算机集群上的分布式系统基础架构,适用于处理实时数据
19.气象部门想绘制某地区近十年来降雨量随时间逐年变化的图表,以推测未来若干年降雨量的变化趋势,下列最适合选用的图表类型是( )
A.柱形图 B.饼图 C.散点图 D.折线图
20.以下( )不属于大数据应用带来的行业变化的
A.电子商务平台精准推送相关产品信息
B.预测节假日旅游人流分布及趋势
C.企业提供的服务和产品将会更加符合用户需求
D.汽车限行缓解了交通压力
二、填空题
21.吴老师在撰写基础会考模拟考试成绩分析报告,其中包含了文字、表格和图表等内容。
(1)他使用Excel电子表格统计学生成绩,按照总分从高到低的顺序对全部学生进行排列,应该选择图一中的什么操作 ?
(2)他的电脑里安装了“记事本”、“写字板”、“Word”、“WPS”等文本处理软件。要完成这样的成绩分析报告,应该选择什么软件 ?
(3)吴老师的电子邮箱地址的用户名为xiaoli,使用qq邮箱服务,学校的电子邮箱地址的用户名为bsdwnfz,使用126邮箱服务。吴老师给学校发送电子邮件,他应该填写的收信人地址是 。
22.Excel工作表中函数=SQRT(49)的返回值是 。
23.Excel中在单元格内要换行,可以按 快捷键。
24.在Excel中,若单元格引用随公式所在单元格位置的变化而改变,则称之为________。
A.相对引用 B.绝对地址引用 C.混合引用 D.3-D引用
25.在Excel工作表中,B4:E6单元区域包含的单元格个数为( )。
三、判断题
26.2020年年初一场突如其来的新冠疫情袭击全球,我国为确保人民群众生命健康安全,迅速开启了高科技防疫模式:利用大数据快速进行流调、普及非接触式体温检测、启用楼院刷脸|门禁系统、推出场所码准确掌握进出人员信息、开通移动终端健康码行程码实时查验、 建立常态化核酸检测机制等....这些措施为有效防疫和保障经济发展发挥了至关重要的作用。请结合题目叙述回答下列问题:
在政府主导下,利用大数据技术,打破原有的行业数据垄断,通过对跨行业跨区域巨量数据的综合分析,为综合防控和政府快速决策提供了有力支撑。
27.数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征。( )
28.只在单元格B5中输入“你好”,选中B5并执行“插入”菜单下的“行”命 令,则此时“你好”所在的单元格是B6 ( )
29.大数据技术中不包括大数据预处理技术。( )
30.字节跳动公司的抖音APP利用强大的算法对用户观看内容的大数据进行分析,为用户提供适合用户要求的内容。其算法对数据处理的过程属于数据分类。( )
四、操作题
31.某校高一选课数据存储在“xk.xlsx”中,并对数据进行处理,如图a所示。
图a
(1)如图a所示,已正确计算了单元格D734中的数据,若希望使用自动填充功能完成区域E734:J734的计算。则单元格D734中的公式应修改为 。
(2)下列说法正确的是 (多选,填字母)。
A.分析表格数据时,如遇异常数据,可以直接删除或忽略
B.为了检验选课的正确性,在K列利用公式计算选课结果,其值不为3即为选课有误
C.为了更直观地呈现单科占比,可以选用散点图
D.可以利用筛选功能,获取选择“物化生”组合的学生数据
(3)小明用Python程序按班级分类统计了各学科选修人数,并以技术学科为例自动生成如图b所示的图表,请在①②处填入合适的代码。
图b
import pandas as pd
import matplotlib.pyplot as plt
df=pd. ① ("xk.xlsx")
df2=df.groupby("班级",as_index=False).sum()
plt.figure(figsize=(8,4))
②
plt.title("选考科目人数")
plt.xlabel("班级")
plt.ylabel("技术")
plt.show()
①处代码应为 。
②处代码应为 (单选,填字母)。
A.plt.bar(df2.班级,df2.技术) B.plt.bar(df2.index,df2.技术)
C.plt.plot(df2.columns[0:],df2.技术) D.plt.plot(df2.班级,df2.技术)
32.我校 2019 级学生高三二模部分成绩如图 a 所示,利用该数据展开了数据的统计分析和可视化呈现。
图 a
请回答下列问题:
(1)如图所示,M3:M21 单元格的数据由 M2 单元格自动填充而得,现已知 M2 单元格数据为各科总
分,则 M2 单元格的公式为 。
(2)总分前 10 名的图表如图 b 所示,该图表类型为 。
图 b
(3)算法思路:先按“总分”降序排序,然后利用“姓名”和“总分”前 10 名制作图表,实现的代码如下。
import pandas as pd
import matplotlib.pyplot as plt
font={'family':'MicroSoft YaHei'} # 显 示 中 文
plt.rc('font',** font)
df=pd.read_excel("2022WZ2M.xlsx")
df_sort=df.sort_values("总分", )
#取总分前 10 名制作图表
x=df_sort['姓名'].head(10)
y=
plt.bar(x,y,color='b')
plt.grid(alpha=0.5) # 添 加 网 格plt.title("2022 年温州二模总分前 10 名") #添加标题plt.show()
请在程序划线处填上合适的代码。
(4)制作每门学科的平均分,并按技术成绩降序排序,并将结果保存在文件“2022WZ2M_TJ.xlsx” 中,分析结果如图 c 所示。
图 c
实现代码如下,请在划线处填上合适的代码。
xk_avg=df. ("班级") #按班级分组
xkavg_mean= #计算各科班级平均分
xkavg_mean.to_excel("2022WZ2M_TJ.xlsx",index=True,header=True) #保存结果文件
参考答案
1.D
2.C
3.B
4.C
5.B
6.A
7.B
8.B
9.D
10.A
11.D
12.D
13.D
14.A
15.B
16.B
17.A
18.D
19.D
20.D
21.排序 WPS bsdwnfz@
22.7
23.Alt+Enter
24.A
25.12
26.正确
27.正确
28.正确
29.错误
30.错误
31.=D733/SUM($D733:$J733) 或 =D733/SUM($D$733:$J$733) BD read_excel A
32.=SUM(C2:L2) 柱形图 或 垂直柱形图 ascending= False df_sort['总分'].head(10)或 df_sort.总分.head或 df_sort['总分'][:10] 或 df_sort.总分[:10] 或其它等价答案 groupby xk_avg.mean()