大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。下面是大数据学试题及答案,请参考!
大数据学试题及答案
1、 当前大数据技术的基础是由( C)首先提出的。 (单选题,本题2分)
A:微软 B:百度 C:谷歌 D:阿里巴巴
2、 大数据的起源是(C )。 (单选题,本题2分)
A:金融 B:电信 C:互联网 D:公共管理
3、 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C)。 (单选题,本题2分)
A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师
4、 (D )反映数据的精细化程度,越细化的数据,价值越高。 (单选题,本题2分)
A:规模 B:活性 C:关联度 D:颗粒度
5、 数据清洗的方法不包括( D)。 (单选题,本题2分)
A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理
6、 智能健康手环的应用开发,体现了( D)的数据采集技术的应用。 (单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器
7、 下列关于数据重组的说法中,错误的是( A)。 (单选题,本题2分)
A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒
C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新
8、 智慧城市的构建,不包含( C)。 (单选题,本题2分)
A:数字城市 B:物联网 C:联网监控 D:云计算
9、 大数据的最显著特征是( A)。 (单选题,本题2分)
A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高
10、 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B )。 (单选题,本题2分)
A:在数据基础上倾向于全体数据而不是抽样数据
B:在分析方法上更注重相关分析而不是因果分析
C:在分析效果上更追究效率而不是绝对精确
D:在数据规模上强调相对数据而不是绝对数据
11、 下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。 (单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高
12、 当前社会中,最为突出的大数据环境是(A )。 (单选题,本题2分)
A:互联网 B:物联网 C:综合国力 D:自然资源
13、 在数据生命周期管理实践中,( B)是执行方法。 (单选题,本题2分)
A:数据存储和备份规范 B:数据管理和维护
C:数据价值发觉和利用 D:数据应用开发和管理
14、 下列关于网络用户行为的说法中,错误的是( C)。 (单选题,本题2分)
A:网络公司能够捕捉到用户在其网站上的所有行为
B:用户离散的交互痕迹能够为企业提升服务质量提供参考
C:数字轨迹用完即自动删除
D:用户的隐私安全很难得以规范保护
15、 下列关于计算机存储容量单位的说法中,错误的是( C)。 (单选题,本题2分) A:1KB<1MB<1GB B:基本单位是字节(Byte)
C:一个汉字需要一个字节的存储空间 D:一个字节能够容纳一个英文字符,
16、 下列关于聚类挖掘技术的说法中,错误的是(B )。 (单选题,本题2分)
A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B:要求同类数据的内容相似度尽可能小
C:要求不同类数据的内容相似度尽可能小
D:与分类挖掘技术相似的是,都是要对数据进行分类处理
17、 下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是( D)。 (单选题,本题2分)
A:美国 B:日本 C:中国 D:韩国
18、 下列关于大数据的分析理念的说法中,错误的是(D )。 (单选题,本题2分)
A:在数据基础上倾向于全体数据而不是抽样数据
B:在分析方法上更注重相关分析而不是因果分析
C:在分析效果上更追究效率而不是绝对精确
D:在数据规模上强调相对数据而不是绝对数据
19、 万维网之父是( C)。 (单选题,本题2分)
A:彼得德鲁克 B:舍恩伯格 C:蒂姆伯纳斯-李 D:斯科特布朗
20、 Mac OS系统的开发者是(C )。 (单选题,本题2分)
A:微软公司 B:惠普公司 C:苹果公司 D:IBM公司
21、 大数据时代,数据使用的关键是( D)。 (单选题,本题2分)
A:数据收集 B:数据存储 C:数据分析 D:数据再利用
22、 下列关于数据交易市场的说法中,错误的是( C)。 (单选题,本题2分)
A:数据交易市场是大数据产业发展到一定程度的产物
B:商业化的数据交易活动催生了多方参与的第三方数据交易市场
C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助
D:数据交易市场是大数据资源化的必然产物
23、 下列论据中,能够支撑“大数据无所不能”的观点的是( A)。 (单选题,本题2分) A:互联网金融打破了传统的观念和行为 B:大数据存在泡沫
C:大数据具有非常高的成本 D:个人隐私泄露与信息安全担忧
24、 数据仓库的最终目的是(D )。 (单选题,本题2分)
A:收集业务需求 B:建立数据仓库逻辑模型
C:开发数据仓库的应用分析 D:为用户和业务部门提供决策支持
25、 支撑大数据业务的基础是( B)。 (单选题,本题2分)
A:数据科学 B:数据应用 C:数据硬件 D:数据人才
26、 在网络爬虫的爬行策略中,应用最为基础的是(AB )。 (多选题,本题3分)
A:深度优先遍历策略 B:广度优先遍历策略
C:高度优先遍历策略 D:反向链接策略 E:大站优先策略
27、 当前,大数据产业发展的特点是(ACE )。 (多选题,本题3分)
A:规模较大 B:规模较小 C:增速很快 D:增速缓慢 E:多产业交叉融合
28、 下列关于数据生命周期管理的核心认识中,正确的是(ABC )。 (多选题,本题3分) A:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段
B:在不同的数据存在阶段,数据的价值是不同的
C:根据数据价值的不同应该对数据采取不同的管理策略
D:数据生命周期管理旨在产生效益的同时,降低生产成本
E:数据生命周期管理最终关注的是社会效益
29、 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( AB)。答案选C更正选题,本题3
分)
A:传统营销模式比基于大数据的营销模式投入更小
B:传统营销模式比基于大数据的营销模式针对性更强
C:传统营销模式比基于大数据的营销模式转化率低
D:基于大数据的营销模式比传统营销模式实时性更强
E:基于大数据的营销模式比传统营销模式精准性更强
(多
30、 下列关于脏数据的说法中,正确的是( ABCDE)。 (多选题,本题3分)
A:格式不规范 B:编码不统一 C:意义不明确 D:与实际业务关系不大 E:数据不完整
31、 数据再利用的意义在于( ABC)。 (多选题,本题3分)
A:挖掘数据的潜在价值 B:实现数据重组的创新价值
C:利用数据可扩展性拓宽业务领域 D:优化存储设备,降低设备成本
E:提高社会效益,优化社会管理
32、 按照涉及自变量的多少,可以将回归分析分为(CD )。 (多选题,本题3分)
A:线性回归分析 B:非线性回归分析 C:一元回归分析
D:多元回归分析 E:综合回归分析
33、 传统数据密集型行业积极探索和布局大数据应用的表现是( BCE)。 (多选题,本题3分) A:投资入股互联网电商行业 B:打通多源跨域数据
C:提高分析挖掘能力 D:自行开发数据产品
E:实现科学决策与运营
34、 大数据人才整体上需要具备(ABE )等核心知识。 (多选题,本题3分)
A:数学与统计知识 B:计算机相关知识
C:马克思主义哲学知识 D:市场运营管理知识
E:在特定业务领域的知识
35、 下列关于大数据的说法中,错误的是(AD )。 (多选题,本题3分)
A:大数据具有体量大、结构单一、时效性强的特征
B:处理大数据需采用新型计算架构和智能算法等新技术
C:大数据的应用注重相关分析而不是因果分析
D:大数据的应用注重因果分析而不是相关分析
E:大数据的目的在于发现新的知识与洞察并进行科学决策
36、 在噪声数据中,波动数据比离群点数据偏离整体水平更大。( F) (判断题,本题2分) 是 否
37、 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。( F) (判断题,本题2分)
是 否
38、 一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(T ) (判断题,本题2分) 是 否
39、 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。(F ) (判断题,本题2分)
是 否
40、 谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。( F) (判断题,本题2分) 是 否
41、 决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。( T) (判断题,本题2分)
是 否
42、 信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。( F) (判断题,本题2分) 是 否
43、 简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。( F) (判断题,本题2分)
是 否
44、 啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。(F ) (判断题,本题2分)
是 否
45、 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。( F) (判断题,本题2分)
是 否
46.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)
A。数据规模大 B。数据类型多样 C。数据处理速度快D。数据价值密度高
47.下列关于大数据的分析理念的说法中,错误的是(D)
A.在数据基础上倾向于全体数据而不是抽样数据B。在分析方法上更注重相关分析而不是因果分析C。在分析效果上更追求效率而不是绝对精确D。在数据规模上强调相对数据而不是绝对数据
49.下列关于普查的缺点的说法中,正确的是(A)
A.工作量较大,容易导致调查内容有限、产生重复和遗漏现象B。误差不易被控制C。对样本的依赖比较强D。评测结果不够稳定
50.下列关于聚类挖掘技术的说法中,错误的是(B)
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B。要求同类数据的内容相似度尽可能小C。要求不同类数据的内容相似度尽可能小D。与分类挖掘技术相似的是,都是要对数据进行分类处理
51.智慧城市的构建,不包含(C)
A.数字城市B。物联网C。联网监控D。云计算
52.大数据的起源是(C)
A.金融B。电信C。互联网D。公共管理
53.智慧城市的智慧之源是(C)
A.数字城市B。物联网C。大数据D。云计算
54.假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系
A.因果 相关B。相关 因果C。并列 相关 D。因果 并列
55.下列关于数据交易市场的说法中,错误的是(C)
A.数据交易市场是大数据产业发展到一定程度的产物B。商业化的数据交易活动催生了多方参与的第三方数据交市场C。数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D。数据交易市场是大数据资源化的必然产物
56.当前大数据技术的基础是由(C)首先提出的
A.微软B。百度C。谷歌D。阿里巴巴
58.下列演示方式中,不属于传统统计图方式的是(D)
A.柱状图B。饼状图C。曲线图D。网络图
59.当前社会中,最为突出的大数据环境是(A)
A.互联网B。物联网C。综合国力D。自然资源
60.可以对大数据进行深度分析的平台工具是(C)
A.传统的机器学习和数据分析肛具B。第二代机器学习工具C。第二代机器学习工具D。未来机器学习工具
61.智能健康手环的应用开发,体现了(D)的数据采集技术的应用
A.统计报表B。网络爬虫C。API接口D。传感器
62.支撑大数据业务的基础是(A)
A.数据科学B。数据应用C。数据硬件D。数据人才
63.面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是(A)
A.大数据解决方案模式B。大数据信息分类模式C。大数据处理服务模式D。大数据资源提供模式
64.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大网点,这体现了大数据分析理念中的(B)
A.在数据基础上倾向于全体数据而不是抽样数据B。在分析方法上更注重相关分析而不是因果分析C。在分析效果上更追求效率而不是绝对精确D。在数据规模上强调相对数据而不是绝对数据
65.数据仓库的最终目的是(D)
A.收集业务需求B。建立数据仓库逻辑模型C。开发数据的应用分析D。为用户和业务部门提供决策支持
66.大数据的最显著特征是(A)
A.数据规模大B。数据类型多样CDE
67.根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种(C)
A.数据管理人员B。数据分析员C。研究科学家D。软件开发工程师
68.下列论据中,能够支撑“大数据无所不能”的观点的是(A)
A.互联网金融打破了传统的观念和行为B。大数据存在泡沫C。大数据具有非常高的成本D。个人隐私泄露与信息安全担忧
69.下列各国大数据发展路径的描述中,对应关系正确的是(ACDE)
A.日本:走尖端IT路线B。英国:视大数据为新的自然资源C。韩国:重视基础、首都先行D。印度:以IT外包转型为突破口若悬河E。澳大利亚:原则先行、谨慎发展
70.当前,大数据产业发展的特点是(ACE )
A:规模较大 B:规模较小 C:增速很快 D:增速缓慢 E:多产业交叉融合
71.按照服务目的不同,数据流通平台可分为(AC )
A.政府数据开放平台B。企业数据开放平台C。数据交易市场D数据研发市场E。数据废气交易市场
72.大数据的价值体现在(ABCDE)
A.大数据给思维方式带来了冲击B。大数据为政策制定提供科学论据C。大数据助力智慧城市提升公共服务水平D。大数据实现了精准营销E。大数据的发力点在于预测
72.当前大数据技术的基础包括(ABD)
A.分布式文件系统B。分布式并行计算C。关系型数据库D。分布式数据库
73.可视化高维展示技术在展示数据之间的关系以及数据分析结果方面作(BD)
A.能够直观反映成对数据之间的空间关系B。能够直观反映多维数据之间的空间关系C。能够静态演化事物的变化及变化的规律D。能够动态演化事物的变化及变化的规律E。提供高性能并行计算技术的强力支撑
74.下列关于计算机存储容量单位换算关系的公式中,正确的是( BE)
A.1KB=1012Byte B。1KB=1024Byte C。1GB=1024KB D。1GB=1012KB E。1GB=1024MB
75.第三方数据处理模式表现为:服务商通过软件即服务或平台即服务形式主义为用户提供自己的数据上服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果(F)是否
76.在美国的大数据大棋中,“五眼”是指配合美国进行全球监控的包含美国、英国、加拿大兰在内的五个国家(T)是否
77.当前,企业提供的大数据解决方案大多基于Ha doop 开源项目(T)是否
78.澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府(F) 是否
79.大数据可以分析与挖掘前之前人们不知道或者滑注意到的模式,可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值(T)是否
80.数据资产型企业产品线的盈利,主要通过提供收费服务来获取(F)是否
81.在大数据的荡畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行(F)是否
82.下列国家的大数据发展行动中,支持原则先行、谨慎发展的国家(D )A.英国B。韩国C。印度D。澳大利亚
83.下列论据中,体现“冷眼”看大数据的观点的是(D )
A.互联网金融打破了传统的观念和行为B。大数据医疗正在走进平民百姓C。数据资产型企业前景光明D。个人隐私泄露与信息安全担忧
84.下列国家的大数据发展行动中,视大数据为新的自然资源的国家是(D )
A.中国B。韩国C。印度D。新加坡
85.大数据环境下的隐私担忧,主要表现为(A)
A.个人信息的被识别与暴露B。用户画像的生成C。恶意广告的推送D。病毒入侵