“许子言”投稿了8篇大数据学试题及答案,下面是小编为大家推荐的大数据学试题及答案,欢迎阅读,希望大家能够喜欢。
大数据学试题及答案
1、当前大数据技术的基础是由(C)首先提出的。(单选题,本题2分)
A:微软B:百度C:谷歌D:阿里巴巴
2、大数据的起源是(C)。(单选题,本题2分)
A:金融B:电信C:互联网D:公共管理
3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。(单选题,本题2分)
A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师
4、(D)反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分)
A:规模B:活性C:关联度D:颗粒度
5、数据清洗的方法不包括(D)。(单选题,本题2分)
A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理
6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。(单选题,本题2分)
A:统计报表B:网络爬虫C:API接口D:传感器
7、下列关于数据重组的说法中,错误的是(A)。(单选题,本题2分)
A:数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒
C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新
8、智慧城市的构建,不包含(C)。(单选题,本题2分)
A:数字城市B:物联网C:联网监控D:云计算
9、大数据的最显著特征是(A)。(单选题,本题2分)
A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高
10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B)。(单选题,本题2分)
A:在数据基础上倾向于全体数据而不是抽样数据
C:在分析效果上更追究效率而不是绝对精确
D:在数据规模上强调相对数据而不是绝对数据
11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。(单选题,本题2分)
12、当前社会中,最为突出的大数据环境是(A)。(单选题,本题2分)
A:互联网B:物联网C:综合国力D:自然资源
13、在数据生命周期管理实践中,(B)是执行方法。(单选题,本题2分)
A:数据存储和备份规范B:数据管理和维护
C:数据价值发觉和利用D:数据应用开发和管理
14、下列关于网络用户行为的说法中,错误的是(C)。(单选题,本题2分)
A:网络公司能够捕捉到用户在其网站上的所有行为
B:用户离散的交互痕迹能够为企业提升服务质量提供参考
C:数字轨迹用完即自动删除
D:用户的隐私安全很难得以规范保护
15、下列关于计算机存储容量单位的说法中,错误的是(C)。(单选题,本题2分)
A:1KB<1MB<1GBB:基本单位是字节(Byte)
C:一个汉字需要一个字节的存储空间D:一个字节能够容纳一个英文字符,
16、下列关于聚类挖掘技术的说法中,错误的是(B)。(单选题,本题2分)
A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B:要求同类数据的内容相似度尽可能小
C:要求不同类数据的内容相似度尽可能小
D:与分类挖掘技术相似的是,都是要对数据进行分类处理
17、下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(D)。(单选题,本题2分)
A:美国B:日本C:中国D:韩国
18、下列关于大数据的分析理念的说法中,错误的是(D)。(单选题,本题2分)
19、万维网之父是(C)。(单选题,本题2分)
A:彼得德鲁克B:舍恩伯格C:蒂姆伯纳斯-李D:斯科特布朗
20、MacOS系统的开发者是(C)。(单选题,本题2分)
A:微软公司B:惠普公司C:苹果公司D:IBM公司
21、大数据时代,数据使用的关键是(D)。(单选题,本题2分)
A:数据收集B:数据存储C:数据分析D:数据再利用
22、下列关于数据交易市场的说法中,错误的是(C)。(单选题,本题2分)
A:数据交易市场是大数据产业发展到一定程度的产物
B:商业化的数据交易活动催生了多方参与的第三方数据交易市场
C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助
D:数据交易市场是大数据资源化的必然产物
23、下列论据中,能够支撑“大数据无所不能”的观点的是(A)。(单选题,本题2分)
A:互联网金融打破了传统的观念和行为B:大数据存在泡沫
C:大数据具有非常高的成本D:个人隐私泄露与信息安全担忧
24、数据仓库的最终目的是(D)。(单选题,本题2分)
A:收集业务需求B:建立数据仓库逻辑模型
C:开发数据仓库的应用分析D:为用户和业务部门提供决策支持
25、支撑大数据业务的基础是(B)。(单选题,本题2分)
A:数据科学B:数据应用C:数据硬件D:数据人才
26、在网络爬虫的爬行策略中,应用最为基础的是(AB)。(多选题,本题3分)
A:深度优先遍历策略B:广度优先遍历策略
C:高度优先遍历策略D:反向链接策略E:大站优先策略
27、当前,大数据产业发展的特点是(ACE)。(多选题,本题3分)
A:规模较大B:规模较小C:增速很快D:增速缓慢E:多产业交叉融合
28、下列关于数据生命周期管理的核心认识中,正确的是(ABC)。(多选题,本题3分)
A:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段
B:在不同的数据存在阶段,数据的价值是不同的
C:根据数据价值的不同应该对数据采取不同的管理策略
D:数据生命周期管理旨在产生效益的同时,降低生产成本
29、下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是(AB)。答案选C更正选题,本题3
分)
A:传统营销模式比基于大数据的营销模式投入更小
B:传统营销模式比基于大数据的营销模式针对性更强
C:传统营销模式比基于大数据的营销模式转化率低
D:基于大数据的营销模式比传统营销模式实时性更强
E:基于大数据的营销模式比传统营销模式精准性更强
30、下列关于脏数据的说法中,正确的是(ABCDE)。(多选题,本题3分)
A:格式不规范B:编码不统一C:意义不明确D:与实际业务关系不大E:数据不完整
31、数据再利用的意义在于(ABC)。(多选题,本题3分)
A:挖掘数据的潜在价值B:实现数据重组的创新价值
C:利用数据可扩展性拓宽业务领域D:优化存储设备,降低设备成本
E:提高社会效益,优化社会管理
32、按照涉及自变量的多少,可以将回归分析分为(CD)。(多选题,本题3分)
A:线性回归分析B:非线性回归分析C:一元回归分析
D:多元回归分析E:综合回归分析
33、传统数据密集型行业积极探索和布局大数据应用的表现是(BCE)。(多选题,本题3分)
A:投资入股互联网电商行业B:打通多源跨域数据
C:提高分析挖掘能力D:自行开发数据产品
E:实现科学决策与运营
34、大数据人才整体上需要具备(ABE)等核心知识。(多选题,本题3分)
C:马克思主义哲学知识D:市场运营管理知识
E:在特定业务领域的知识
35、下列关于大数据的说法中,错误的是(AD)。(多选题,本题3分)
A:大数据具有体量大、结构单一、时效性强的特征
B:处理大数据需采用新型计算架构和智能算法等新技术
E:大数据的目的在于发现新的知识与洞察并进行科学决策
36、在噪声数据中,波动数据比离群点数据偏离整体水平更大。(F)(判断题,本题2分)
是否
37、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的.信息量要尽量精确。(F)(判断题,本题2分)
38、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(T)(判断题,本题2分)
39、具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。(F)(判断题,本题2分)
40、谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。(F)(判断题,本题2分)
43、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。(F)(判断题,本题2分)
44、啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的.重要性。(F)(判断题,本题2分)
45、对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。(F)(判断题,本题2分)
46.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)
A。数据规模大B。数据类型多样C。数据处理速度快D。数据价值密度高
47.下列关于大数据的分析理念的说法中,错误的是(D)
49.下列关于普查的缺点的说法中,正确的是(A)
A.工作量较大,容易导致调查内容有限、产生重复和遗漏现象B。误差不易被控制C。对样本的依赖比较强D。评测结果不够稳定
50.下列关于聚类挖掘技术的说法中,错误的是(B)
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B。要求同类数据的内容相似度尽可能小C。要求不同类数据的内容相似度尽可能小D。与分类挖掘技术相似的是,都是要对数据进行分类处理
51.智慧城市的构建,不包含(C)
A.数字城市B。物联网C。联网监控D。云计算
52.大数据的起源是(C)
A.金融B。电信C。互联网D。公共管理
53.智慧城市的智慧之源是(C)
A.数字城市B。物联网C。大数据D。云计算
54.假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系
55.下列关于数据交易市场的说法中,错误的是(C)
A.数据交易市场是大数据产业发展到一定程度的产物B。商业化的数据交易活动催生了多方参与的第三方数据交市场C。数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D。数据交易市场是大数据资源化的必然产物
56.当前大数据技术的基础是由(C)首先提出的
A.微软B。百度C。谷歌D。阿里巴巴
58.下列演示方式中,不属于传统统计图方式的是(D)
A.柱状图B。饼状图C。曲线图D。网络图
59.当前社会中,最为突出的大数据环境是(A)
A.互联网B。物联网C。综合国力D。自然资源
60.可以对大数据进行深度分析的平台工具是(C)
A.传统的机器学习和数据分析肛具B。第二代机器学习工具C。第二代机器学习工具D。未来机器学习工具
61.智能健康手环的应用开发,体现了(D)的数据采集技术的应用
A.统计报表B。网络爬虫C。API接口D。传感器
62.支撑大数据业务的基础是(A)
A.数据科学B。数据应用C。数据硬件D。数据人才
63.面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是(A)
A.大数据解决方案模式B。大数据信息分类模式C。大数据处理服务模式D。大数据资源提供模式
64.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大网点,这体现了大数据分析理念中的(B)
65.数据仓库的最终目的是(D)
A.收集业务需求B。建立数据仓库逻辑模型C。开发数据的应用分析D。为用户和业务部门提供决策支持
66.大数据的最显著特征是(A)
A.数据规模大B。数据类型多样CDE
67.根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种(C)
A.数据管理人员B。数据分析员C。研究科学家D。软件开发工程师
68.下列论据中,能够支撑“大数据无所不能”的观点的是(A)
A.互联网金融打破了传统的观念和行为B。大数据存在泡沫C。大数据具有非常高的成本D。个人隐私泄露与信息安全担忧
69.下列各国大数据发展路径的描述中,对应关系正确的是(ACDE)
A.日本:走尖端IT路线B。英国:视大数据为新的自然资源C。韩国:重视基础、首都先行D。印度:以IT外包转型为突破口若悬河E。澳大利亚:原则先行、谨慎发展
70.当前,大数据产业发展的特点是(ACE)
71.按照服务目的不同,数据流通平台可分为(AC)
A.政府数据开放平台B。企业数据开放平台C。数据交易市场D数据研发市场E。数据废气交易市场
72.大数据的价值体现在(ABCDE)
A.大数据给思维方式带来了冲击B。大数据为政策制定提供科学论据C。大数据助力智慧城市提升公共服务水平D。大数据实现了精准营销E。大数据的发力点在于预测
72.当前大数据技术的基础包括(ABD)
A.分布式文件系统B。分布式并行计算C。关系型数据库D。分布式数据库
73.可视化高维展示技术在展示数据之间的关系以及数据分析结果方面作(BD)
A.能够直观反映成对数据之间的空间关系B。能够直观反映多维数据之间的空间关系C。能够静态演化事物的变化及变化的规律D。能够动态演化事物的变化及变化的规律E。提供高性能并行计算技术的强力支撑
74.下列关于计算机存储容量单位换算关系的公式中,正确的是(BE)
A.1KB=1012ByteB。1KB=1024ByteC。1GB=1024KBD。1GB=1012KBE。1GB=1024MB
75.第三方数据处理模式表现为:服务商通过软件即服务或平台即服务形式主义为用户提供自己的数据上服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果(F)是否
76.在美国的大数据大棋中,“五眼”是指配合美国进行全球监控的包含美国、英国、加拿大兰在内的五个国家(T)是否
77.当前,企业提供的大数据解决方案大多基于Hadoop开源项目(T)是否
78.澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府(F)是否
79.大数据可以分析与挖掘前之前人们不知道或者滑注意到的模式,可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值(T)是否
80.数据资产型企业产品线的盈利,主要通过提供收费服务来获取(F)是否
81.在大数据的荡畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行(F)是否
82.下列国家的大数据发展行动中,支持原则先行、谨慎发展的国家(D)A.英国B。韩国C。印度D。澳大利亚
83.下列论据中,体现“冷眼”看大数据的观点的是(D)
A.互联网金融打破了传统的观念和行为B。大数据医疗正在走进平民百姓C。数据资产型企业前景光明D。个人隐私泄露与信息安全担忧
84.下列国家的大数据发展行动中,视大数据为新的自然资源的国家是(D)
A.中国B。韩国C。印度D。新加坡
85.大数据环境下的隐私担忧,主要表现为(A)
◆随堂检测
1、要清楚地反映事物的变化情况应选择()
A、条形统计图B、折线统计图C、扇形统计图D、表格统计
2、下列关于统计图的说法中,正确的是()
A、从扇形统计图中可以直观地看出某部分的具体数量
B、从条形统计图中可以直观地看出事物的变化情况
C、从折线统计图中可以直观地看出每个项目的具体数目
D、扇形统计图中各部分占总体的百分比之和是1
3、根据下面的条形统计图分析,下列回答正确的是()
A、步行的人数最少,仅为90
B、步行的人数为50
C、坐公共汽车的人数占总人数的50%
D、步行与骑自行车的人数之和比坐公共汽车的人数要少
4、甲、乙两人参加某体育项目训练,为了便于研究,把最后5次的训练成绩分别用实线和虚线连接起来,如图所示,下面的结论错误的是()
A、乙的第二次成绩与第五次成绩相同
B、第三次测试中,甲的成绩与乙的成绩相同
C、第四次测试中,甲的成绩比乙的成绩多2分
D、5次测试中,甲的成绩都比乙的成绩高
5、百货商场服装部对7月份的某周销售衬衫情况作了如下统计:
星期一二三四五六七
销售量(件)14101512141820
根据上表做出反映衬衫销售的条形图。
◆典例分析
例:某校七年级(3)班数学考试成绩如下表:
请解答以下各题:
(1)计算及格率及优秀(80及80以上)率;
(2)哪个分数段的人数最多其百分比是多少
(3)根据上图的数据分优(80及以上)、良(60~79)、中(40~59)、差(40以下)分四部分制作扇形统计图;
(4)能否分成优分、及格、低分三部分制作扇形统计图
解:(1)及格率75%,优秀率31.25%;
(2)70~79分的最多27.08%;
(3)如图:
(4)能。
◆课下作业
●拓展提高
1、用条形统计图表示的数据可以转换成()
A、扇形统计图
B、折线统计图
C、扇形统计图和折线统计图
D、既不能表示成扇形统计图也不能表示成折线统计图
2、某校对初一的300名学生某次数学考试的成绩作了一次调查,将各范围的得分率绘制成扇形统计图(如图),则76~90分这一分数段的人数为()
A、30B、75C、9D、90
4、下面是一个病人在生病期间护士帮他记录的体温,请在下图用折线图恰当地表示。
从自己画的统计图中读出信息,并填空:
(1)这位病人的体温最高是℃,最低是℃;
(2)在4月8日温度最高值与最低值的差值为;
(3)从体温表中,猜测一下这位病人的病情是(填恶化或好转)。
5、下图是小黄作的一周的零用钱开支的统计图(单位:元)
分析上图,试回答以下问题:
(1)周几小黄花的零用钱最少是多少他零用钱花得最多的一天用了多少
(2)哪几天他花的零用钱是一样的分别为多少
(3)你能帮小黄算一算他一周平均每天花的零用钱吗
6、学期结束前,学校想调查学生对七年级数学实验教材的意见,特向七年级400名学生作问卷调查,其结果如下:
意见非常喜欢喜欢有一点喜欢不喜欢
人数200160328
(1)计算出每一种意见的人数占总调查人数的百分比;
(2)请选择恰当的统计图表示各种意见占总调查人数的百分比情况;
(3)从你画出的统计图表中你能得到什么结论
7、如图所示两个统计图,左图反映了某市电子仪器厂一厂、二厂工业产值增长情况,右图反映了一厂、二厂各类人员人数情况。
(1)从图①中可以看出,哪个厂的产值增长很快
(2)从图②中可以看出,哪个厂的工人人数多些哪个厂的技术人员多些哪个厂总人数多些
(3)结合两个图表所反映的两个厂的情况,你如果是该总厂的厂长,分析一下决定厂的产值增长的主要因素是哪些要做什么调整
●体验中考
1、(新疆维吾尔自治区中考题)要反映乌鲁木齐市一天内气温的.变化情况宜采用()
A、条形统计图B、扇形统计图C、频数分布直方图D、折线统计图
2、(20广东广州中考题)如图是广州市某一天内的气温变化图,下列说法中错误的是()
A、这一天中最高气温是24℃
B、这一天中最高气温与最低气温的差为16℃
C、这一天中2时至14时之间的气温在逐渐升高
D、这一天中只有14时至24时之间的气温在逐渐降低
3、(年广东肇庆中考题)如图是参加国际教育评估的15个国家学生的数学平均成绩的统计图,则平均成绩大于或等于60的国家个数是()
A、4B、8C、10D、12
(1)从以上统计图可知,九年级(1)班共有学生人;
(2)图1中a的值是;
参考答案:
1、B2、D3、C4、D
5、
1、C2、D3、折线统计图;扇形统计图;统计表
4、如图:(1)39.5,37;(2)1℃;(3)好转
5、(1)周三,1元,10元;
(2)周一与周五一样多,周六与周日一样多,分别为6元、10元;
(3)6元;
6、(1)每种意见的人数占总人数的百分比分别为:50%;40%;8%;2%;
(2)如图:
(3)绝大多数同学喜欢教材,点总人数的90%,不喜欢的人只占2%。
7、(1)一厂;(2)二厂工人多,一厂技术人员多,二厂总人数多;(3)决定厂的产值增长的主要因素是技术。
1、D2、D3、D4、(1)50;(2)3;(3)普遍增加了;(4)15。
数据分析笔试题
数据分析题,3个图表。
第一个图表1-2题,问关于35岁以下通勤人数。(数字比较大,最好能带个计算器。)
第二个图表3-4题,问什么我给忘记了……不难,数字也很好算。
第三个图表5题,问哪年哪个学校合格率高,
(这题最好也用计算器,数字蛮变态的`,不是整除的数)
逻辑推理。貌似15个还是20个。
其实有点像公务员的行政能力测试题,不难,考逻辑推理的,基本认真想想都能推理出来。
近年来,“大数据”这个概念突然火爆起来,成为业界人士舌尖上滚烫的话题。所谓“大数据”,是指数据规模巨大,大到难以用我们传统信息处理技术合理撷取、管理、处理、整理。“大数据”概念是“信息”概念的3.0版,主要是对新媒体语境下信息爆炸情境的生动描述。
我们一直有这样的成见:信息是个好东西。对于人类社会而言,信息应该多多益善。这种想法是信息稀缺时代的产物。由于我们曾吃尽信息贫困和蒙昧的苦头,于是就拼命追逐信息、占有信息。我们甚至还固执地认为,占有的信息越多,就越好,越有力量。但是,在“大数据’时代,信息不再稀缺,这种成见就会受到冲击。信息的失速繁衍造成信息的严重过剩。当超载的信息逼近人们所能承受的极限值时,就会成为一种负担,我们会不堪重负。
信息的超速繁殖源自于信息技术的升级换代。以互联网为代表的新媒体技术打开了信息所罗门的瓶子,数字化的信息失速狂奔,使人类主宰信息的能力远远落在后面。美国互联网数据中心指出,互联网上的数据每两年翻一番,目前世界上的90%以上数据是近几年才产生的。,数字存储信息占全球数据量的四分之一,另外四分之三的信息都存储在报纸、胶片、黑胶唱片和盒式磁带这类媒介上。,只有7%是存储在报纸、书籍、图片等媒介上的模拟数据,其余都是数字数据。到,世界上存储的数据中,数字数据超过98%。面对数字数据的大量扩容,我们只能望洋兴叹。
“大数据”时代对人类社会的影响是全方位的。这种影响究竟有多大,我们现在还无法预料。哈佛大学定量社会学研究所主任盖瑞·金则以“一场革命”来形容大数据技术给学术、商业和政府管理等带来的变化,认为“大数据”时代会引爆一场“哥白尼式革命”:它改变的不仅仅是信息生产力,更是信息生产关系;不仅是知识生产和传播的内容,更是其生产与传播方式。
我们此前的知识生产是印刷时代的产物。它是15世纪古登堡时代的延续。印刷革命引爆了人类社会知识生产与传播的“哥白尼式革命”,它使得知识的生产和传播突破了精英、贵族的垄断,开启了知识传播的大众时代,同时,也确立了“机械复制时代”的知识生产与传播方式。与印刷时代相比,互联网新媒体开启的“大数据”时代,则是一场更为深广的革命。在“大数据”时代,信息的生产与传播往往是呈几何级数式增长、病毒式传播。以互联网为代表的媒介技术颠覆了印刷时代的知识生产与传播方式。新媒体遍地开花,打破了传统知识主体对知识生产与传播的垄断。新媒体技术改写了静态、单向、线性的知识生产格局,改变了自上而下的知识传播模式,将知识的生产与传播抛入空前的不确定之中。在“大数据”时代,我们的知识生产若再固守印刷时代的知识生产理念,沿袭此前的知识生产方式,就会被远远地甩在时代后面。
(节选自.2.22《文汇读书周报》,有删改)
9.下列对“大数据时代”的特点解说正确的一项是
A.数据规模巨大,信息严重过剩,总量已超过了人们的承受极限值而成为社会的负担。B.信息生产呈几何级数式增长、病毒式传播,信息传播方式不再是自上而下,而是相反。
C.精英与贵族的知识垄断被冲破,传统知识主体不再是唯一的知识生产者和传播者。D.“机械复制时代”知识生产和传播方式被颠覆,呈动态、多向和空前的不确定性。10.下列理解,不符合原文意思的一项是
A.人们在信息稀缺时代形成的占有信息越多越好、越有力量的认识,将随着“大数据”时代的到来而改变。
B.人类主宰信息的能力远远落后于信息的产生,是因为信息技术的升级换代带来的数字化信息的失速狂奔。
C.从20数字存储信息占全球数据量的四分之一,到20超过98%,说明了传统媒体被新媒体取代。
D.印刷革命开启了知识传播的大众时代,与印刷时代相比,互联网新媒体开启的“大数据”时代,则是一场更为深广的革命。
10.C【试题分析:选项“说明了传统媒体正被新媒体取代”,文中没有依据,属于无中生有。】
11.⑴改变旧有的知识生产观念及方式。⑵变革传统信息处理技术,提升信息主宰能力。(3分,写出一点得2分,写出两点得3分。意思符合即可)【试题分析:此题抓住文中的句子“所谓‘大数据’,是指数据规模巨大,大到难以用我们传统信息处理技术合理撷取、管理、处理、整理”“在‘大数据’时代,我们的知识生产若再固守印刷时代的知识生产理念,沿袭此前的知识生产方式,就会被远远地甩在时代后面”可以得出答案。】
大数据技术Hadoop笔试题
单项选择题
1.下面哪个程序负责HDFS数据存储。
a)NameNode
b)Jobtracker
c)Datanode
d)secondaryNameNode
e)tasktracker
2.HDfS中的block默认保存几份
a)3份
b)2份
c)1份
d)不确定
3.下列哪个程序通常与NameNode在一个节点启动
a)SecondaryNameNode
b)DataNode
c)TaskTracker
d)Jobtracker
4.Hadoop作者
a)MartinFowler
b)KentBeck
c)Dougcutting
5.HDFS默认BlockSize
a)32MB
b)64MB
c)128MB
6.下列哪项通常是集群的最主要瓶颈
a)CPU
b)网络
c)磁盘
d)内存
7.关于SecondaryNameNode哪项是正确的
a)它是NameNode的热备
b)它对内存没有要求
d)SecondaryNameNode应与NameNode部署到一个节点
多选题
8.下列哪项可以作为集群的管理工具
a)Puppet
b)Pdsh
c)ClouderaManager
d)d)Zookeeper
9.配置机架感知的'下面哪项正确
a)如果一个机架出问题,不会影响数据读写
b)写入数据的时候会写到不同机架的DataNode中
c)MapReduce会根据机架获取离自己比较近的网络数据
10.Client端上传文件的时候下列哪项正确
a)数据经过NameNode传递给DataNode
b)Client端将文件切分为Block,依次上传
c)Client只上传数据到一台DataNode,然后由NameNode负责Block复制工作
11.下列哪个是Hadoop运行的模式
a)单机版
b)伪分布式
c)分布式
12.Cloudera提供哪几种安装CDH的方法
a)Clouderamanager
b)Tarball
c)Yumd)Rpm
判断题
13.Ganglia不仅可以进行监控,也可以进行告警。()
14.BlockSize是不可以修改的。()
15.Nagios不可以监控Hadoop集群,因为它不提供Hadoop支持。()
16.如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。()
17.ClouderaCDH是需要付费使用的。()
18.Hadoop是Java开发的,所以MapReduce只支持Java语言编写。()
19.Hadoop支持数据的随机读写。()
20.NameNode负责管理metadata,client端每次读写请求,它都会从磁盘中读取或则会写入metadata信息并反馈client端。()
21.NameNode本地磁盘保存了Block的位置信息。()
22.DataNode通过长连接与NameNode保持通信。()
23.Hadoop自身具有严格的权限管理和安全措施保障集群正常运行。()
24.Slave节点要存储数据,所以它的磁盘越大越好。()
25.hadoopdfsadmin–report命令用于检测HDFS损坏块。()
26.Hadoop默认调度器策略为FIFO()
27.集群内每个节点都应该配RAID,这样避免单磁盘损坏,影响整个节点运行,
()
28.因为HDFS有多个副本,所以NameNode是不存在单点问题的。()
29.每个map槽就是一个线程。()
30.Mapreduce的inputsplit就是一个block。()
31.NameNode的WebUI端口是50030,它通过jetty启动的Web服务。()
32.Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是200GB。()
33.DataNode首次加入cluster的时候,如果log中报告不兼容文件版本,那需要NameNode执行“Hadoopnamenode-format”操作格式化磁盘。()
别走开,答案在后面哦!
1.下面哪个程序负责HDFS数据存储。答案Cdatanode
2.HDfS中的block默认保存几份答案A默认3分
3.下列哪个程序通常与NameNode在一个节点启动答案D
此题分析:
hadoop的集群是基于master/slave模式,namenode和jobtracker属于master,datanode和tasktracker属于slave,master只有一个,而slave有多个SecondaryNameNode内存需求和NameNode在一个数量级上,所以通常secondaryNameNode(运行在单独的物理机器上)和NameNode运行在不同的机器上。
JobTracker和TaskTracker
JobTracker对应于NameNode
TaskTracker对应于DataNode
DataNode和NameNode是针对数据存放来而言的
JobTracker和TaskTracker是对于MapReduce执行而言的
mapreduce中几个主要概念,mapreduce整体上可以分为这么几条执行线索:obclient,JobTracker与TaskTracker。
1、JobClient会在用户端通过JobClient类将应用已经配置参数打包成jar文件存储到hdfs,并把路径提交到Jobtracker,然后由JobTracker创建每一个Task(即MapTask和ReduceTask)并将它们分发到各个TaskTracker服务中去执行。
2、JobTracker是一个master服务,软件启动之后JobTracker接收Job,负责调度Job的每一个子任务task运行于TaskTracker上,并监控它们,如果发现有失败的task就重新运行它。一般情况应该把JobTracker部署在单独的机器上。
3、TaskTracker是运行在多个节点上的slaver服务。TaskTracker主动与JobTracker通信,接收作业,并负责直接执行每一个任务。TaskTracker都需要运行在HDFS的DataNode上。
4.Hadoop作者答案CDougcutting
5.HDFS默认BlockSize答案:B
(因为版本更换较快,这里答案只供参考)
6.下列哪项通常是集群的最主要瓶颈:答案:C磁盘
c)磁盘IO
该题解析:
首先集群的目的是为了节省成本,用廉价的pc机,取代小型机及大型机。小型机和大型机有什么特点
1.cpu处理能力强
2.内存够大
所以集群的瓶颈不可能是a和d
3.网络是一种稀缺资源,但是并不是瓶颈。
4.由于大数据面临海量数据,读写数据都需要io,然后还要冗余数据,hadoop一般备3份数据,所以IO就会打折扣。
7.关于SecondaryNameNode哪项是正确的答案C
数据表示形式笔试题
1、计算机中数据的表示形式是
A)八进制B)十进制C)二进制D)十六进制
2、硬盘工作时应特别注意避免
A)噪声B)震动C)潮湿D)日光
3、针式打印机术语中,24针是指
A)24x24点阵B)信号线插头有24针C)打印头内有24x24根针D)打印头内有24根
针
4、下面列出的四种存储器中,易失性存储器是
A)RAMB)ROMC)PROMD)CD-ROM
5、办公自动化是计算机的一项应用,按计算机应用的分类,它属于
A)科学计算B)实时控制C)数据处理D)辅助设计
6、I/O接口位于
A)总线和设备之间B)CPU和I/O设备之间C)主机和总线之间D)CPU和主存储器之
间
7、计算机硬件能直接识别和执行的`只有
A)高级语言B)符号语言C)汇编语言D)机器语言
8、具有多媒体功能的微型计算机系统中,常用的CD-ROM是
A)只读型大容量软盘B)只读型光盘C)只读型硬盘D)半导体只读存储器