博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据笔记-1018
阅读量:5808 次
发布时间:2019-06-18

本文共 353 字,大约阅读时间需要 1 分钟。

hot3.png

1.hdfs 伪分布式哪三个进程,简写

2.yarn伪分布式哪两个进程,简写
3.简述 nn做什么的?
4.简述 snn是做什么的那幅图,是否能够描述清楚?
5.一个文件130M,block设为128M,系统设置3副本,请问多少块,多少存储
6.拓展题:  所以,假如都是5M  10M 20M这些小文件,我们是不是为了避免nn节点内存的压力,要不合并这些小文件,要不就将冷数据迁移到比如oss,s3存储上
7.假如让你找配置参数,你会在官网找吗
8.简述你们对shuffle的理解
9.简述什么是数据本地化
10.简述mr提交到yarn上
11.hive数据分为 元数据和数据,那么你们课程中,分别存储在哪里

转载于:https://my.oschina.net/u/3862440/blog/2248815

你可能感兴趣的文章
Spring ’14 Wave Update: Installing Dynamics CRM on Tablets for Windows 8.1
查看>>
MySQL 备份与恢复
查看>>
TEST
查看>>
PAT A1037
查看>>
(六)Oracle学习笔记—— 约束
查看>>
[Oracle]如何在Oracle中设置Event
查看>>
top.location.href和localtion.href有什么不同
查看>>
02-创建hibernate工程
查看>>
Scrum之 Sprint计划会议
查看>>
svn命令在linux下的使用
查看>>
Gradle之module间依赖版本同步
查看>>
java springcloud版b2b2c社交电商spring cloud分布式微服务(十五)Springboot整合RabbitMQ...
查看>>
10g手动创建数据库
查看>>
Windwos Server 2008 R2 DHCP服务
查看>>
UVa 11292 勇者斗恶龙(The Dragon of Loowater)
查看>>
白话算法(7) 生成全排列的几种思路(二) 康托展开
查看>>
d3 v4实现饼状图,折线标注
查看>>
微软的云策略
查看>>
Valid Parentheses
查看>>
【ES6】数值的扩展
查看>>