1.hdfs 伪分布式哪三个进程,简写
2.yarn伪分布式哪两个进程,简写 3.简述 nn做什么的? 4.简述 snn是做什么的那幅图,是否能够描述清楚? 5.一个文件130M,block设为128M,系统设置3副本,请问多少块,多少存储 6.拓展题: 所以,假如都是5M 10M 20M这些小文件,我们是不是为了避免nn节点内存的压力,要不合并这些小文件,要不就将冷数据迁移到比如oss,s3存储上 7.假如让你找配置参数,你会在官网找吗 8.简述你们对shuffle的理解 9.简述什么是数据本地化 10.简述mr提交到yarn上 11.hive数据分为 元数据和数据,那么你们课程中,分别存储在哪里