Hadoop架构、Hive相关知识点及Hive执行流程

news/2024/7/6 13:34:00 标签: hadoop, hive

Hadoop架构

Hadoop由三大部分组成:HDFS、MapReduce、yarn

HDFS:负责数据的存储

其中包括:

        namenode:主节点,用来分配任务给从节点

        secondarynamenode:副节点,辅助主节点

        datanode:从节点,负责实际的存储

MapReduce:负责计算

其中Map负责分解,reduce负责合并

yarn:负责资源调度

其中包括:

        resourcemanager:负责接收用户的请求,并负责集群的管理和资源调度

        nodemanager:负责执行resourcemanager分配的任务


Hive相关知识点

元数据:用来描述数据的数据。

元数据包含:用Hive创建的database、table、表的字段等元信息。

元数据存储:存在关系型数据库中,如:hive内置的Derby数据库或者第三方MySQL数据库等,一般使用Mysql数据库。

Metastore:即元数据存储服务

作用是: 客户端连接metastore服务,metastore再去连接MySQL等数据库来存取元数据。

特点: 有了metastore服务,就可以有多个客户端同时连接,而且这些客户端不需要知道MySQL等数据库的用户名和密码,只需要连接metastore 服务即可。


Hive执行流程

 1.用户在用户端编写sql语句,通过hive thrift server传到hive

hive中:

2.解析器:解析sql语法

3.编译器:将sql语句编译成MapReduce程序,通过metastore在数据库中获取元数据并映射成一张表

优化器:优化MapReduce程序

4.执行器:将优化后的执MapReduce程序传给Hadoop

Hadoop来执行MapReduce程序,yarn复制资源调度,MapReduce负责计算

5.hive来监督执行情况,Hadoop会将结果存在hdfs中

6.结果返回显示


http://www.niftyadmin.cn/n/5169472.html

相关文章

基于springboot实现协同过滤算法商品推荐系统项目【项目源码】

基于springboot实现协同过滤算法商品推荐系统演示 Java语言简介 Java是由SUN公司推出,该公司于2010年被oracle公司收购。Java本是印度尼西亚的一个叫做爪洼岛的英文名称,也因此得来java是一杯正冒着热气咖啡的标识。Java语言在移动互联网的大背景下具备…

CAN轴【禾川】

禾川CAN轴有问题。 厂家说是只能使用禾川的伺服X2EN,和X3EN 添加CAN模块: 网络: 0 波特率: 1000K 添加CAN主站:【站2】 主站: 2 同步帧: 80h 设置刷新时间 30秒 【调试用】 时间帧&…

Ubuntu 安装常见问题

1. 安装oh my zsh 搜狗输入法不能用 vim /etc/environmentexport XIM_PROGRAMfcitx export XIMfcitx export GTK_IM_MODULEfcitx export QT_IM_MODULEfcitx export XMODIFIERS“imfcitx” export LANG“zh_CN.UTF-8”配置完后重启,稍等一会,右上角会有个…

​软考-高级-系统架构设计师教程(清华第2版)【第2章 计算机系统基础知识-思维导图】​

软考-高级-系统架构设计师教程(清华第2版)【第2章 计算机系统基础知识-思维导图】 课本里章节里所有蓝色字体的思维导图

yolov8训练参数讲解

背景: 最近使用yolo8算法训练了一个视频中手势识别的项目,打算重点深入的研究一下yolo8算法。 训练命令: yolo train model yolov8x.pt data myhand.yaml epochs 350 batch8 使用 nohup命令在linux服务器上挂载训练并保留日志的命令如…

网络爬虫代理ip有什么好处?爬虫工作使用代理IP有哪些优势?

在爬虫工作中,使用代理IP有很多好处,可以帮助爬虫程序更加高效地完成任务。以下是使用代理IP的几个优势: 1. 增加匿名性 使用代理IP可以隐藏爬虫程序的真正IP地址,增加匿名性,避免被目标网站封禁。通过代理IP&#xff…

Vue的vant notify组件报错Notify is not defined

解决方法: 原创作者:吴小糖 创作时间:2023.11.10

【编程语言发展史】Go语言的发展历史

目录 Go的起源 Go语言发展时间轴 logo Go的起源 Go 语言起源 2007 年,并于 2009 年正式对外发布。它从 2009 年 9 月 21 日开始作为谷歌公司 20% 兼职项目,即相关员工利用 20% 的空余时间来参与 Go 语言的研发工作。该项目的三位领导者均是著名的 …