hive - 程序员宅基地

HBase与Hive的整合

HBase与Hive的整合 hive与我们的HBase各有千秋，各自有着不同的功能，但是归根接地，hive与hbase的数据最终都是存储在hdfs上面的，一般的我们为了存储磁盘的空间，不会将一份数据存储到多个地方，导致磁盘...

Hive 多数组合并 CONCAT_WS

标签：数据库 sql hive

Hive 多数组合并使用CONCAT_WS和split 完成多个数组合成一个数组

hive 的存储格式

标签： hive

hive的存储格式

Hive表描述乱码

标签： hive mysql hadoop

在进行查看hive表字段描述信息的时候发现乱码一，查看当前编码 1.打开mysql查看当前编码 mysql> \s 看到当前编码格式 2.接着输入下面语句查看 mysql> show variables like "char%"; 二、我们修改my.cof...

hive报错——FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.StatsTask

标签：数据仓库大数据 apache

执行完报错了:FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.StatsTask。需要注意的是，之前的insert语句虽然报错了，但是已经向表里插入数据了，有可能会造成重复的数据。执行这个...

HiveSQL和SparkSQL的区别和联系

标签： hive hadoop 大数据

Hive和spark对比

JDBC连接hive的配置说明

标签： hive hadoop

hive先验hive简介thrift协议hive本地运行JDBC访问 hive简介 https://developer.aliyun.com/article/100911 1 特点：一次写入，多次读出；处理海量数据； hdfs存储，mr处理；对实时性要求低； … 2 基本组成用户...

将mysql数据导入到hive

标签： hive mysql sqoop

禁止转载

hivesql中 exists 用法

标签：大数据 hivesql hive

sql exists

hive中字符串查找函数 instr 和 locate

标签： hive hadoop 数据仓库

可用于优化join or关联匹配情况

20 | Hive + Spark强强联合：分布式数仓的不二之选

本文总结了Spark与Hive的集成方式，包括Spark with Hive和Hive on Spark。前者通过访问Hive Metastore实现数据加载和处理，提高了数据处理的灵活性和效率；后者则将Spark作为其后端的分布式执行引擎，实现了Hive与...

hive01--hive的安装及配置

在hive内嵌模式与本地模式中，当启动hive cil（hive命令行模式），hive会在后台自动启动hive服务与metastoreserver独立进程。由于执行hiveql时，默认会寻找本地的resourcemanager，因此需要在resourcemanager所在的...

hive查看库名、表名

标签： hive 数据库 sql

hive 查看库名表名

Hive分区修复msck repair

标签： hive hadoop big data

Hive的[MSCK REPAIR TABLE] 命令全量修复分区，目的就是将分区信息更新到元数据库中。该命令通常用于分区表的分区修复。官方解释：（翻译版） Hive将每个表的分区信息保存在metastore中，如果通过hadoop fs -put...

Hive与mysql的区别

标签： mysql hive

Hive采用了类SQL的查询语言HQL，因此很容易将Hive理解为数据库。其实从结构上来看，Hive和数据库除了拥有类似的查询语言，再无类似之处。数据库可以用在OLTP的应用中，但是Hive是为数据仓库而设计的，清楚这一点...

Hive3.1.2整合Spark3.0.0-HiveOnSpark

标签： hadoop mapreduce hdfs

Hive是一个Sql解析引擎，其不具备计算能力，Hive将Sql解析成为物理执行计划，将物理执行计划交由计算引擎执行计算，默认的执行引擎是MapReduce，但MapReduce执行速度慢，随着Spark的崛起，Hive也支持使用Spark作为...

Hive增加列，调整列顺序，属性名等操作

标签： 1024程序员节 hive 数据仓库

hive添加字段到指定位置先添加字段到最后位置再移动到指定位置

hive中如何新增字段

标签： hive

1、方法1 alter table 表名 add columns (列名 string COMMENT '新添加的列') CASCADE; 与alter table 表名 add columns (列名 string COMMENT '新添加的列')； CASCADE会刷历史分区字段 ...2、方法2 （适用于外部...

Hive入门教程| 使用JDBC操作hive的两种方式

标签： linux centos vmware

JDBC操作Hive一、启动hadoop集群二、在hive的安装目录下的bin/目录下启动hiveserver2三、两种JDBC的操作方式一、虚拟机中的hive的beeline端二、Windows本地idea集成开发环境1、创建maven项目并添加依赖到pom.xml文件...

hive springboot mybatis-plus

标签： hive spring boot java

pom文件 <dependency> <...org.apache.hive</groupId> <artifactId>hive-jdbc</artifactId> <version>2.1.1</version> <exclusions> <exc

hive insert values 方式

标签： java 开发语言

hive insert value的方式

HIVE取整和取余

标签：大数据

hive取整和取余

FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me

标签： hive hadoop mysql

FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient 无论是启动hive后，show databases;还是查看数据：select * from test...

hive之Map Join使用方法

标签： hive 大数据 sql

MAPJION会把小表全部加载到内存中，在map阶段直接拿另外一个表的数据和内存中表数据做匹配，由于在map端是进行了join操作，省去了reduce运行的时间，算是hive中的一种优化。如上图中的流程，首先Task A在客户端...

大数据之Hive：space函数

标签： big data hive 大数据

hive> select space(10) from dual; hive> select length(space(10)) from dual; 10 2、space函数与split函数结合，得到数组； space函数与split函数结合，可以得到空格字符串数组举例： hive>select ...

hive-本地模式设置

标签： hive hadoop big data

当在hive上提交mapreduce任务时，常见的管理引擎有yarn与local，默认使用集群模式yarn进行执行。当执行任务计算的文件大小与文件数相对较小时，可以开启本地模式进行执行，效率相对集群模式会更高。查看当前hive的...

hive创建临时表

标签： hive hadoop 数据仓库

hive创建临时表 1.创建的临时表仅仅在当前会话可见，数据会被暂存到hdfs上，退出当前会话表和数据将会被删除

使用Sqoop实现Mysql到Hive的数据导入

标签： hive mysql sqoop

使用sqoop将mysql数据导入至hive的本质，其实是数据先导入至hdfs，然后会有一个脚本去执行将hdfs的数据load至hive中。所以我们将数据导入到hive时，其实hdfs中也会有这个数据。使用sqoop将数据导入至hive时，需要...

HIVE修改默认端口

标签： hive hadoop big data

HIVE修改默认端口

Hive beeline常用操作

标签： hive

目录1 beeline连接hive2 退出beeline 1 beeline连接hive 两种方式,都需要先启动hiveserver2 hive --service hiveserver2 & 一条命令 beeline -u jdbc:hive2://ip地址:10000/test ip地址也可以填映射 test...

”hive“ 的搜索结果

HBase与Hive的整合

Hive 多数组合并 CONCAT_WS

hive 的存储格式

Hive表描述乱码

hive报错——FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.StatsTask

HiveSQL和SparkSQL的区别和联系

JDBC连接hive的配置说明

将mysql数据导入到hive

hivesql中 exists 用法

hive中字符串查找函数 instr 和 locate

20 | Hive + Spark强强联合：分布式数仓的不二之选

hive01--hive的安装及配置

hive查看库名、表名

Hive分区修复msck repair

Hive与mysql的区别

Hive3.1.2整合Spark3.0.0-HiveOnSpark

Hive增加列，调整列顺序，属性名等操作

hive中如何新增字段

Hive入门教程| 使用JDBC操作hive的两种方式

hive springboot mybatis-plus

hive insert values 方式

HIVE取整和取余

FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me

hive之Map Join使用方法

大数据之Hive：space函数

hive-本地模式设置

hive创建临时表

使用Sqoop实现Mysql到Hive的数据导入

HIVE修改默认端口

Hive beeline常用操作

推荐文章