Hive 问题合集 持续更新

一 hive建表信息中文乱码:显示问号等

问题现象:

主要缘由:

  1 hive元数据库mysql 或者mariaDB 编码格式问题mysql

  2 hive元数据定义信息编码格式问题sql

解决方案:

对于第一种问题:修改配置文件

在/etc/my.cnf文件中
在[mysqld]标签下添加
init_connect='SET collation_connection = utf8_unicode_ci'
init_connect='SET NAMES utf8'
character-set-server=utf8
collation-server=utf8_unicode_ci
skip-character-set-client-handshake

文件/etc/my.cnf.d/client.cnf
在[client]中添加
default-character-set=utf8

文件/etc/my.cnf.d/mysql-clients.cnf
在[mysql]中添加
default-character-set=utf8

所有配置完成,重启mariadb
systemctl restart mariadb

而后进入musql,执行 SHOW VARIABLES LIKE 'character%';数据库

 

对于第二种问题 :

一、查看存放Hive元数据信息的数据库表字符集;是否由于字符集问题编码

 

 很明显,因为表使用的是默认的latin1字符集,因此中文显示不出来,应该使用utf8;spa

2 登录Mysql数据库切换到Hive元数据库:根据具体设定自行判断rest

修改如下两张表便可;
use hive 

alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8; 
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8; 

若是建立了分区,要再加一条语句:
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8; 
相关文章
相关标签/搜索