hive修改表名、修改列名、修改分区
文章目录
- 一、修改表
- 二、修改列
- 三、修改分区
官网地址:https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-AlteringandDroppingTables
一、修改表
1、重命名表名
ALTER TABLE table_name RENAME TO new_table_name示例: 将user表重命名为user_bakalter table user rename to user_bak;
2、修改表TBLPROPERTIES属性:
ALTER TABLE table_name SET TBLPROPERTIES (property_name = property_value, property_name = property_value,... )示例:ALTER TABLE user SET TBLPROPERTIES (\'tablename\'= \'user表\' )
说明:
- SET TBLPROPERTIES中的属性
若不存在则会新增进去;若已存在则会更改原先的值。
如上述示例中的tablename属性,若不存在则新增此属性。
3、修改表注释
ALTER TABLE table_name SET TBLPROPERTIES(\'comment\' = new_comment);
虽然看着是修改TBLPROPERTIES的属性,但是comment这个属性是表中的comment注释。
示例:将表注释\'测试表\'修改为\'测试数据\'create table test(id string default null comment \'编号\')comment \'测试表\'stored as hyperdrive;ALTER TABLE test SET TBLPROPERTIES(\'comment\' = \'测试数据\');
4、复制表结构
-- 创建一个相同表结构的表create table new_table like table_name;示例:创建user_bak使表结构与user表一致create table user_bak like user;
5、拷贝表
-- 创建一个相同表结构的表,并把原先的数据复制到新表CREATE TABLE new_table AS SELECT * FROM old_table示例:create table user_bak as select * from user;
6、删除表
drop table if exists table_name;
二、修改列
1、添加列
一次增加一个列(默认添加为最后一列)ALTER TABLE table_name ADD COLUMNS (new_col INT); 可以一次增加多个列ALTER TABLE table_name ADD COLUMNS (c1 INT,c2 STRING); 添加一列并增加列字段注释ALTER TABLE table_name ADD COLUMNS (new_col INT COMMENT \'a comment\');
注意:hive中添加列只会添加在最后,不支持插入到指定的位置。
2、修改列
修改列名、列类型、列位置
ALTER TABLE table_name CHANGE [COLUMN] col_old_name col_new_name column_type [COMMENT col_comment] [FIRST|AFTER column_name] --- 示例:修改列名CREATE TABLE test_change (a int, b int, c int);ALTER TABLE test_change CHANGE a a1 INT; --将 a 列的名字改为 a1. --将 a 列的名字改为 a1,a 列的数据类型改为 string,并将它放置在列 b 之后。新的表结构为: b int, a1 string, c int.ALTER TABLE test_change CHANGE a a1 STRING AFTER b; --将 b 列的名字修改为 b1, 并将它放在第一列。新表的结构为: b1 int, a string, c int.ALTER TABLE test_change CHANGE b b1 INT FIRST;
该命令将允许用户更改列的名称、数据类型、注释、位置或它们的任意组合,但必须先存在该字段才能修改名字及指定位置.
列更改命令只修改Hive的元数据,不修改数据。用户应该确保表/分区的实际数据布局符合元数据定义。
3、删除列
原有Hive表test_change中有a,b,c,d,e这几个字段将从test_change中删除“d”列:ALTER TABLE test_change REPLACE COLUMNS (a int, b int,c string,e string);将d和e两列一起删除:ALTER TABLE test_change REPLACE COLUMNS (a int, b int,c string);
注意:如果列字段比较多,可以用show create table table_name; 显示建表语句,将字段一次性复制进来,删除哪些字段就直接去除即可.
三、修改分区
1、增加分区
--增加分区 语法ALTER TABLE table_name ADD partition_spec [ LOCATION \'location1\' ] partition_spec [ LOCATION \'location2\' ] ... partition_spec: : PARTITION (partition_col = partition_col_value, partition_col = partiton_col_value, ...)--Add Partitions 语法案例:用户可以用 ALTER TABLE ADD PARTITION 来向一个表中增加分区。当分区名是字符串时加引号。ALTER TABLE page_view ADD PARTITION (dt=\'2008-08-08\', country=\'us\') location \'/path/to/us/part080808\' PARTITION (dt=\'2008-08-09\', country=\'us\') location \'/path/to/us/part080809\';
2、修改分区
3、删除分区
---DROP PARTITION 删除分区ALTER TABLE table_name DROP partition_spec, partition_spec,...删除某分区数据-- 删除dt = \'2021-03-23\'分区数据SET mapred.output.compress = true;SET hive.exec.compress.output = true;SET mapred.job.priority = VERY_HIGH;USE app;ALTER TABLE table.table_name DROP partition(dt = \'2021-03-23\') ;
4、拷贝分区表
-- 拷贝同一结构CREATETABLE app.table_new LIKE app.table_old;-- 拷贝分区表中的数据set hive.exec.dynamic.partition=true;set hive.exec.dynamic.partition.mode=nonstrict;insert overwrite table app.table_new partition(dt, dt2)select * from app.table_old;
5、查看分区结构
show partitions app.table_new