前言
用了这么久的Hive,而没有认真的学习和使用过Hive的分区,现在学习记录一下。
- 分区表一般在数据量比较大,且有明确的分区字段时使用,这样用分区字段作为查询条件查询效率会比较高。
- Hive分区分为静态分区和动态分区
1、建表语句
先用一个有分区字段的分区表进行学习,静态分区和动态分区的建表语句是一样的。1
2
3
4
5
6
7create table test_partition (
id string comment 'ID',
name string comment '名字'
)
comment '测试分区'
partitioned by (year int comment '年')
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;