问题:如何解决hive查询排序后,会多出一行全null数据
解决:设置hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat;
方法:
在运行语句前运行
set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat;
执行MR操作,会先经过hive.input.format,其默认值为CombineHiveInputFormat,其会先将索引文件当成小文件合并,将其当做普通文件处理。更严重的是,这会导致LZO文件无法切片。