Hadoop 数据类型及序列化

发布时间 2023-12-13 19:05:07作者: SpringCore

1.Hadoop数据类型

Java类型 Hadoop Writable类型
Boolean BooleanWritable
Writable
Writable
Writable
Writable
Writable
Writable
Writable
Writable
Writable

2.为何Hadoop有自身序列化与反序列化

  • Java自身的序列化除去本身Bean的数据外,携带了各种校验信息、头及继承体系等,本身比较重,Hadoop自身的序列化则仅携带了轻量的简单校验信息,因此可以达到集群之间存储空间少、传输速度快的特性。
  • 自身实现的序列化可以实现在不同的开发语言下互相之间序列/反序列,更好的互操作性。