hadoop序列化相关问题

发布时间 2023-05-29 12:27:18作者: 郭培鑫同学

什么时候需要使用序列化?
需要在不同服务器传递内存数据时,用序列化。
序列化后的所有属性需要再反序列化,那么有先后顺序反序列化吗?
有的,比如序列化的属性有a b c
则反序列化的属性必须是 ca b c
数据切片一般为数据块的倍数,为什么?
一般一个数据切片对应启动一个maptask任务,可以保证maptask处理的任务正好是一个数据块,Hadoop可以将该maptask任务发给数据块所在的节点服务器上,实现计算的数据本地化。