arroyo集群部署简单说明

发布时间 2023-04-11 08:33:56作者: 荣锋亮

arroyo 推荐的调度是基于nomad 当然也可以基于内置的

运行配置

  • pg 
    arroyo 基于了refinery 管理迁移
  • s3 
    进行checkpoints 存储,通过controller 以及worker 进行的状态写入

运行服务

arroyo 集群 包含了多特api server 以及一个controller (开源版本)api 暴露grpc (8001端口),web 为8000,如果controller 以及api
分开部署的,需要通过环境变量配置CONTROLLER_ADDR ,默认controller 提供的grpc api 为9190,api 以及controller 都需要配置db
地址,可以通过环境变量维护,同时controller 需要配置s3 信息

prometheus

主要是进行监控

调度

支持多种模式,包含了进程,node,nomad,k8s ,对于调度执行节点,需要配置CONTROLLER_ADDR 使用node 模式controller 需要配置
SCHEDULER=node,nomad 是官方推荐的模式,controller 需要配置SCHEDULER=nomad 以及NOMAD_ENDPOINT同时建议多个nomad
server 保证ha

说明

arroyo 与k8s 类似又有区别,了解集群部署对于学习内部机制还是有很大帮助的

参考资料

https://doc.arroyo.dev/deployment/arroyo-cluster
https://doc.arroyo.dev/architecture