fugue 分布式计算通用接口

发布时间 2023-12-23 10:17:23作者: 荣锋亮

fugue提供了通用方便分布式计算的接口,可以高效的访问大数据项目,提供了python,pandas,sql 等模式
如下图


从上图可以看出fugue 提供了一个语义层,我们的计算任务可以运行在ray,dask,spark,以及duckdb 中

参考架构

可以看出fugue 提供了不少方便的能力,比如sql,机器学习,以及流处理

说明

对于搞机器学习以及数据分析的场景,fugue 还是值得试用下的,官方文档也比较全

参考资料

https://github.com/fugue-project/fugue
https://fugue-tutorials.readthedocs.io/tutorials/fugue_sql/index.html
https://optuna.org/
https://hyperopt.github.io/hyperopt/