TritonServer

记录TritonServer部署多模型到多GPU踩坑 | 京东云技术团队

一、问题是怎么发现的部署chatglm2和llama2到一个4*V100的GPU机器上遇到问题 config.pbtxt 中设置模型分别在指定gpu上部署实例配置不生效如以下配置为在gpu0上部署本模型,部署count=1个实例,在gpu1上部署本模型,部署count=2个实例 instance ......

TritonServer 模型团队技术 GPU更新时间 2023-10-17

共1篇 :1/1页 首页上一页1下一页尾页

526互联

TritonServer

记录TritonServer部署多模型到多GPU踩坑 | 京东云技术团队