实例启动时拉起进程
在 GPUGEEK 平台使用该功能可以在实例启动的同时自动帮您拉起进程或者任务,该功能主要适用于以下场景:
- 实例开机即启动您需要的进程。
- 推理任务,比如您需要扩容某个功能节点,只需要创建实例即可自动拉起您的推理任务,来接收请求。
- 特定的Web项目,比如
Stable Diffusion web UI
。 - Job任务制项目,开启实例后及运行,然后配合平台的定时关机功能来实现任务结束即关机。
- 特定的训练场景或某些监控任务。
该功能必须在创建实例的时候指定要运行的命令
下面演示以下几种对于该功能的用法
- 实例启动时拉起一个官方镜像中已存在的项目
- 实例启动时拉起一个训练项目
- 实例启动时拉起一个推理项目
- 实例启动时拉起一个脚本来同时拉起多个项目
- 实例启动时拉起一个 Web 项目,拉起后直接公网访问
1. 实例启动时拉起一个官方镜像中已存在的项目
进入 GPUGEEK控制台 去创建实例,选择实例镜像,展开高级配置,填写入口命令,该入口命令即为实例启动同时会执行的任务,我这里选择的为官方镜像。
python -m http.server 8080
选择完成后点击右下角的【创建实例】
2. 登录实例
可以通过控制台中对应实例的 JupyterLab
点击进去,打开终端查看
或者通过 SSH登录实例 方式进入实例
3. 验证进程是否拉起
通过 ps aux | grep [进程名称]
来获取是否拉起进程
注意
验证无误后,该实例的每次启动都会拉起 python -m http.server 8080
这个任务,如果 python -m http.server 8080
任务执行失败,也不会影响实例正常启动。
2. 实例启动时拉起一个训练项目
提示
默认情况下使用官方镜像是没有您需要训练的项目,正确的做法应该按照如下流程:
- 使用官方镜像创建一台实例。
- 进入实例准备训练代码。
- 实例关机-实例管理-更多-备份镜像。
- 使用备份镜像去创建实例-高级配置-入口命令-指定实例启动时需要拉起的训练任务。
- 创建实例-进入实例验证是否在训练。
3. 实例启动时拉起一个推理项目
提示
默认情况下使用官方镜像是没有您的推理项目,正确的做法应该按照如下流程:
- 使用官方镜像创建一台实例。
- 进入实例准备您的推理项目和数据,如果在没有网盘的数据中心则需要把数据存在系统盘。
- 实例关机-实例管理-更多-备份镜像。
- 使用备份镜像去创建实例-高级配置-入口命令-指定实例启动时需要拉起的推理任务。
- 创建实例-进入实例验证推理任务是否已拉起。
4. 实例启动时拉起一个脚本来同时拉起多个项目
提示
默认情况下使用官方镜像是没有您要拉起的脚本,正确的做法应该按照如下流程:
- 使用官方镜像创建一台实例。
- 进入实例准备您需要拉起的脚本,以及脚本内容中需要拉起的任务,脚本中如果有多个任务需要拉起,则最后一个任务前的所有任务需要通过 nohup 来后台运行。
- 实例关机-实例管理-更多-备份镜像。
- 使用备份镜像去创建实例-高级配置-入口命令-指定实例启动时需要拉起的脚本。
- 创建实例-进入实例验证是否已拉起脚本并且脚本中的任务是否拉起。
5. 实例启动时拉起一个 Web 项目进行
提示
默认情况下使用官方镜像是没有您要拉起的 Web 项目,正确的做法应该按照如下流程:
- 使用官方镜像创建一台实例。
- 进入实例准备您需要拉起的 Web 项目,手动测试 Web 项目 是否可以正常启动。
- 实例关机-实例管理-更多-备份镜像。
- 使用备份镜像去创建实例-高级配置-入口命令-指定实例启动时需要拉起的 Web 项目。
- 创建实例-进入实例验证是否已拉起您指定的 Web 项目。