优云智算-GPU实例使用指南
优云智算:GPU实例使用指南
推荐一个个人觉得比AutoDL更好用的GPU平台:优云智算,优云智算提供了一个高效、便捷的GPU算力平台,特别适合需要进行深度学习训练、科学计算等高性能计算任务的用户。相较于AutoDL和蓝耘等平台,在高峰期可能面临资源紧张的情况,优云智算提供了相对更易获取的GPU资源,并且实例直接分配公网IP,端口开放操作类似于阿里云等云服务商,使用起来非常方便。
一、创建GPU实例
创建GPU实例是使用优云智算的第一步。以下将详细介绍创建过程:
-
平台特点:
- 有效解决AutoDL和蓝耘等平台高峰期GPU资源难求的问题。
- 提供公网IP,方便直接访问和配置。
- 支持“无卡开机模式”,即在暂时不需要GPU时,可以保留实例配置和数据,仅支付少量存储和CPU费用,待需要时再挂载GPU,有效节约成本。
- 平台支持按天、按小时这种短期租赁,也支持包月长期租赁,满足各类短期任务或者长期稳定项目的需求;
- 计算资源、存储、网络一键配置,让客户拥有高效的云端编程和训练体验;
- 丰富社区镜像,提供多种场景的应用镜像,如:DeepSeek、Qwen、LLamaFactory、SD-webUI等;
- 利用容器的快速拉起特性,实现一键部署,5分钟快速上手AI,打造一个丰富的公共镜像库,以支持多样化的云计算和AI多样场景的需求。
-
注册与优惠:
推荐使用以下链接进行注册,首次注册并填写邀请码将获得10元代金券,直接点击跳转:
https://passport.compshare.cn/register?referral_code=tRej61o0bLFAfC9mS6Php
我的邀请码:
tRej61o0bLFAfC9mS6Php
-
部署实例步骤:
-
注册并登录后,进入控制台,点击“部署实例”按钮。
-
选择镜像与配置:
- 可以选择“社区镜像”或“平台镜像”。平台镜像通常预装了常用的深度学习框架和驱动,开箱即用。这里以平台镜像为例。
- 在右侧选择所需的GPU型号(如RTX 3090, A100等)和显卡数量。
- 数据盘:根据需求选择是否挂载数据盘以及数据盘大小,用于存储代码、数据集等。
- 其他配置(如系统盘大小)可以根据需求调整,或保持默认。
-
更多配置:
- 防火墙:建议开启,并根据需要配置规则(后续会详细说明)。
- CPU平台:可根据需求选择不同的CPU架构。
- 实例名称:为您的实例设置一个易于识别的名称。
-
确认所有配置无误后,点击“立即部署”。系统会开始创建实例,请耐心等待部署完成。
-
二、连接与管理实例
实例创建完成后,您需要连接到实例并进行管理。
-
查看实例状态:
在“实例列表”中,等待实例状态从“初始化中”变为绿色的“运行中”。
-
SSH连接实例:
获取登录信息:
- 外网IP:图中红色框内显示的IP地址即为实例的公网IP。
- SSH指令和密码:复制图中蓝色框内的
sshd
登录指令和初始密码。
连接步骤:
- 打开您的本地终端(如Windows的PowerShell/CMD,macOS的Terminal,或Linux的Shell)。
- 粘贴复制的SSH指令,例如
ssh root@xxx.xxx.xxx.xxx -p xxxxx
。 - 按回车键,首次连接会提示是否信任该主机,输入
yes
。 - 然后会提示输入密码,粘贴复制的初始密码(输入时密码不显示),按回车键即可登录。
- 建议登录后立即修改默认密码以增强安全性,使用
passwd
命令修改。
-
实例配置变更:
- 在实例列表的最右侧,点击对应实例的“三点”操作按钮,选择“更改配置”。
- 可进行的配置更改包括:
- 更改GPU数量:根据计算需求增加或减少GPU卡的数量(可能需要重启实例)。
- 扩容磁盘:增加系统盘或数据盘的存储空间。
- 更换系统镜像:如果需要不同的操作系统或预装环境,可以更换镜像(注意:更换镜像通常会导致系统盘数据丢失,请提前备份)。
- 在实例列表的最右侧,点击对应实例的“三点”操作按钮,选择“更改配置”。
-
防火墙配置:
在实例列表的最右侧,点击对应实例的“三点”操作按钮,选择“更多操作”,然后点击“配置防火墙”。
开放端口示例(例如开放8081端口):
- 点击“编辑防火墙规则”。
- 点击“添加规则”。
- 规则方向:入方向。
- 动作:允许。
- 协议类型:选择TCP或UDP(Web服务通常是TCP)。
- 端口范围:填写需要开放的端口,如
8081
;若要开放一个范围,如8000-8100
,则填写8000/8100
。 - 源IP:默认为
0.0.0.0/0
,表示允许所有IP访问。如有特定IP限制需求,可修改此项。 - 备注:可选,填写规则描述,如“开放Jupyter端口”。
- 点击“提交”使规则生效。
三、计费与价格
- 优云智算的计费方式通常包括按时计费和包月等多种模式,具体价格会因GPU型号、数量、地域等因素而异。
- 请在官方网站的计费说明页面或实例创建时的价格预览中查看最新的计费标准。
- 善用“无卡开机”模式可以在不使用GPU时显著降低费用。
四、数据管理与备份
- 数据盘使用:建议将重要的数据、代码和模型保存在挂载的数据盘中,而非系统盘。这样在更换系统镜像或实例发生故障时,数据盘的数据通常可以保留(具体策略请参考平台说明)。
- 定期备份:对于非常重要的数据,建议定期通过
scp
、rsync
等工具备份到本地或其他云存储服务。
五、常见问题与支持
- 无法连接实例:
- 检查实例是否处于“运行中”状态。
- 确认公网IP地址和SSH端口是否正确。
- 检查本地网络连接是否正常。
- 确认防火墙规则是否已正确配置,允许了SSH端口(默认为22,或实例指定的SSH端口)的访问。
- 驱动问题:如果使用自定义镜像或遇到驱动不匹配,可能需要手动安装或更新NVIDIA驱动和CUDA工具包。
- 获取支持:如果遇到难以解决的问题,可以通过平台提供的工单系统、在线客服或社区论坛寻求帮助。