模型调用
官方模型
官方模型为平台或官方合作发布的模型服务,拥有更稳定高效的调用体验。模型调用价格根据模型任务类型不同而有所区别,其中文本对话模型按照 Token 输入输出量进行计费,图片与视频生成类按照每次输出的图片或视频数进行计费。
文本对话
模型名称 | 计费单位 | 输入价格 (元) | 输出价格 (元) |
---|
GpuGeek/DeepSeek-R1-671B | /百万Tokens | 8 | 32 |
GpuGeek/DeepSeek-R1-Distill-Llama-70B | /百万Tokens | 2 | 8 |
GpuGeek/DeepSeek-R1-Distill-Qwen-32B | /百万Tokens | 1.5 | 6 |
GpuGeek/DeepSeek-R1-Distill-Qwen-14B | /百万Tokens | 0.6 | 2.4 |
GpuGeek/DeepSeek-R1-Distill-Llama-8B | /百万Tokens | 0.4 | 0.8 |
GpuGeek/DeepSeek-R1-Distill-Qwen-7B | /百万Tokens | 0.4 | 0.8 |
GpuGeek/DeepSeek-R1-Distill-Qwen-1.5B | /百万Tokens | 0.2 | 0.4 |
GpuGeek/qwen2.5-0.5B | /百万Tokens | 0.1 | 0.2 |
文生图像
模型名称 | 计费单位 | 输出价格 (元) |
---|
GpuGeek/Stable-Diffusion-3.5-Large-Turbo | /图片 | 0.15 |
GpuGeek/Cogview4-6B | /图片 | 0.15 |
文生视频
模型名称 | 时长与分辨率 | 计费单位 | 输出价格 (元) |
---|
Vidu/text2video-1.5 | 4S360P | /视频 | 1.25 |
Vidu/text2video-1.5-HD | 4S720P | /视频 | 3.13 |
Vidu/text2video-1.5-FHD | 4S1080P、8S720P | /视频 | 6.25 |
图生视频
模型名称 | 时长与分辨率 | 计费单位 | 输出价格 (元) |
---|
Vidu/image2video-2.0 | 4S720p | /视频 | 1.25 |
Vidu/image2video-2.0-HD | 4S1080p、8S720p | /视频 | 3.125 |
个人公开模型
个人发布的公开模型,调用价格根据每次调用运行时长进行计费,单位时长的费用取决于模型发布者设置的硬件选择。当前支持的硬件类型如下:
硬件类型 | 计费单位 | 价格 (元) |
---|
RTX-4090-24G | /卡 | 2.18/小时 |
私有模型
个人发布的私有模型,按照模型设置的硬件的在线时长进行计费,在线计费时长包括模型启动的时长、处理请求的运行时长、模型启动后的空闲时长。当模型不再接收任何请求,大约10分钟模型将变为冷启动
状态,此时不占用硬件,不会产生计费。
硬件类型 | 计费单位 | 价格 (元) |
---|
RTX-4090-24G | /卡 | 2.18/小时 |
模型部署
硬件类型 | 计费单位 | 价格 (元) |
---|
RTX-4090-24G | /卡 | 2.18/小时 |