跳到主要内容

模型价格

模型调用

官方模型

官方模型为平台或官方合作发布的模型服务,拥有更稳定高效的调用体验。模型调用价格根据模型任务类型不同而有所区别,其中文本对话模型按照 Token 输入输出量进行计费,图片与视频生成类按照每次输出的图片或视频数进行计费。

文本对话

模型名称计费单位输入价格 (元)输出价格 (元)
GpuGeek/DeepSeek-R1-671B/百万Tokens832
GpuGeek/DeepSeek-R1-Distill-Llama-70B/百万Tokens28
GpuGeek/DeepSeek-R1-Distill-Qwen-32B/百万Tokens1.56
GpuGeek/DeepSeek-R1-Distill-Qwen-14B/百万Tokens0.62.4
GpuGeek/DeepSeek-R1-Distill-Llama-8B/百万Tokens0.40.8
GpuGeek/DeepSeek-R1-Distill-Qwen-7B/百万Tokens0.40.8
GpuGeek/DeepSeek-R1-Distill-Qwen-1.5B/百万Tokens0.20.4
GpuGeek/qwen2.5-0.5B/百万Tokens0.10.2

文生图像

模型名称计费单位输出价格 (元)
GpuGeek/Stable-Diffusion-3.5-Large-Turbo/图片0.15
GpuGeek/Cogview4-6B/图片0.15

文生视频

模型名称时长与分辨率计费单位输出价格 (元)
Vidu/text2video-1.54S360P/视频1.25
Vidu/text2video-1.5-HD4S720P/视频3.13
Vidu/text2video-1.5-FHD4S1080P、8S720P/视频6.25

图生视频

模型名称时长与分辨率计费单位输出价格 (元)
Vidu/image2video-2.04S720p/视频1.25
Vidu/image2video-2.0-HD4S1080p、8S720p/视频3.125

个人公开模型

个人发布的公开模型,调用价格根据每次调用运行时长进行计费,单位时长的费用取决于模型发布者设置的硬件选择。当前支持的硬件类型如下:

硬件类型计费单位价格 (元)
RTX-4090-24G/卡2.18/小时

私有模型

个人发布的私有模型,按照模型设置的硬件的在线时长进行计费,在线计费时长包括模型启动的时长、处理请求的运行时长、模型启动后的空闲时长。当模型不再接收任何请求,大约10分钟模型将变为冷启动状态,此时不占用硬件,不会产生计费。

硬件类型计费单位价格 (元)
RTX-4090-24G/卡2.18/小时

模型部署

硬件类型计费单位价格 (元)
RTX-4090-24G/卡2.18/小时