模型价格

模型调用

官方模型为平台或官方合作发布的模型服务，拥有更稳定高效的调用体验。模型调用价格根据模型任务类型不同而有所区别，其中文本对话模型按照 Token 输入输出量进行计费，图片与视频生成类按照每次输出的图片或视频数进行计费。

模型名称	计费单位	输入价格 (元)	输出价格 (元)
GpuGeek/DeepSeek-R1-671B	/百万Tokens	8	32
GpuGeek/DeepSeek-R1-Distill-Llama-70B	/百万Tokens	2	8
GpuGeek/DeepSeek-R1-Distill-Qwen-32B	/百万Tokens	1.5	6
GpuGeek/DeepSeek-R1-Distill-Qwen-14B	/百万Tokens	0.6	2.4
GpuGeek/DeepSeek-R1-Distill-Llama-8B	/百万Tokens	0.4	0.8
GpuGeek/DeepSeek-R1-Distill-Qwen-7B	/百万Tokens	0.4	0.8
GpuGeek/DeepSeek-R1-Distill-Qwen-1.5B	/百万Tokens	0.2	0.4
GpuGeek/qwen2.5-0.5B	/百万Tokens	0.1	0.2

模型名称	计费单位	输出价格 (元)
GpuGeek/Stable-Diffusion-3.5-Large-Turbo	/图片	0.15
GpuGeek/Cogview4-6B	/图片	0.15

模型名称	时长与分辨率	计费单位	输出价格 (元)
Vidu/text2video-1.5	4S360P	/视频	1.25
Vidu/text2video-1.5-HD	4S720P	/视频	3.13
Vidu/text2video-1.5-FHD	4S1080P、8S720P	/视频	6.25

模型名称	时长与分辨率	计费单位	输出价格 (元)
Vidu/image2video-2.0	4S720p	/视频	1.25
Vidu/image2video-2.0-HD	4S1080p、8S720p	/视频	3.125

个人发布的公开模型，调用价格根据每次调用运行时长进行计费，单位时长的费用取决于模型发布者设置的硬件选择。当前支持的硬件类型如下：

硬件类型	计费单位	价格 (元)
RTX-4090-24G	/卡	2.18/小时

个人发布的私有模型，按照模型设置的硬件的在线时长进行计费，在线计费时长包括模型启动的时长、处理请求的运行时长、模型启动后的空闲时长。当模型不再接收任何请求，大约10分钟模型将变为冷启动状态，此时不占用硬件，不会产生计费。

硬件类型	计费单位	价格 (元)
RTX-4090-24G	/卡	2.18/小时

硬件类型	计费单位	价格 (元)
RTX-4090-24G	/卡	2.18/小时