【AIGC前沿】MiniMax海螺AI视频——图片/文本生成高质量视频_海螺图生视频token
目录
1.MiniMax海螺AI视频简介
2.使用教程
1.MiniMax海螺AI视频简介
海螺视频,作为 MiniMax 旗下海螺 AI 平台精心打造的 AI 视频生成工具,致力于助力用户产出高品质视频内容。该工具依托 abab-video-1 模型,具备强大的文生视频功能。用户仅需输入关键词或简短语句,海螺视频就能据此创作出情节丰富的完整视频。此外,海螺视频运用 DiT 架构,能够精准模拟现实世界的物理规律,尤其在生成复杂场景与高动作场景时,展现出卓越的性能。
2.使用教程
点击如下链接,进入蓝耘元生代智算云平台主页
https://cloud.lanyun.net/#/registerPage?promoterCode=11f606c51e
点击主页上方栏的“MaaS平台”
然后点击左侧栏的“视觉模型”
可以看到可以免费体验一次I2V-01图片生成视频
点击如下红框处将图片上传
例如输入如下的图片
例如想让小狗动起来,可以在如下红框处输入相应的指令,然后点击立即生成 , 等待一段时间后,视频即可生成出来
视觉模型API
Video Generation(视频生成)
该API支持基于用户提供的prompt、首帧图片、主体参考图片,生成720p,25帧的动态视频。
该接口采用异步调用的方式完成视频生成:首先创建视频生成任务,对应接口会返回任务ID(task_id);接下来,在异步任务查询接口通过任务 ID (task_id),获取视频生成任务的状态,以及生成的视频的文件ID(file_id)。
API说明
完成视频生成及下载,使用到三个API:创建视频生成任务、查询视频生成任务状态文件管理。具体步骤如下:
1.使用创建视频生成任务接口,创建视频生成任务,并得到task_id;
2.使用查询视频生成任务状态接口,基于task_id查询视频生成任务状态;当状态为成功时,将获得对应的文件 ID(file_id);
3.使用文件管理接口(File API)基于步骤2查询接口返回的file_id进行视频生成结果的查看和下载。
创建视频生成任务API
POST https://maas-api.lanyun.net/v1/video_generation
请求示例(Python)
import requestsimport jsonurl = \"https://maas-api.lanyun.net/v1/video_generation\"payload = json.dumps({ \"model\": \"I2V-01-Director\", \"prompt\": \"测试12312312313\", \"promptOptimizer\": \"true\", \"firstFrameImage\": \"data:image/jpeg;base64,{image_base64_data}\"})headers = { \'Authorization\': \'Bearer sk-******************\', \'Content-Type\': \'application/json\'}response = requests.request(\"POST\", url, headers=headers, data=payload)print(response.text)
请求示例(Crul)
curl --location --request POST \'https://maas-api.lanyun.net/v1/video_generation\' \\--header \'Authorization: Bearer sk-*****************\' \\--header \'Content-Type: application/json\' \\--data-raw \'{ \"model\": \"I2V-01\", \"prompt\": \"起风了\", \"promptOptimizer\": true, \"firstFrameImage\": \"\"}\'
返回示例
{ \"task_id\": \"174741320903036928\", \"base_resp\": { \"status_code\": 0, \"status_msg\": \"success\" }}
firstFrameImage
本参数当model选择为I2V-01I2V-01-DirectorI2V-01-live时,为必填参数。模型将以此参数中传入的图片为首帧画面来生成视频。支持传入图片的data:image/jpeg;base64,{data}格式的 Base64 编码字符串,或可通过公网访问的 URL。传入此参数时支持将prompt设置为空字符串或不传入prompt,模型将自主决定画面如何演变。
传入图片需要满足以下条件:
- 格式为JPG/JPEG/PNG;
- 长宽比大于2:5、小于5:2;
- 短边像素大于300px;
- 体积不大于20MB。
状态码及其详情。
base_resp.status_code
状态码及其分别含义如下:
0:请求成功;
1002:触发限流,请稍后再试;
1004:账号鉴权失败,请检查 API-Key 是否填写正确;
1008:账号余额不足;
1026:视频描述涉及敏感内容,请调整;
2013:传入参数异常,请检查入参是否按要求填写;
2049:无效的api key,请检查api key。
base_resp.status_msg
具体错误详情
其他说明: 当参数model选择为T2V-01-DirectorI2V-01-Director时,对prompt中的运镜控制,有更准确的响应。
-
支持插入运镜指令,实现运镜控制:运镜指令需以[ ]格式插入prompt中镜头应用处,标准运镜指令格式为[C1,C2,C3],其中C表示不同类型运镜,共支持15种枚举运镜方式,具体可参考下方详情。为保证运镜效果,建议组合运镜指令不超过3个。 1、支持15种运镜方式(枚举值) (1) 左右移:[左移]、[右移] (2)左右摇:[左摇]、[右摇] (3)推拉:[推进]、[拉远] (4)升降:[上升]、[下降] (5)上下摇:[上摇]、[下摇] (6)变焦:[变焦推近]、[变焦拉远] (7)晃动:[晃动] (8)跟随:[跟随] (9)固定:[固定] 2、支持单一及组合运镜 (1)单一运镜:例如[左摇],表示插入单一镜头; (2)多运镜同时生效:同一组内的镜头表示同时生效,如[左摇,右移],表示插入两个组合镜头,且同时生效; (3)多运镜先后生效:插入在前的镜头指令,先生效。如在prompt描述“xxx[左摇],xxx[右移] ” 表示:视频生成时,先运行左摇镜头,后运行右移镜头;
-
支持通过自然语言描述,实现运镜控制;使用指令内运镜名称,会提升运镜响应准确性。
-
运镜指令与自然语言描述可同时生效。
查询视频生成任务状态API
GET https://maas-api.lanyun.net/v1/query/video_generation?taskId={task_id}
请求示例(Python)
import requestsimport jsonapi_key=\"sk-*************\"task_id=\"174847042751959040\"url = f\"https://maas-api.lanyun.net/v1/query/video_generation?taskId={task_id}\"payload = {}headers = { \'authorization\': f\'Bearer {api_key}\'}response = requests.request(\"GET\", url, headers=headers, data=payload)print(response.text)
请求示例(Crul)
curl --location --request GET \'https://maas-api.lanyun.net/v1/query/video_generation?taskId=174741320903036928\' \\--header \'Authorization: Bearer sk-**************\'
返回示例
{ \"taskId\": \"174741320903036928\", \"status\": \"Success\", \"videoWidth\": null, \"videoHeight\": null, \"videoDownLoadUrl\": \"https://oss.lanyun.net/private//cloud-maas/11564/16/2025-03-11/32206a67-5265-4db9-a0c8-081d38653943.mp4?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=G54Tgw7wJRAKeBOej7Rz%2F20250311%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20250311T030018Z&X-Amz-Expires=86400&X-Amz-SignedHeaders=host&X-Amz-Signature=e3a77757c844412a6dfc24f1770b6a201041027eda8691f6493b28011927b539\"}
status
任务状态,包括以下状态:
Preparing-准备中
Queueing-队列中
Processing-生成中
Success-成功
Fail-失败