chanjing-text-to-digital-person
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
ChineseChanjing Text To Digital Person
蝉镜文本转数字人
功能说明
功能说明
文生图、图生说话视频、可选 LoRA 训练与轮询;用户明确要求时下载生成物。凭据与权限见 。脚本不依赖 ffmpeg/ffprobe。
manifest.yaml文生图、图生说话视频、可选 LoRA 训练与轮询;用户明确要求时下载生成物。凭据与权限见 。脚本不依赖 ffmpeg/ffprobe。
manifest.yaml运行依赖
运行依赖
- python3 与同仓库 (含
scripts/*.py、_auth.py)_task_api.py - 无 ffmpeg/ffprobe 门控
- python3 与同仓库 (含
scripts/*.py、_auth.py)_task_api.py - 无 ffmpeg/ffprobe 依赖
环境变量与机器可读声明
环境变量与机器可读声明
- 环境变量键名与说明:(
manifest.yaml段)及本文environment - 变量、凭据模型、合规 、
permissions、clientPermissions:agentPolicymanifest.yaml
- 环境变量键名与说明:(
manifest.yaml段)及本文environment - 变量、凭据模型、合规 、
permissions、clientPermissions:agentPolicymanifest.yaml
使用命令
使用命令
- ClawHub(slug 以注册表为准):
clawhub run chanjing-text-to-digital-person - 本仓库:(见 Standard Workflow)
python skills/chanjing-text-to-digital-person/scripts/create_photo_task.py …
- ClawHub(slug 以注册表为准):
clawhub run chanjing-text-to-digital-person - 本仓库:(见 标准工作流程)
python skills/chanjing-text-to-digital-person/scripts/create_photo_task.py …
登记与审稿(单一事实来源)
登记与审稿(单一事实来源)
路径、 省略、、敏感字段、、可选 env 等:以 为准。实现上由 、 与各 CLI 脚本承担;本篇从 When to Use 起写流程。
primaryEnvpersistAccessTokenOnDiskagentPolicymanifest.yaml_auth.py_task_api.py路径、 省略、、敏感字段、、可选 env 等:以 为准。实现上由 、 与各 CLI 脚本承担;本篇从 何时使用本Skill 起介绍流程。
primaryEnvpersistAccessTokenOnDiskagentPolicymanifest.yaml_auth.py_task_api.pyWhen to Use This Skill
何时使用本Skill
当用户要做这些事时使用本 Skill:
- 根据人物提示词生成数字人形象图
- 把生成的人物图转成会说话的短视频
- 查询文生图 / 图生视频 / LoRA 任务状态
- 在用户明确要求时,把生成图片或视频下载到本地
如果需求是“上传真人素材训练定制数字人”,优先使用 。
如果需求是“拿已有数字人做口播视频合成”,优先使用。
chanjing-customised-person如果需求是“拿已有数字人做口播视频合成”,优先使用
chanjing-video-compose当用户有以下需求时使用本Skill:
- 根据人物提示词生成数字人形象图
- 将生成的人物图转换为会说话的短视频
- 查询文生图/图生视频/LoRA任务的状态
- 在用户明确要求时,将生成的图片或视频下载到本地
如果需求是“上传真人素材训练定制数字人”,优先使用 。
如果需求是“拿已有数字人做口播视频合成”,优先使用。
chanjing-customised-person如果需求是“拿已有数字人做口播视频合成”,优先使用
chanjing-video-composePreconditions
前置条件
执行本 Skill 前,必须先通过 完成 AK/SK 与 Token 校验。
chanjing-credentials-guard本 Skill 与 guard 共用:
~/.chanjing/credentials.jsonhttps://open-api.chanjing.cc
无凭证时,脚本会自动打开蝉镜登录页(若同仓库存在则执行 ,否则 ),并提示本地执行 。
chanjing-credentials-guard/scripts/open_login_page.pywebbrowser.openchanjing_config.py执行本Skill前,必须先通过 完成 AK/SK 与 Token 校验。
chanjing-credentials-guard本Skill与guard共用:
~/.chanjing/credentials.jsonhttps://open-api.chanjing.cc
若无有效凭证,脚本将自动打开蝉镜登录页面(若同仓库存在则执行该脚本,否则调用),并提示本地执行。
chanjing-credentials-guard/scripts/open_login_page.pywebbrowser.openchanjing_config.py审阅与安全(凭据)
审阅与安全(凭据)
与 Purpose / Credentials / Persistence 相关的逐项说明见 (缺凭证时可能子进程调用 guard 的 等行为见 )。
manifest.yamlopen_login_page.pyclientPermissions与 用途/凭据/持久化 相关的逐项说明见 (缺凭证时可能子进程调用 guard 的 等行为见 )。
manifest.yamlopen_login_page.pyclientPermissionsStandard Workflow
标准工作流程
主流程通常分两段,且都是异步任务:
- 调用 创建文生图任务,得到
create_photo_task.pyphoto_unique_id - 调用 轮询到成功,选一张
poll_photo_task.pyphoto_path - 调用 创建图生视频任务,得到
create_motion_task.pymotion_unique_id - 调用 轮询到成功,得到最终
poll_motion_task.pyvideo_url - 只有在用户明确要求保存到本地时,才调用
download_result.py
可选扩展:
- 若用户想做 LoRA 训练,调用 和
create_lora_task.pypoll_lora_task.py - 成功后会返回一条
poll_lora_task.py,可继续用photo_task_id拿图poll_photo_task.py
主流程通常分为两个阶段,均为异步任务:
- 调用 创建文生图任务,获取
create_photo_task.pyphoto_unique_id - 调用 轮询文生图任务直至完成,获取默认首张图 URL
poll_photo_task.py - 调用 创建图生视频任务,获取
create_motion_task.pymotion_unique_id - 调用 轮询图生视频任务直至完成,获取最终
poll_motion_task.pyvideo_url - 仅在用户明确要求保存到本地时,才调用
download_result.py
可选扩展流程:
- 若用户需要进行LoRA训练,调用 和
create_lora_task.pypoll_lora_task.py - 执行成功后会返回一个
poll_lora_task.py,可继续使用photo_task_id获取生成的图片poll_photo_task.py
Covered APIs
已覆盖的API
本 Skill 当前覆盖:
POST /open/v1/aigc/photoGET /open/v1/aigc/photo/taskGET /open/v1/aigc/photo/task/pagePOST /open/v1/aigc/motionGET /open/v1/aigc/motion/taskPOST /open/v1/aigc/lora/task/createGET /open/v1/aigc/lora/task
本Skill当前覆盖以下API:
POST /open/v1/aigc/photoGET /open/v1/aigc/photo/taskGET /open/v1/aigc/photo/task/pagePOST /open/v1/aigc/motionGET /open/v1/aigc/motion/taskPOST /open/v1/aigc/lora/task/createGET /open/v1/aigc/lora/task
Scripts
脚本说明
脚本目录:
skills/chanjing-text-to-digital-person/scripts/
脚本目录:
skills/chanjing-text-to-digital-person/scripts/
本仓库随附文件(勿与仅含 _auth.py
的精简包混淆)
_auth.py本仓库随附文件(勿与仅含 _auth.py
的精简包混淆)
_auth.py完整包内含 、(供任务脚本复用)及下列 CLI;请用 调用(与仓库内其它蝉镜 skill 约定一致)。
_auth.py_task_api.py.pypython3 <路径>/<脚本名>.py| 文件名(仓库内) | 说明 |
|---|---|
| 读 |
| 任务 API 共用逻辑(由各 CLI import) |
| 创建文生图任务 → |
| 单个文生图任务详情 |
| 任务列表( |
| 轮询文生图至完成 → 默认首张图 URL |
| 创建图生视频 → |
| 单个图生视频任务详情 |
| 轮询图生视频至完成 → 默认视频 URL |
| 创建 LoRA 训练 → |
| LoRA 任务详情 |
| 轮询 LoRA 至完成 → 默认首条 |
| 仅在需要落盘时:下载到 |
若环境中 缺少 上表任一入口或 ,属于 分发/打包不完整。
_task_api.py完整包包含**、(供各任务脚本复用)及以下命令行工具**;请使用****调用(与仓库内其他蝉镜skill约定一致)。
_auth.py_task_api.py.pypython3 <路径>/<脚本名>.py| 文件名(仓库内) | 说明 |
|---|---|
| 读取 |
| 任务API共用逻辑(由各命令行工具导入) |
| 创建文生图任务 → |
| 查询单个文生图任务详情 |
| 查询任务列表( |
| 轮询文生图任务直至完成 → 返回默认首张图URL |
| 创建图生视频任务 → |
| 查询单个图生视频任务详情 |
| 轮询图生视频任务直至完成 → 返回默认视频URL |
| 创建LoRA训练任务 → |
| 查询LoRA任务详情 |
| 轮询LoRA训练任务直至完成 → 返回默认首条 |
| 仅在需要本地存储时使用:下载至 |
若环境中缺少上表任一入口脚本或**,则属于分发/打包不完整**。
_task_api.pyUsage Examples
使用示例
示例 1:文生图后直接图生视频
bash
PHOTO_TASK_ID=$(python3 skills/chanjing-text-to-digital-person/scripts/create_photo_task.py \
--age "Young adult" \
--gender Female \
--number-of-images 1 \
--industry "教育培训" \
--background "现代直播间背景" \
--detail "短发,亲和力强,职业装" \
--talking-pose "上半身特写,站立讲解")
PHOTO_URL=$(python3 skills/chanjing-text-to-digital-person/scripts/poll_photo_task.py \
--unique-id "$PHOTO_TASK_ID")
MOTION_TASK_ID=$(python3 skills/chanjing-text-to-digital-person/scripts/create_motion_task.py \
--photo-unique-id "$PHOTO_TASK_ID" \
--photo-path "$PHOTO_URL" \
--emotion "自然播报,语气清晰自信" \
--gesture)
python3 skills/chanjing-text-to-digital-person/scripts/poll_motion_task.py \
--unique-id "$MOTION_TASK_ID"示例 2:LoRA 训练
bash
LORA_ID=$(python3 skills/chanjing-text-to-digital-person/scripts/create_lora_task.py \
--name "演示LoRA" \
--photo-url https://example.com/1.jpg \
--photo-url https://example.com/2.jpg \
--photo-url https://example.com/3.jpg \
--photo-url https://example.com/4.jpg \
--photo-url https://example.com/5.jpg)
python3 skills/chanjing-text-to-digital-person/scripts/poll_lora_task.py \
--lora-id "$LORA_ID"示例1:文生图后直接生成图生视频
bash
PHOTO_TASK_ID=$(python3 skills/chanjing-text-to-digital-person/scripts/create_photo_task.py \
--age "Young adult" \
--gender Female \
--number-of-images 1 \
--industry "教育培训" \
--background "现代直播间背景" \
--detail "短发,亲和力强,职业装" \
--talking-pose "上半身特写,站立讲解")
PHOTO_URL=$(python3 skills/chanjing-text-to-digital-person/scripts/poll_photo_task.py \
--unique-id "$PHOTO_TASK_ID")
MOTION_TASK_ID=$(python3 skills/chanjing-text-to-digital-person/scripts/create_motion_task.py \
--photo-unique-id "$PHOTO_TASK_ID" \
--photo-path "$PHOTO_URL" \
--emotion "自然播报,语气清晰自信" \
--gesture)
python3 skills/chanjing-text-to-digital-person/scripts/poll_motion_task.py \
--unique-id "$MOTION_TASK_ID"示例2:LoRA训练
bash
LORA_ID=$(python3 skills/chanjing-text-to-digital-person/scripts/create_lora_task.py \
--name "演示LoRA" \
--photo-url https://example.com/1.jpg \
--photo-url https://example.com/2.jpg \
--photo-url https://example.com/3.jpg \
--photo-url https://example.com/4.jpg \
--photo-url https://example.com/5.jpg)
python3 skills/chanjing-text-to-digital-person/scripts/poll_lora_task.py \
--lora-id "$LORA_ID"Download Rule
下载规则
下载是显式动作,不是默认动作:
- 和
poll_photo_task.py成功后应先返回远端 URLpoll_motion_task.py - 不要自动下载结果文件
- 只有当用户明确表达“下载到本地”“保存到 outputs”“帮我落盘”时,才执行
download_result.py
下载为显式操作,而非默认行为:
- 和
poll_photo_task.py执行成功后应优先返回远端URLpoll_motion_task.py - 请勿自动下载结果文件
- 仅当用户明确表达“下载到本地”“保存到outputs”“帮我落盘”等需求时,才执行
download_result.py
Output Convention
输出约定
默认本地输出目录:
outputs/text-to-digital-person/
默认本地输出目录:
outputs/text-to-digital-person/
Additional Resources
更多资源
更多接口细节见:
skills/chanjing-text-to-digital-person/reference.mdskills/chanjing-text-to-digital-person/examples.md
更多接口细节请参考:
skills/chanjing-text-to-digital-person/reference.mdskills/chanjing-text-to-digital-person/examples.md