LTX Video 工作流使用教程

2026-02-27
阅读：371

环境准备

系统要求

Python 3.10.5 或更高版本
CUDA 12.2 或更高版本
PyTorch >= 2.1.2

ComfyUI 环境

更新 ComfyUI 首先确保你的 ComfyUI 已更新到最新版本
安装 ComfyUI-LTXVideo 插件 有两种安装方式:

方式一：通过 ComfyUI Manager (推荐)

打开 ComfyUI Manager
搜索 “LTXVideo”
点击安装

方式二：手动安装

进入 ComfyUI 的 custom_nodes 目录
克隆仓库:

git clone https://github.com/Lightricks/ComfyUI-LTXVideo

安装依赖:

pip install -r requirements.txt

LTX Video 模型及相关模型下载

你需要下载以下模型文件：

模型名称	文件名	安装位置	下载链接
LTX Video 模型	`ltx-video-2b-v0.9.safetensors`	`models/checkpoints`	Hugging Face
PixArt 文本编码器	`model-00001-of-00002.safetensors`	`models/text_encoders/PixArt-XL-2-1024-MS/text_encoder`	Hugging Face
T5 文本编码器	`t5xxl_fp16.safetensors`	`models/text_encoders`	Hugging Face

注意:

PixArt 文本编码器需要下载完整的 text_encoder 文件夹内容

T5 文本编码器文件较大(约9.79GB),建议使用下载工具下载

文本到视频工作流

图像到视频工作流

视频到视频工作流

TX Video 使用限制说明

分辨率和帧数

分辨率必须是32的倍数
帧数必须是8的倍数+1(如65帧、257帧等)
建议分辨率不超过720x1280
建议帧数不超过257帧

提示词规范

必须使用英文
提示词越详细越好
建议包含场景、动作、细节等完整描述

工作流使用教程

基础节点说明

所有工作流都包含以下基础节点:

模型加载节点

LTXVLoader: 加载 LTX Video 主模型
- 选择 ltx-video-2b-v0.9.safetensors 文件
LTXVCLIPModelLoader: 加载文本编码器
- 选择 PixArt-XL-2-1024-MS/text_encoder/model-00001-of-00002.safetensors 文件
LTXVModelConfigurator: 配置模型参数
- 设置分辨率、帧数、FPS等基本参数
- 可选择是否启用 conditioning 输入

提示词处理节点

CLIPTextEncode (Positive): 正向提示词编码
- 使用 PixArt 编码器处理正向提示词
CLIPTextEncode (Negative): 负向提示词编码
- 使用 PixArt 编码器处理负向提示词
CFGGuider: 控制提示词引导强度
- 建议值范围: 2-7
- 数值越大,生成内容越接近提示词描述

采样控制节点

KSamplerSelect: 选择采样器
- 推荐使用 euler 采样器
BasicScheduler: 设置采样步数和调度器
- 步数范围: 10-25
- 调度器类型: normal
RandomNoise: 生成随机噪声
- 可设置固定种子以获得可重复的结果
SamplerCustomAdvanced: 执行采样过程
- 整合所有采样相关参数进行最终生成

输出节点

VAEDecode: 解码生成的帧
- 使用 LTX Video 内置的 VAE 解码器
VHS_VideoCombine: 合成最终视频
- 可设置输出视频的帧率、格式、编码参数
- 支持预览生成的视频

LTX Video 生成模式教程

文本到视频 (Text-to-Video)

设置基本参数 在 LTXVModelConfigurator 中:

分辨率: 768x512
帧数: 65 (约2.5秒)
FPS: 25

编写提示词

正向提示词要尽可能详细,描述场景、动作和细节
负向提示词建议包含: “worst quality, inconsistent motion, blurry, jittery, distorted, watermarks”

调整采样参数

Steps: 建议 20 步
CFG: 建议 4-7
Sampler: euler
Scheduler: normal

图像到视频 (Image-to-Video)

除了基本设置外,还需要:

准备参考图像

使用 LoadImage 节点加载参考图像
图像最好符合目标分辨率比例

调整转换参数

降低 CFG 值(建议 3-5)以保持与参考图像的一致性
可以适当减少采样步数(15-20)

视频到视频 (Video-to-Video)

加载源视频 使用 VHS_LoadVideo 节点:

设置适当的帧率
选择是否需要调整分辨率

参数调优

使用较低的 CFG (2-4)
减少采样步数(10-15)
适当调整 sigma_shift 参数

LTX Video 优化指南

参数优化

提示词优化
- 使用详细、具体的描述
- 包含动作、场景转换的描述
- 添加镜头语言相关的词汇
性能优化
- 适当降低分辨率提升速度
- 减少帧数进行测试
- 使用较少的采样步数
质量优化
- 画面抖动：降低 CFG 值
- 细节不足：增加采样步数
- 转场不自然：优化提示词描述

LTX Video 高级应用技巧

长视频制作

使用多个片段分别生成
通过提示词保持风格一致性
使用视频编辑工具进行后期衔接

风格控制

在提示词中加入具体的艺术风格描述
使用参考图像引导风格
通过 CFG 值调整风格强度

动作控制

在提示词中详细描述动作过程
使用关键帧作为参考
适当调整帧率以获得理想效果

环境准备

系统要求

ComfyUI 环境

LTX Video 模型及相关模型下载

文本到视频工作流

图像到视频工作流

视频到视频工作流

TX Video 使用限制说明

分辨率和帧数

提示词规范

工作流使用教程

基础节点说明

LTX Video 生成模式教程

文本到视频 (Text-to-Video)

图像到视频 (Image-to-Video)

视频到视频 (Video-to-Video)

LTX Video 优化指南

参数优化

LTX Video 高级应用技巧

长视频制作

风格控制

动作控制

部分评论 👉写评论

部分评论