A帮手 - 常用软件下载安装教程 | 网盘资源下载 | 绿色软件下载

LTX Video 工作流使用教程

  • 2026-02-27
  • 阅读:8

环境准备

系统要求

  • Python 3.10.5 或更高版本
  • CUDA 12.2 或更高版本
  • PyTorch >= 2.1.2

ComfyUI 环境

  1. 更新 ComfyUI 首先确保你的 ComfyUI 已更新到最新版本

  2. 安装 ComfyUI-LTXVideo 插件 有两种安装方式:

方式一:通过 ComfyUI Manager (推荐)

  1. 打开 ComfyUI Manager
  2. 搜索 “LTXVideo”
  3. 点击安装

方式二:手动安装

  1. 进入 ComfyUI 的 custom_nodes 目录
  2. 克隆仓库:
git clone https://github.com/Lightricks/ComfyUI-LTXVideo
  1. 安装依赖:
pip install -r requirements.txt

LTX Video 模型及相关模型下载

你需要下载以下模型文件:

模型名称 文件名 安装位置 下载链接
LTX Video 模型 ltx-video-2b-v0.9.safetensors models/checkpoints Hugging Face
PixArt 文本编码器 model-00001-of-00002.safetensors models/text_encoders/PixArt-XL-2-1024-MS/text_encoder Hugging Face
T5 文本编码器 t5xxl_fp16.safetensors models/text_encoders Hugging Face

注意:

  1. PixArt 文本编码器需要下载完整的 text_encoder 文件夹内容
  2. T5 文本编码器文件较大(约9.79GB),建议使用下载工具下载

 

文本到视频工作流

图像到视频工作流

视频到视频工作流

TX Video 使用限制说明

分辨率和帧数

  • 分辨率必须是32的倍数
  • 帧数必须是8的倍数+1(如65帧、257帧等)
  • 建议分辨率不超过720x1280
  • 建议帧数不超过257帧

提示词规范

  • 必须使用英文
  • 提示词越详细越好
  • 建议包含场景、动作、细节等完整描述

工作流使用教程

基础节点说明

所有工作流都包含以下基础节点:

  1. 模型加载节点
  • LTXVLoader: 加载 LTX Video 主模型
    • 选择 ltx-video-2b-v0.9.safetensors 文件
  • LTXVCLIPModelLoader: 加载文本编码器
    • 选择 PixArt-XL-2-1024-MS/text_encoder/model-00001-of-00002.safetensors 文件
  • LTXVModelConfigurator: 配置模型参数
    • 设置分辨率、帧数、FPS等基本参数
    • 可选择是否启用 conditioning 输入
  1. 提示词处理节点
  • CLIPTextEncode (Positive): 正向提示词编码
    • 使用 PixArt 编码器处理正向提示词
  • CLIPTextEncode (Negative): 负向提示词编码
    • 使用 PixArt 编码器处理负向提示词
  • CFGGuider: 控制提示词引导强度
    • 建议值范围: 2-7
    • 数值越大,生成内容越接近提示词描述
  1. 采样控制节点
  • KSamplerSelect: 选择采样器
    • 推荐使用 euler 采样器
  • BasicScheduler: 设置采样步数和调度器
    • 步数范围: 10-25
    • 调度器类型: normal
  • RandomNoise: 生成随机噪声
    • 可设置固定种子以获得可重复的结果
  • SamplerCustomAdvanced: 执行采样过程
    • 整合所有采样相关参数进行最终生成
  1. 输出节点
  • VAEDecode: 解码生成的帧
    • 使用 LTX Video 内置的 VAE 解码器
  • VHS_VideoCombine: 合成最终视频
    • 可设置输出视频的帧率、格式、编码参数
    • 支持预览生成的视频

LTX Video 生成模式教程

文本到视频 (Text-to-Video)

  1. 设置基本参数 在 LTXVModelConfigurator 中:
  • 分辨率: 768x512
  • 帧数: 65 (约2.5秒)
  • FPS: 25
  1. 编写提示词
  • 正向提示词要尽可能详细,描述场景、动作和细节
  • 负向提示词建议包含: “worst quality, inconsistent motion, blurry, jittery, distorted, watermarks”
  1. 调整采样参数
  • Steps: 建议 20 步
  • CFG: 建议 4-7
  • Sampler: euler
  • Scheduler: normal

图像到视频 (Image-to-Video)

除了基本设置外,还需要:

  1. 准备参考图像
  • 使用 LoadImage 节点加载参考图像
  • 图像最好符合目标分辨率比例
  1. 调整转换参数
  • 降低 CFG 值(建议 3-5)以保持与参考图像的一致性
  • 可以适当减少采样步数(15-20)

视频到视频 (Video-to-Video)

  1. 加载源视频 使用 VHS_LoadVideo 节点:
  • 设置适当的帧率
  • 选择是否需要调整分辨率
  1. 参数调优
  • 使用较低的 CFG (2-4)
  • 减少采样步数(10-15)
  • 适当调整 sigma_shift 参数

LTX Video 优化指南

参数优化

  1. 提示词优化

    • 使用详细、具体的描述
    • 包含动作、场景转换的描述
    • 添加镜头语言相关的词汇
  2. 性能优化

    • 适当降低分辨率提升速度
    • 减少帧数进行测试
    • 使用较少的采样步数
  3. 质量优化

    • 画面抖动:降低 CFG 值
    • 细节不足:增加采样步数
    • 转场不自然:优化提示词描述

LTX Video 高级应用技巧

长视频制作

  • 使用多个片段分别生成
  • 通过提示词保持风格一致性
  • 使用视频编辑工具进行后期衔接

风格控制

  • 在提示词中加入具体的艺术风格描述
  • 使用参考图像引导风格
  • 通过 CFG 值调整风格强度

动作控制

  • 在提示词中详细描述动作过程
  • 使用关键帧作为参考
  • 适当调整帧率以获得理想效果

部分评论