qwen: Implement transformer block prefetching

2026-03-08 02:37:42 +08:00 · 2025-11-02 02:36:40 +10:00 · 2025-11-02 02:36:40 +10:00 · 0814c1f63f
commit 0814c1f63f
parent e279e1f26e
1 changed files with 6 additions and 0 deletions
--- a/comfy/ldm/qwen_image/model.py
+++ b/comfy/ldm/qwen_image/model.py
@ -387,6 +387,9 @@ class QwenImageTransformer2DModel(nn.Module):
        hidden_states, img_ids, orig_shape = self.process_img(x)
        num_embeds = hidden_states.shape[1]

+        prefetch_queue = comfy.ops.make_prefetch_queue(list(self.transformer_blocks))
+        comfy.ops.prefetch_queue_pop(prefetch_queue, x.device, None)
+
        if ref_latents is not None:
            h = 0
            w = 0
@ -436,6 +439,7 @@ class QwenImageTransformer2DModel(nn.Module):
        blocks_replace = patches_replace.get("dit", {})

        for i, block in enumerate(self.transformer_blocks):
+            comfy.ops.prefetch_queue_pop(prefetch_queue, x.device, block)
            if ("double_block", i) in blocks_replace:
                def block_wrap(args):
                    out = {}
@ -467,6 +471,8 @@ class QwenImageTransformer2DModel(nn.Module):
                    if add is not None:
                        hidden_states[:, :add.shape[1]] += add

+        comfy.ops.prefetch_queue_pop(prefetch_queue, x.device, block)
+
        hidden_states = self.norm_out(hidden_states, temb)
        hidden_states = self.proj_out(hidden_states)