Use optimized attention in Dino2AttentionBlock.

2026-07-01 12:19:30 +08:00 · 2026-06-08 12:46:58 +02:00 · 2026-06-08 12:46:58 +02:00 · 8cbdd8f72e
commit 8cbdd8f72e
parent 15f4dc401a
1 changed files with 1 additions and 2 deletions
--- a/comfy/image_encoders/dino2.py
+++ b/comfy/image_encoders/dino2.py
@ -53,8 +53,7 @@ class Dino2AttentionBlock(torch.nn.Module):
        if rope is not None and pos is not None:
            q = rope(q, pos)
            k = rope(k, pos)
-        out = F.scaled_dot_product_attention(q, k, v, attn_mask=mask)
-        out = out.transpose(1, 2).reshape(B, N, C)
+        out = optimized_attention(q, k, v, h, mask=mask, skip_reshape=True)
        return self.output(out)