Stable Cascade support, new ReturnedEmbeddingsType #104

Teriks · 2024-09-11T05:01:10Z

Stable Cascade support in EmbeddingsProvider via new returned embeddings type.

Usage:

import gc
import torch
import compel

from diffusers import StableCascadePriorPipeline, StableCascadeDecoderPipeline

device = 'cuda'

prompt = "an image of a shiba inu with (blue eyes)1.4, donning a green+ spacesuit, (cartoon style)1.6"
neg_prompt = "photograph, (real)1.6"

generator = torch.Generator(device=device).manual_seed(0)

# prior

prior = StableCascadePriorPipeline.from_pretrained("stabilityai/stable-cascade-prior", variant='bf16',
                                                   torch_dtype=torch.bfloat16).to(device)

prior_compel = compel.Compel(tokenizer=prior.tokenizer,
                             text_encoder=prior.text_encoder,
                             requires_pooled=True,
                             device=device,
                             returned_embeddings_type=compel.ReturnedEmbeddingsType.STABLE_CASCADE)

conditioning, pooled = prior_compel(prompt)
neg_conditioning, neg_pooled = prior_compel(neg_prompt)

conditioning, neg_conditioning = \
    prior_compel.pad_conditioning_tensors_to_same_length([conditioning, neg_conditioning])

prior_output = prior(
    num_inference_steps=20,
    guidance_scale=4,
    prompt_embeds=conditioning,
    prompt_embeds_pooled=pooled,
    negative_prompt_embeds=neg_conditioning,
    negative_prompt_embeds_pooled=neg_pooled,
    generator=generator
)

del conditioning, pooled, neg_conditioning, neg_pooled
prior.to('cpu')

# decoder

decoder = StableCascadeDecoderPipeline.from_pretrained("stabilityai/stable-cascade", variant='bf16',
                                                       torch_dtype=torch.float16).to(device)

decoder_compel = compel.Compel(tokenizer=decoder.tokenizer,
                               text_encoder=decoder.text_encoder,
                               device=device,
                               requires_pooled=True,
                               returned_embeddings_type=compel.ReturnedEmbeddingsType.STABLE_CASCADE)


conditioning, pooled = decoder_compel(prompt)
neg_conditioning, neg_pooled = decoder_compel(neg_prompt)

conditioning, neg_conditioning = \
    decoder_compel.pad_conditioning_tensors_to_same_length([conditioning, neg_conditioning])

image = decoder(
    num_inference_steps=10,
    guidance_scale=0.0,
    prompt_embeds=conditioning,
    prompt_embeds_pooled=pooled,
    negative_prompt_embeds=neg_conditioning,
    negative_prompt_embeds_pooled=neg_pooled,
    image_embeddings=prior_output.image_embeddings.half(),
    generator=generator
).images[0]

image.save('test.png')

del conditioning, pooled, neg_conditioning, neg_pooled

decoder.to('cpu')
gc.collect()
torch.cuda.empty_cache()

Output Example:

Merge sd-embed support for clip skip xhinker/sd_embed#31 Vendor compel and add clip skip support and StableCascade support from my pull request damian0815/compel#104 Allow --model-type torch-s-cascade to use --clip-skips when --prompt-weighter is sd-embed or compel

stable cascade support, new ReturnedEmbeddingsType

d94a1f9

Teriks mentioned this pull request Sep 11, 2024

Stable Cascade? #95

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Stable Cascade support, new ReturnedEmbeddingsType #104

Stable Cascade support, new ReturnedEmbeddingsType #104

Uh oh!

Teriks commented Sep 11, 2024

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Stable Cascade support, new ReturnedEmbeddingsType #104

Are you sure you want to change the base?

Stable Cascade support, new ReturnedEmbeddingsType #104

Uh oh!

Conversation

Teriks commented Sep 11, 2024

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant