KarthikAI
/

InstantID-i2i

StableDiffusionImg2ImgPipeline

Model card Files Files and versions

InstantID-i2i / handler.py

KarthikAI's picture

Update handler.py

06a49e4 verified about 1 year ago

History Blame Contribute Delete

1.42 kB

	import base64
	import io
	from PIL import Image
	import torch
	from diffusers import StableDiffusionImg2ImgPipeline

	# Global pipeline instance
	torch_device = "cuda" if torch.cuda.is_available() else "cpu"
	pipe = None

	class EndpointHandler:
	def __init__(self, model_dir: str):
	# model_dir is ignored; HF clones your repo here
	pass

	def init(self):
	global pipe
	if pipe is None:
	# Load your InstantID img2img model
	pipe = StableDiffusionImg2ImgPipeline.from_pretrained(
	"karthikAI/InstantID-i2i",
	revision="main",
	torch_dtype=torch.float16
	).to(torch_device)

	def inference(self, model_inputs: dict) -> dict:
	# 1) decode base64 image
	b64 = model_inputs.get("inputs")
	if b64 is None:
	return {"error": "No 'inputs' key with base64 image provided."}
	img = Image.open(io.BytesIO(base64.b64decode(b64))).convert("RGB")

	# 2) extract prompt
	prompt = model_inputs.get("parameters", {}).get("prompt", "")

	# 3) minimal call: prompt + image only
	out = pipe(prompt=prompt, image=img)
	result_img = out.images[0]

	# 4) encode output
	buf = io.BytesIO()
	result_img.save(buf, format="PNG")
	b64_out = base64.b64encode(buf.getvalue()).decode()
	return {"generated_image_base64": b64_out}