Generating Images with OpenAI's gpt-image-1

🎨 Hvernig á að búa til myndir með OpenAI's gpt-image-1
Ef þú hefur einhvern tíma viljað breyta sögu eða hugmynd í sjónræna senuna með AI, þá gerir nýja gpt-image-1
líkanið hjá OpenAI það auðveldara og öflugra en nokkru sinni fyrr. Hér er hvernig við notum það í okkar eigin verkefni, StoryGPT, til að búa til fallegar myndir úr texta — og jafnvel bæta þeim með persónu myndum.
🖼️ Skref 1: Undirbúðu skilyrðið þitt
Eins og GPT texta líkanin, þarfnast gpt-image-1
lýsandi skilyrðis. Til dæmis:
Hugguleg skógarkot húsi í sólsetri, logandi gluggar, umlukin háum trjám.
Ju meiri upplýsingar í skilyrðinu, því betri mynd. Bættu við stemningu, tíma dags, stíl — hvað sem skiptir máli.
🧙♂️ Skref 2: Bættu við persónu myndum (valfrjálst en frábært)
Segjum að þú hafir þegar mynd af persónu (t.d. hundi með hatt). Þú getur hlaðið henni upp sem base64 og notað hana sem sjónrænt vísbendi.
Þá geturðu stækkað hana svona:
"Bættu við eftirfarandi í myndina: hundurinn hefur rauða skæla og stendur á tveimur fótum."
Þannig byggir líkanið yndir upprunalegu myndina frekar en að byrja frá grunni.
📦 Skref 3: Kallaðu API-ið
Það eru tveir gerðir:
🧠 Texta-einungis skilyrði:
client.images.generate(
model="gpt-image-1",
prompt="Futuristic city skyline á nóttunni með fljúgandi bílum",
size="1024x1024",
quality="low",
n=1
)
🖼️ Breyta með myndainntökum (eins og að bæta við persónum):
httpx.post(
"https://api.openai.com/v1/images/edits",
headers={"Authorization": f"Bearer {API_KEY}"},
data={
"prompt": "Bættu við töfrandi logandi augum á persónuna",
"model": "gpt-image-1",
"size": "1024x1024",
"quality": "low"
},
files=[("image[]", ("dog.png", open("dog.png", "rb"), "image/png"))]
)
Niðurstaðan mun innihalda base64 mynd sem þú getur sýnt, geymt eða vistað á disk.
✅ Það er það!
Þú getur nú búið til sjónræn fyrir persónur, umhverfi eða heilar senu. Í StoryGPT notum við þetta til að færa sköpuð sögur til lífs — persónu fyrir persónu, síðu fyrir síðu.
Prófaðu það sjálfur og gefðu sögum þínum andlit!
🧪 Heildar Virkilegt Dæmi – Myndaframleiðsla með gpt-image-1
Þessi skrift krefst:
openai
pakka (pip install openai
)httpx
fyrir að senda multipart myndarinnsláttir (pip install httpx
)- OpenAI API lykil í umhverfi þínu sem
OPENAI_API_KEY
import os
import base64
import httpx
from openai import OpenAI
## Gakktu úr skugga um að þetta sé stillt í þínu umhverfi
OPENAI_API_KEY = os.environ["OPENAI_API_KEY"]
## Einföld myndavinnsla sem notar aðeins textaskilyrði
def generate_image_from_prompt(prompt: str):
client = OpenAI()
response = client.images.generate(
model="gpt-image-1",
prompt=prompt,
size="1024x1024",
quality="low",
n=1,
)
image_b64 = response.data[0].b64_json
save_image(image_b64, "image_text_only.png")
## Myndavinnsla með hlaðinni base64 mynd og endurbættum skilyrði
def generate_image_with_entity(image_path: str, prompt: str):
with open(image_path, "rb") as f:
image_bytes = f.read()
files = [
("image[]", (os.path.basename(image_path), image_bytes, "image/png"))
]
data = {
"prompt": prompt,
"model": "gpt-image-1",
"size": "1024x1024",
"quality": "low",
}
headers = {
"Authorization": f"Bearer {OPENAI_API_KEY}",
}
response = httpx.post(
"https://api.openai.com/v1/images/edits",
headers=headers,
data=data,
files=files,
timeout=60,
)
if response.status_code != 200:
raise Exception(f"Image generation failed: {response.text}")
image_b64 = response.json()["data"][0]["b64_json"]
save_image(image_b64, "image_with_entity.png")
def save_image(image_b64: str, filename: str):
os.makedirs("out_images", exist_ok=True)
path = os.path.join("out_images", filename)
with open(path, "wb") as f:
f.write(base64.b64decode(image_b64))
print(f"✅ Vista mynd á: {path}")
if __name__ == "__main__":
# Mode 1: Búðu til út frá skilyrði
print("🔮 Búum til út frá skilyrði einungis...")
generate_image_from_prompt("Töfrasaumur kastali á fljúgandi eyju undir fjólubláu himni")
# Mode 2: Búðu til út frá skilyrði + persónu mynd
print("🖼️ Búum til með persónuvísbendi...")
generate_image_with_entity(
image_path="dog.png", # skiptu út fyrir raunverulega mynd
prompt="Bættu við rauða skæla og monokli á hundinn"
)
🧠 Samantekt
generate_image_from_prompt(...)
→ þarf aðeins textagenerate_image_with_entity(...)
→ felur í sér sérsniðna persónu eða vísbendismynd- Niðurstöður eru vistaðar í
out_images/
möppunni