Google har officiellt introducerat Imagen 4, den senaste versionen av sin text-till-bild-modell, som ger banbrytande förbättringar av bildkvalitet, förståelse av naturligt språk och framför allt möjligheten att imponerande återge text i bilder. Detta är ett kraftfullt verktyg för innehållsskapare, designers och alla som snabbt och exakt vill omvandla idéer till bilder.
Den här artikeln ger en översikt över de enastående funktionerna i Imagen 4 och detaljerade instruktioner om hur man skriver "uppmaningar" för att skapa de mest tillfredsställande bilderna.
Bild 4: Överlägsen kvalitet, obegränsad kreativitet
Jämfört med sina föregångare och andra AI-modeller för bildbehandling utmärker sig Imagen 4 med följande fördelar:
Överlägsen bildkvalitet: Imagen 4 producerar bilder som är otroligt detaljerade, skarpa och realistiska. Komplexa detaljer som päls, tygstrukturer och naturligt ljus återges med precision, vilket avsevärt minskar de artefakter som hittats i tidigare modeller.
Djup förståelse för språk och sammanhang: Imagen 4:s förmåga att förstå långa och komplexa kommandon har förbättrats avsevärt. Modellen kan fånga rumsliga relationer, kvantiteter och detaljerade layoutkrav mer exakt.
Imponerande textrendering: Detta är en av de mest värdefulla uppgraderingarna. Imagen 4 kan skapa bilder med tydlig, lättläst text med många olika typsnitt. Detta öppnar upp för stor potential för att designa affischer, inbjudningar, logotyper och publikationer som innehåller text. Enligt VietNamNets test är Imagen 4:s vietnamesiska renderingsfunktioner dock fortfarande ofullständiga.
Google Gemini's Imagen 4 kan fortfarande inte bearbeta vietnamesisk text.
Stöd för olika bildförhållanden: Användare kan enkelt skapa foton i populära bildförhållanden som 1:1, 16:9, 9:16, 4:3 och 3:4, lämpliga för många olika plattformar och syften.
Minskade fel och distorsioner: Imagen 4 har förbättrats för att skapa mer naturliga och mindre distorsionerade anatomiska bilder (t.ex. händer, ansikten), en stor utmaning för tidigare generationer av bildgenererande AI.
Fördjupad guide till promptskrivning för Imagen 4
För att använda Imagen 4-funktionen öppnar du Google Gemini-appen i appen eller går till gemini.google.com i webbläsaren.
Att skriva effektiva uppmaningar är nyckeln till att få ut det mesta av Imagen 4. En bra uppmaning är som en detaljerad instruktionsmanual för AI-konstnären. Här är några tips och strukturer som hjälper dig att skriva uppmaningar av "kvalitet":
1. Strukturen för en effektiv prompt
En stark uppmaning innehåller vanligtvis följande komponenter:
Ämne: Fotots huvudmotiv. Beskriv det så tydligt och specifikt som möjligt.
Handling: Vad gör subjektet?
Miljö/miljö: Var befinner sig motivet? Beskriv det omgivande utrymmet.
Ljussättning: Hur ljuset är på bilden (t.ex. mjukt morgonljus, starkt neonljus, varmt solnedgångsljus).
Konststil: Vilken stil vill du att bilden ska ha (t.ex. fotografi, oljemålning, animation, digital konst, cyberpunk).
Kamerafotografering och komposition: Kamerans perspektiv (närbild, vidvinkel, uppifrån och ner) och arrangemanget av element i fotot.
Ytterligare detaljer: Huvudfärger, känslor, texturer och andra små detaljer som ger fotot liv.
2. Gyllene regler när du skriver uppmaningar
Ju mer detaljerad, desto mer precis: Istället för att skriva "en hund", försök med "en gyllenhårig corgi som glatt springer över en grön gräsmatta en solig dag".
Använd starka adjektiv: Beskrivande adjektiv hjälper Imagen 4 att "föreställa" din idé tydligare. Till exempel: "majestätisk skyskrapa", "mystisk skog", "varmt leende".
Ange stilen: Det här är den faktor som avgör fotots "själ".
Fotografi: "fotorealistisk", "makrobild", "lång exponering", "gyllene timmens fotografering".
Målning: "oljemålning av Van Gogh", "akvarellillustration", "japansk ukiyo-e-stil".
Digitalt: "cyberpunkstad", "fantasikonst", "3D-rendering", "pixelkonst".
Experimentera med kameravinklar:
"närbild av ett kattöga"
"vidvinkelbild av en bergskedja"
"Drönarvy över en livlig stadskorsning"
3. "Recept" för att skriva uppmaningar till Imagen 4
Här är några "recept" som du kan använda dig av:
Grundformel:
[Ämne] [gör vad], [grafisk stil]
Till exempel: "Ett majestätiskt lejon med en böljande man, digital konst"
Detaljerad formel:
[Stil], [Motiv] i [Bakgrund], [Bakgrundsdetaljer], [Ljus], [Kameravinkel]
Till exempel: "Fotorealistisk, en gammal man som sitter på en träbänk i en lugn höstpark, omgiven av nedfallna löv, mjukt morgonljus, bild i ögonhöjd."
Formler som innehåller text:
En bild av [ämne] med texten "[textinnehåll]" skriven på den, [beskriv textstil]
Till exempel: "En filmaffisch för filmen 'Cybernetic Dawn', med en cyborg som tittar över en futuristisk stad på natten. Texten 'Cybernetic Dawn' är skriven i ett djärvt, lysande neonteckensnitt."
4. Några avancerade exempel
Karaktärsskapande: "Konceptbild av en kvinnlig rymdpirat, iklädd futuristisk rustning med lysande blå accenter, hållande en laserpistol, beslutsamt uttryck, stående på däcket på ett rymdskepp, filmisk belysning."
Landskap: "En hisnande landskapsmålning av Ha Long-bukten, Vietnam, i solnedgången. Kalkstenskarster som reser sig ur det smaragdgröna vattnet, traditionella skrotbåtar seglar fridfullt. Himlen är en blandning av orange, rosa och lila nyanser. Stilen i en romantisk målning."
Skapa en reklambild: "Ett högkvalitativt produktfotografi av ett nytt märke av kaffebönor i en minimalistisk förpackning. Förpackningen är mörkbrun med elegant guldfärgad typografi som säger 'Morning Ritual'. Påsen placeras bredvid en rykande kopp kaffe på ett rustikt träbord."
Genom att bemästra ovanstående tekniker för snabb skrivning kan du förvandla Imagen 4 till en kraftfull assistent, släppa lös din kreativitet och skapa unika, imponerande och professionella visuella verk. Börja experimentera och utforska den obegränsade potentialen hos detta kraftfulla AI-verktyg.
Omfamna AI och agera nu om du inte vill vara arbetslös. Storbritanniens teknikminister Peter Kyle uppmanade arbetstagare och företag att agera nu för att anamma AI-teknik om de inte vill vara arbetslösa och bli lämnade utanför.
Källa: https://vietnamnet.vn/3-cong-thuc-prompt-tao-anh-dinh-cao-nhung-hoan-toan-mien-phi-voi-google-2411854.html
Kommentar (0)