A Google hivatalosan is bemutatta az Imagen 4-et, a szövegből képpé alakító modelljének legújabb verzióját, amely áttörést jelentő fejlesztéseket hoz a képminőség, a természetes nyelvi megértés és különösen a képekben lévő szöveg lenyűgöző megjelenítésének képessége terén. Ez egy hatékony eszköz tartalomkészítők, tervezők és bárki számára, aki gyorsan és pontosan szeretné ötleteit képekké alakítani.
Ez a cikk áttekintést nyújt az Imagen 4 kiemelkedő funkcióiról, és részletes utasításokat ad arról, hogyan kell „promptokat” írni a legkielégítőbb képek létrehozásához.
4. kép: Kiváló minőség, korlátlan kreativitás
Elődeihez és más képalkotó mesterséges intelligencia modellekhez képest az Imagen 4 a következő előnyökkel tűnik ki:
Kiváló képminőség: Az Imagen 4 hihetetlenül részletes, éles és valósághű képeket készít. Az olyan összetett részletek, mint a szőrzet, az anyagtextúrák és a természetes fény, precízen reprodukálódnak, jelentősen csökkentve a korábbi modellekben található képhibákat.
A nyelv és a kontextus mély megértése: Az Imagen 4 hosszú és összetett parancsok megértésének képessége jelentősen javult. A modell pontosabban képes rögzíteni a térbeli kapcsolatokat, mennyiségeket és részletes elrendezési követelményeket.
Lenyűgöző szövegmegjelenítés: Ez az egyik legértékesebb fejlesztés. Az Imagen 4 képes tiszta, könnyen olvasható szöveget tartalmazó képeket létrehozni számos különböző betűtípussal. Ez hatalmas lehetőségeket nyit meg a szöveget tartalmazó plakátok, meghívók, logók és kiadványok tervezésében. A VietNamNet tesztje szerint azonban az Imagen 4 vietnami renderelési képessége még mindig hiányos.
A Google Gemini Imagen 4 programja továbbra sem tudja sikeresen feldolgozni a vietnami szöveget.
Különböző képarányok támogatása: A felhasználók könnyen készíthetnek fényképeket népszerű képarányokban, például 1:1, 16:9, 9:16, 4:3 és 3:4, amelyek számos különböző platformon és célra alkalmasak.
Csökkentett hibák és torzítások: Az Imagen 4 továbbfejlesztése természetesebb és kevésbé torzított anatómiai képeket (pl. kezek, arcok) hoz létre, ami a képgeneráló mesterséges intelligencia korábbi generációi számára komoly kihívást jelentett.
Részletes írási útmutató az Imagen 4-hez
Az Imagen 4 funkció használatához nyissa meg a Google Gemini alkalmazást az alkalmazáson belül, vagy látogasson el a gemini.google.com oldalra a webböngészőben.
A hatékony promptok írása kulcsfontosságú az Imagen 4 maximális kihasználásához. Egy jó prompt olyan, mint egy részletes használati útmutató a mesterséges intelligencia művészének. Íme néhány tipp és struktúra, amelyek segítenek a „minőségi” promptok írásában:
1. Egy hatékony prompt felépítése
Egy erős prompt jellemzően a következő összetevőket tartalmazza:
Téma: A fotó fő témája. Írd le a lehető legvilágosabban és legpontosabban.
Cselekvés: Mit csinál a vizsgált személy?
Helyszín/Környezet: Hol található a téma? Írd le a környező teret.
Világítás: Milyen a megvilágítás a fotón (pl. lágy reggeli fény, élénk neonfények, meleg naplemente fénye).
Művészeti stílus: Milyen stílusú képet szeretnél (pl. fotó, olajfestmény, animáció, digitális művészet, cyberpunk)?
Kamerakép és kompozíció: A kamera perspektívája (közeli, nagylátószögű, felülről lefelé) és az elemek elrendezése a fotón.
További részletek: Fő színek, érzelmek, textúrák és egyéb apró részletek, amelyek életre keltik a fotót.
2. Aranyszabályok a feladatsorok írásakor
Minél részletesebb, annál pontosabb: Ahelyett, hogy „egy kutya”-t írnál, próbáld ki azt, hogy „egy aranyszőrű corgi, aki boldogan fut át a zöld gyepen egy napsütéses napon”.
Használj erős mellékneveket: A leíró melléknevek segítenek a 4. képnek tisztábban elképzelni az ötletedet. Például: „fenséges felhőkarcoló”, „titokzatos erdő”, „meleg mosoly”.
A stílus megadása: Ez az a tényező, amely meghatározza a fotó "lelkét".
Fényképezés: „fotorealisztikus”, „makró felvétel”, „hosszú expozíció”, „aranyóra-fotózás”.
Festmény: "Van Gogh olajfestménye", "akvarell illusztráció", "japán ukijo-e stílus".
Digitális: „cyberpunk város”, „fantasy art”, „3D render”, „pixel art”.
Kísérletezés kameraszögekkel:
"macskaszem közeli felvétele"
"hegység nagylátószögű felvétele"
"drónfelvétel egy nyüzsgő városi kereszteződésről"
3. „Recept” az Imagen 4 írási feladataihoz
Íme néhány "recept", amit alkalmazhatsz:
Alapképlet:
[Tárgy] [mit csinál], [művészeti stílus]
Például: „Egy fenséges oroszlán lobogó sörénnyel, digitális művészet”
Részletes képlet:
[Stílus], [Téma] a [Háttér] részben, [Háttér részletei], [Megvilágítás], [Kameraszög]
Például: „Fotorealisztikus, egy idős férfi ül egy fapadon egy csendes őszi parkban, lehullott levelekkel körülvéve, lágy reggeli fénnyel, szemmagasságban készült felvétel.”
Szöveget tartalmazó képletek:
Egy kép a témáról, amelyen a „[szöveg tartalma]” felirat szerepel, [szövegstílus leírása]
Például: „Egy filmplakát a »Kibernetikus hajnal« című filmhez, amelyen egy kiborg egy futurisztikus város felett leselkedik éjszaka. A »Kibernetikus hajnal« felirat vastag, világító neon betűtípussal szerepel.”
4. Néhány haladó példa
Karakteralkotás: "Egy női űrkalóz koncepciórajza, aki futurisztikus páncélt visel izzó kék díszítéssel, lézerpisztolyt tart a kezében, eltökélt arckifejezéssel, egy űrhajó fedélzetén áll, filmes megvilágításban."
Tájkép: „Lélegzetelállító tájkép a vietnami Ha Long-öbölről naplementekor. Mészkőkarsztok emelkednek ki a smaragdzöld vízből, békésen vitorlázó hagyományos dzsunkahajók. Az ég narancssárga, rózsaszín és lila árnyalatok keveréke. Romantikus festmény stílusa.”
Készítsen egy reklámképet: „Egy új kávémárka kiváló minőségű termékfotója minimalista csomagolásban. A csomagolás sötétbarna, elegáns arany tipográfiával, amelyen a »Morning Ritual« felirat szerepel. A filtert egy gőzölgő kávéscsésze mellé helyezik egy rusztikus faasztalon.”
A fenti gyorsírási technikák elsajátításával az Imagen 4-et hatékony asszisztenssé alakíthatod, szabadjára engedheted kreativitásodat, és egyedi, lenyűgöző és professzionális vizuális alkotásokat hozhatsz létre. Kezdj kísérletezni, és fedezd fel ennek a hatékony mesterséges intelligencia eszköznek a korlátlan lehetőségeit.
Fogadd be a mesterséges intelligenciát, és cselekedj most, ha nem akarsz munkanélküli lenni! Peter Kyle, az Egyesült Királyság technológiai minisztere felszólította a munkavállalókat és a vállalkozásokat, hogy cselekedjenek most a mesterséges intelligencia technológiájának alkalmazása érdekében, ha nem akarnak munkanélküliek lenni és lemaradni.
Forrás: https://vietnamnet.vn/3-cong-thuc-prompt-tao-anh-dinh-cao-nhung-hoan-toan-mien-phi-voi-google-2411854.html
Hozzászólás (0)