V7, model MidJourney, dikatakan mampu mencipta butiran seperti tangan dengan lebih konsisten. Foto: Xeophon . |
Midjourney, salah satu penjana imej pertama yang dikuasakan AI di web, baru sahaja mengeluarkan model baharu pertamanya dalam hampir setahun.
Model yang dipanggil V7, dikeluarkan dalam versi beta pada tengah malam pada 4 April (waktu AS). Seminggu sebelum itu, OpenAI juga telah melancarkan ciri serupa dengan ChatGPT dan dengan cepat mencipta heboh di rangkaian sosial dengan trend baharu mencipta foto gaya Ghibli.
Jika anda tidak pernah menggunakan Midjourney sebelum ini, anda perlu menilai 200 imej yang dicadangkan berdasarkan pilihan anda terlebih dahulu. Alat itu kemudiannya akan membuat profil diperibadikan yang akan membuat foto yang sepadan dengan estetika anda. V7 ialah model pertama Midjourney yang mendayakan pemperibadian secara lalai.
Anda boleh mendayakan atau melumpuhkan V7 dengan mengklik pada bar alat "versi" di tapak web. Selain itu, model ini boleh digunakan dalam pelayan Midjourney Discord.
Ketua Pegawai Eksekutif Midjourney David Holz menyifatkan V7 sebagai "seni bina yang sama sekali berbeza" dalam siaran di X. "V7 adalah lebih bijak dalam mengendalikan arahan teks," Holz menyambung pada Discord.
Beliau mengulas bahawa model itu juga mempunyai keupayaan untuk memproses imej asal dengan cukup baik. Kualiti imej dipertingkatkan dengan ketara dengan kesempurnaan yang tinggi. Dari bahagian badan seperti tangan, kaki, hingga ke jeragat, corak seramik konsisten dengan setiap detail.
![]() |
Beberapa imej sampel yang dicipta daripada model V7. Foto: X/MidJourney. |
Sebagai tambahan kepada dua mod: Turbo (yang lebih mahal) dan Relax, V7 menyokong alat baharu yang dipanggil Mod Draf, yang membolehkan penciptaan imej pada kelajuan 10 kali lebih pantas dan hanya berharga separuh daripada mod standard. Imej dalam mod Draf akan mempunyai kualiti yang lebih rendah, tetapi pengguna boleh menaik taraf dan mencipta semula imej dengan hanya satu klik.
Menurut Holz, beberapa ciri standard Midjourney belum tersedia dengan V7, termasuk penskalaan dan penstrukturan semula. Beliau berkata ciri-ciri ini akan ditambah dalam masa terdekat, mungkin dalam tempoh dua bulan akan datang.
"Ini adalah model yang sama sekali baru dengan kekuatannya sendiri, dan mungkin beberapa kelemahan," tulis Holz di Discord. Beliau menyatakan bahawa V7 mungkin memerlukan gaya penulisan baharu dan menggalakkan orang ramai mencuba versi tersebut untuk membantu memberikan maklum balas.
Wartawan Techcrunch Kyle Wiggers menyatakan bahawa V7 berfungsi dengan baik pada arahan asasnya. "Model Midjourney tidak dioptimumkan secara khusus untuk Ghibli, sekurang-kurangnya tidak secara rasmi, tetapi ia masih boleh menghasilkan karya yang estetik," tambahnya.
Menurut pakar AI di Vietnam, ciri penjanaan imej ChatGPT boleh lebih mudah digunakan dan lebih mudah daripada penjana imej awal seperti MidJourney dan Stable Diffusion. Walau bagaimanapun, model OpenAI masih belum mencipta satu kejayaan dalam kualiti imej, yang mungkin lebih buruk daripada alat sebelumnya.
Midjourney adalah syarikat yang agak luar biasa. Diasaskan pada 2022 oleh Holz, yang mengasaskan bersama pembuat peranti PC Leap Motion, Midjourney tidak pernah menerima sebarang pelaburan luar.
Syarikat itu juga tidak mendedahkan pendapatannya, tetapi CBInsights menganggarkan Midjourney akan mempunyai sekitar $200 juta hasil menjelang akhir 2023. Syarikat itu baru-baru ini berkata ia sedang membina pasukan perkakasan untuk mengerjakan beberapa projek yang tidak didedahkan dan meneruskan latihan model yang diumumkan sebelum ini untuk mencipta video dan objek 3D.
Seperti ChatGPT, MidJourney menghadapi beberapa tindakan undang-undang, mendakwa ia melanggar hak berjuta-juta artis dengan melatih alatan AI pada imej yang dikikis daripada web tanpa persetujuan pencipta imej tersebut.
Sumber: https://znews.vn/mo-hinh-tao-anh-ai-tot-hon-chatgpt-post1543472.html
Komen (0)