ការអាប់ដេត Google Gemini ប្រើគំរូរូបភាព "ណាណូចេក" ដែលបង្កើតឡើងដោយ Google DeepMind ។ ឥឡូវនេះមុខងារនេះអាចប្រើបានជាសកលសម្រាប់ទាំងអ្នកប្រើប្រាស់ឥតគិតថ្លៃ និងបង់ប្រាក់។ កម្លាំងដ៏ធំបំផុតរបស់វាគឺសមត្ថភាពរបស់វាក្នុងការរក្សាមុខ និងវត្ថុឱ្យជាប់លាប់នៅក្នុងរូបថត ដែលជាឧបករណ៍ AI ផ្សេងទៀតតែងតែជួបការលំបាក។
Nicole Brichtova អ្នកដឹកនាំផលិតផលនៅ DeepMind បាននិយាយថា "យើងពិតជាបានជំរុញគុណភាពនៃរូបភាព និងសមត្ថភាពរបស់ម៉ូដែលក្នុងការធ្វើតាមការណែនាំ" ។ "ការធ្វើបច្ចុប្បន្នភាពនេះធ្វើឱ្យការកែសម្រួលកាន់តែរលូន ហើយលទ្ធផលគឺល្អគ្រប់គ្រាន់ដើម្បីប្រើប្រាស់សម្រាប់គោលបំណងណាមួយ។"
រក្សា "អ្នក" នៅក្នុងរូបថតនីមួយៗ
រឿងមួយដែលធ្វើឱ្យរូបថត AI មើលទៅក្លែងក្លាយគឺថា ព័ត៌មានលម្អិតតូចៗត្រូវបានបង្ខូចទ្រង់ទ្រាយ។ Google និយាយថា Gemini ដោះស្រាយបញ្ហានេះដោយអនុញ្ញាតឱ្យអ្នកផ្លាស់ប្តូរឈុតទាំងមូលខណៈពេលដែលរក្សាមុខនិងការបញ្ចេញមតិដូចគ្នា។ អ្នកអាចសាកល្បងម៉ូដសក់ថ្មី ប្តូរពណ៌ជញ្ជាំង ឬនាំសត្វចិញ្ចឹមចូលក្នុងឈុតដោយមិនបារម្ភពីការបង្ខូចទ្រង់ទ្រាយរូបភាព។

Gemini ក៏អនុញ្ញាតឱ្យអ្នកបញ្ចូលរូបថតជាច្រើនដើម្បីបញ្ចូលគ្នាទៅជាមួយ ដូចជាការផ្សំរូបបញ្ឈរជាមួយឆ្មារបស់អ្នក ដើម្បីបង្កើតរូបថតដែលអ្នកទាំងពីរជិះជាមួយគ្នានៅលើផ្លូវ។
Gemini គាំទ្រការកែសម្រួលពហុវេន ដែលអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់បន្ថែមរាល់ព័ត៌មានលម្អិតទៅកន្លែងមួយ៖ ពីផ្ទាំងរូបភាព គ្រឿងសង្ហារឹម ដើម្បីលាបពណ៌។ ចំណុចបូកគឺថាមានតែផ្នែកដែលត្រូវកែសម្រួលប៉ុណ្ណោះដែលនៅសល់នៅដដែល។
លើសពីនេះទៀត Gemini អាចលាយរចនាប័ទ្មរវាងរូបថត។ ជាឧទាហរណ៍ បង្វែរស្បែកជើងកវែងទឹកភ្លៀងទៅជាស្បែកជើងបោះពុម្ពផ្កា ឬបង្កើតរ៉ូបដែលមានលំនាំមេអំបៅ។
ការប្រកួតប្រជែងបង្កើតរូបភាព AI រវាងបច្ចេកវិទ្យាយក្ស
ការអាប់ដេតរបស់ Google កើតឡើងនៅពេលដែលសង្រ្គាមរូបភាព AI កាន់តែក្តៅ។ OpenAI ពីមុនបានបើកដំណើរការ GPT-4o ដែលអាចបង្កើតរូបភាពដោយផ្ទាល់ និងបានរីករាលដាលជាមួយនឹងស៊េរីនៃស្ទីលស្ទូឌីយោ Ghibli memes ។ នាយកប្រតិបត្តិ Sam Altman បានបង្ហាញថាចំនួនអ្នកប្រើប្រាស់បានកើនឡើងយ៉ាងខ្លាំងដែល GPU របស់ក្រុមហ៊ុន "ស្ទើរតែរលាយ" ។
ដើម្បីបន្ត Meta បានប្រកាសពីភាពជាដៃគូជាមួយ Midjourney ខណៈពេលដែលក្រុមហ៊ុនអាឡឺម៉ង់ Black Forest Labs ដែលចាប់ផ្តើមជាមួយម៉ូដែល FLUX របស់ខ្លួនកំពុងគ្របដណ្តប់លើតារាងជាច្រើន។

Google សង្ឃឹមថា Gemini អាចបិទគម្លាតជាមួយ ChatGPT ។ បច្ចុប្បន្ននេះ Gemini មានអ្នកប្រើប្រាស់ 450 លាននាក់ក្នុងមួយខែ នេះបើយោងតាមនាយកប្រតិបត្តិ Sundar Pichai ដែលនៅឆ្ងាយពី ChatGPT ដែលមានអ្នកប្រើប្រាស់ច្រើនជាង 700 លាននាក់ក្នុងមួយសប្តាហ៍។
Brichtova បាននិយាយថា Gemini ត្រូវបានរចនាឡើងសម្រាប់សេណារីយ៉ូក្នុងពិភពពិត ចាប់ពីការមើលឃើញបន្ទប់ទទួលភ្ញៀវ និងសួនច្បារ រហូតដល់ការបង្កើតរូបថតកម្សាន្ត។ ម៉ូដែលនេះមាន “ចំណេះដឹង ពិភពលោក ” ប្រសើរជាងមុន ហើយអាចបញ្ចូលគ្នានូវរូបថត និងក្ដារលាយពណ៌ជាច្រើនចូលទៅក្នុងការបង្ហាញតែមួយ។
ទោះជាយ៉ាងណាក៏ដោយ Google ក៏ដាក់កម្រិតយ៉ាងតឹងរ៉ឹងផងដែរ។ រូបភាពដែលបានបង្កើតទាំងអស់មាន watermark ច្បាស់លាស់ និងសញ្ញាសម្គាល់ដែលលាក់នៅក្នុងទិន្នន័យមេតា។ ក្រុមហ៊ុនហាមឃាត់យ៉ាងតឹងរ៉ឹងនូវការបង្កើតរូបភាពរសើបដោយគ្មានការអនុញ្ញាត ដើម្បីការពារការរំលោភបំពានយ៉ាងជ្រាលជ្រៅ។
Google ពីមុនបានសុំទោសចំពោះរូបភាពប្រវត្តិសាស្ត្រមិនត្រឹមត្រូវរបស់ Gemini ។ លើកនេះ ក្រុមហ៊ុនជឿជាក់ថា វាបានធ្វើឱ្យមានតុល្យភាពរវាងការច្នៃប្រឌិត និងសុវត្ថិភាព។ Brichtova បានសង្កត់ធ្ងន់ថា "យើងចង់ឱ្យអ្នកប្រើប្រាស់មានភាពច្នៃប្រឌិត ប៉ុន្តែមិនមែនអ្វីៗទាំងអស់ត្រូវបានអនុញ្ញាតទេ" ។
ជាមួយនឹង Gemini 2.5 Flash Image Google កំពុងភ្នាល់លើការបង្កើនបទពិសោធន៍កែរូបថត AI ដោយសង្ឃឹមថានឹងរក្សាអ្នកប្រើប្រាស់ចាស់ និងទាក់ទាញអ្នកថ្មីក្នុងការប្រណាំងបច្ចេកវិទ្យាដ៏ខ្លាំងក្លាជាមួយ OpenAI, Meta និងដៃគូប្រកួតប្រជែងផ្សេងទៀត។
(យោងតាម TechCrunch, Tom's Guide)

ប្រភព៖ https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html
Kommentar (0)