ការអាប់ដេត Google Gemini ប្រើគំរូរូបភាព "ណាណូចេក" ដែលបង្កើតឡើងដោយ Google DeepMind ។ ឥឡូវនេះមុខងារនេះអាចប្រើបានជាសកលសម្រាប់ទាំងអ្នកប្រើប្រាស់ឥតគិតថ្លៃ និងបង់ប្រាក់។ កម្លាំងដ៏ធំបំផុតរបស់វាគឺសមត្ថភាពរបស់វាក្នុងការរក្សាមុខ និងវត្ថុឱ្យជាប់លាប់នៅក្នុងរូបថត ដែលជាឧបករណ៍ AI ផ្សេងទៀតតែងតែជួបការលំបាក។

Nicole Brichtova អ្នកដឹកនាំផលិតផលនៅ DeepMind បាននិយាយថា "យើងពិតជាបានជំរុញគុណភាពនៃរូបភាព និងសមត្ថភាពរបស់ម៉ូដែលក្នុងការធ្វើតាមការណែនាំ" ។ "ការធ្វើបច្ចុប្បន្នភាពនេះធ្វើឱ្យការកែសម្រួលកាន់តែរលូន ហើយលទ្ធផលគឺល្អគ្រប់គ្រាន់ដើម្បីប្រើប្រាស់សម្រាប់គោលបំណងណាមួយ។"

រក្សា "អ្នក" នៅក្នុងរូបថតនីមួយៗ

រឿងមួយដែលធ្វើឱ្យរូបថត AI មើលទៅក្លែងក្លាយគឺថា ព័ត៌មានលម្អិតតូចៗត្រូវបានបង្ខូចទ្រង់ទ្រាយ។ Google និយាយថា Gemini ដោះស្រាយបញ្ហានេះដោយអនុញ្ញាតឱ្យអ្នកផ្លាស់ប្តូរឈុតទាំងមូលខណៈពេលដែលរក្សាមុខនិងការបញ្ចេញមតិដូចគ្នា។ អ្នក​អាច​សាកល្បង​ម៉ូដ​សក់​ថ្មី ប្តូរ​ពណ៌​ជញ្ជាំង ឬ​នាំ​សត្វ​ចិញ្ចឹម​ចូល​ក្នុង​ឈុត​ដោយ​មិន​បារម្ភ​ពី​ការ​បង្ខូច​ទ្រង់ទ្រាយ​រូបភាព។

លាយរូបថតជាមួយគ្នា.gif
បញ្ចូលរូបថតជាមួយបរិបទថ្មីពីរូបភាពដែលមានស្រាប់ពីរដោយប្រើ Google Gemini ។ ប្រភព៖ Google

Gemini ក៏អនុញ្ញាតឱ្យអ្នកបញ្ចូលរូបថតជាច្រើនដើម្បីបញ្ចូលគ្នាទៅជាមួយ ដូចជាការផ្សំរូបបញ្ឈរជាមួយឆ្មារបស់អ្នក ដើម្បីបង្កើតរូបថតដែលអ្នកទាំងពីរជិះជាមួយគ្នានៅលើផ្លូវ។

Gemini គាំទ្រការកែសម្រួលពហុវេន ដែលអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់បន្ថែមរាល់ព័ត៌មានលម្អិតទៅកន្លែងមួយ៖ ពីផ្ទាំងរូបភាព គ្រឿងសង្ហារឹម ដើម្បីលាបពណ៌។ ចំណុច​បូក​គឺ​ថា​មាន​តែ​ផ្នែក​ដែល​ត្រូវ​កែ​សម្រួល​ប៉ុណ្ណោះ​ដែល​នៅ​សល់​នៅ​ដដែល។

លើសពីនេះទៀត Gemini អាចលាយរចនាប័ទ្មរវាងរូបថត។ ជាឧទាហរណ៍ បង្វែរស្បែកជើងកវែងទឹកភ្លៀងទៅជាស្បែកជើងបោះពុម្ពផ្កា ឬបង្កើតរ៉ូបដែលមានលំនាំមេអំបៅ។

ការប្រកួតប្រជែងបង្កើតរូបភាព AI រវាងបច្ចេកវិទ្យាយក្ស

ការអាប់ដេតរបស់ Google កើតឡើងនៅពេលដែលសង្រ្គាមរូបភាព AI កាន់តែក្តៅ។ OpenAI ពីមុនបានបើកដំណើរការ GPT-4o ដែលអាចបង្កើតរូបភាពដោយផ្ទាល់ និងបានរីករាលដាលជាមួយនឹងស៊េរីនៃស្ទីលស្ទូឌីយោ Ghibli memes ។ នាយកប្រតិបត្តិ Sam Altman បានបង្ហាញថាចំនួនអ្នកប្រើប្រាស់បានកើនឡើងយ៉ាងខ្លាំងដែល GPU របស់ក្រុមហ៊ុន "ស្ទើរតែរលាយ" ។

ដើម្បីបន្ត Meta បានប្រកាសពីភាពជាដៃគូជាមួយ Midjourney ខណៈពេលដែលក្រុមហ៊ុនអាឡឺម៉ង់ Black Forest Labs ដែលចាប់ផ្តើមជាមួយម៉ូដែល FLUX របស់ខ្លួនកំពុងគ្របដណ្តប់លើតារាងជាច្រើន។

ពហុវេន editing.gif
សមត្ថភាពកែរូបថតច្រើនជំហានរបស់ Google Gemini ។ ប្រភព៖ Google

Google សង្ឃឹមថា Gemini អាចបិទគម្លាតជាមួយ ChatGPT ។ បច្ចុប្បន្ននេះ Gemini មានអ្នកប្រើប្រាស់ 450 លាននាក់ក្នុងមួយខែ នេះបើយោងតាមនាយកប្រតិបត្តិ Sundar Pichai ដែលនៅឆ្ងាយពី ChatGPT ដែលមានអ្នកប្រើប្រាស់ច្រើនជាង 700 លាននាក់ក្នុងមួយសប្តាហ៍។

Brichtova បាននិយាយថា Gemini ត្រូវបានរចនាឡើងសម្រាប់សេណារីយ៉ូក្នុងពិភពពិត ចាប់ពីការមើលឃើញបន្ទប់ទទួលភ្ញៀវ និងសួនច្បារ រហូតដល់ការបង្កើតរូបថតកម្សាន្ត។ ម៉ូដែលនេះមាន “ចំណេះដឹង ពិភពលោក ” ប្រសើរជាងមុន ហើយអាចបញ្ចូលគ្នានូវរូបថត និងក្ដារលាយពណ៌ជាច្រើនចូលទៅក្នុងការបង្ហាញតែមួយ។

ទោះជាយ៉ាងណាក៏ដោយ Google ក៏ដាក់កម្រិតយ៉ាងតឹងរ៉ឹងផងដែរ។ រូបភាពដែលបានបង្កើតទាំងអស់មាន watermark ច្បាស់លាស់ និងសញ្ញាសម្គាល់ដែលលាក់នៅក្នុងទិន្នន័យមេតា។ ក្រុមហ៊ុនហាមឃាត់យ៉ាងតឹងរ៉ឹងនូវការបង្កើតរូបភាពរសើបដោយគ្មានការអនុញ្ញាត ដើម្បីការពារការរំលោភបំពានយ៉ាងជ្រាលជ្រៅ។

Google ពីមុនបានសុំទោសចំពោះរូបភាពប្រវត្តិសាស្ត្រមិនត្រឹមត្រូវរបស់ Gemini ។ លើកនេះ ក្រុមហ៊ុនជឿជាក់ថា វាបានធ្វើឱ្យមានតុល្យភាពរវាងការច្នៃប្រឌិត និងសុវត្ថិភាព។ Brichtova បានសង្កត់ធ្ងន់ថា "យើងចង់ឱ្យអ្នកប្រើប្រាស់មានភាពច្នៃប្រឌិត ប៉ុន្តែមិនមែនអ្វីៗទាំងអស់ត្រូវបានអនុញ្ញាតទេ" ។

ជាមួយនឹង Gemini 2.5 Flash Image Google កំពុងភ្នាល់លើការបង្កើនបទពិសោធន៍កែរូបថត AI ដោយសង្ឃឹមថានឹងរក្សាអ្នកប្រើប្រាស់ចាស់ និងទាក់ទាញអ្នកថ្មីក្នុងការប្រណាំងបច្ចេកវិទ្យាដ៏ខ្លាំងក្លាជាមួយ OpenAI, Meta និងដៃគូប្រកួតប្រជែងផ្សេងទៀត។

(យោងតាម ​​TechCrunch, Tom's Guide)

សម្រាប់ 85 លានដុងក្នុងមួយ 'ខួរក្បាល' Nvidia ត្រួសត្រាយផ្លូវសម្រាប់យុគសម័យដែលមនុស្សបង្កើតមនុស្សយន្ត។ Nvidia ទើបតែបានបញ្ចេញ Jetson AGX Thor ដែលជាបន្ទះឈីបមួយដែលមានឈ្មោះថា "ខួរក្បាលមនុស្សយន្ត" ដែលមានសមត្ថភាពជួយម៉ាស៊ីនមើលឃើញ គិត និងធ្វើដូចមនុស្ស ដោយបើកការប្រណាំង AI រាងកាយក្នុងតម្លៃ 3,499 ដុល្លារ។

ប្រភព៖ https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html