ການຍົກລະດັບ Google Gemini ໃຊ້ຮູບແບບຮູບພາບ "nano banana" ທີ່ພັດທະນາໂດຍ Google DeepMind. ຕອນນີ້ຄຸນສົມບັດນີ້ສາມາດໃຊ້ໄດ້ທົ່ວໂລກສຳລັບທັງຜູ້ໃຊ້ທີ່ເສຍເງິນ ແລະເສຍເງິນ. ຄວາມເຂັ້ມແຂງທີ່ໃຫຍ່ທີ່ສຸດຂອງມັນແມ່ນຄວາມສາມາດໃນການຮັກສາໃບຫນ້າແລະວັດຖຸທີ່ສອດຄ່ອງໃນຮູບພາບ, ບາງສິ່ງບາງຢ່າງເຄື່ອງມື AI ອື່ນໆມັກຈະຕໍ່ສູ້ກັບ.

Nicole Brichtova, ຜູ້ນໍາພາຜະລິດຕະພັນຂອງ DeepMind ກ່າວວ່າ "ພວກເຮົາໄດ້ຊຸກຍູ້ຄຸນນະພາບຂອງຮູບພາບແລະຄວາມສາມາດຂອງຕົວແບບໃນການປະຕິບັດຕາມຄໍາແນະນໍາ." "ການປັບປຸງນີ້ເຮັດໃຫ້ການແກ້ໄຂມີຄວາມສອດຄ່ອງຫຼາຍແລະຜົນໄດ້ຮັບແມ່ນດີພໍທີ່ຈະໃຊ້ສໍາລັບຈຸດປະສົງໃດກໍ່ຕາມ."

ຮັກສາ "ເຈົ້າ" ໃນທຸກໆຮູບ

ຫນຶ່ງໃນສິ່ງທີ່ເຮັດໃຫ້ຮູບພາບ AI ເບິ່ງປອມແມ່ນວ່າລາຍລະອຽດຂະຫນາດນ້ອຍໄດ້ຮັບການບິດເບືອນ. Google ກ່າວວ່າ Gemini ແກ້ໄຂບັນຫານີ້, ຊ່ວຍໃຫ້ທ່ານສາມາດປ່ຽນ scene ທັງຫມົດໃນຂະນະທີ່ຮັກສາໃບຫນ້າແລະການສະແດງອອກຄືກັນ. ທ່ານສາມາດລອງຊົງຜົມໃໝ່, ປ່ຽນສີຂອງຝາ, ຫຼືເອົາສັດລ້ຽງເຂົ້າມາໃນ scene ໂດຍບໍ່ຕ້ອງກັງວົນກ່ຽວກັບການບິດເບືອນຮູບພາບ.

ຜະສົມຮູບພາບເຂົ້າກັນ.gif
ຮວມຮູບພາບກັບບໍລິບົດໃໝ່ຈາກສອງຮູບທີ່ມີຢູ່ແລ້ວໂດຍໃຊ້ Google Gemini. ແຫຼ່ງຂໍ້ມູນ: Google

Gemini ຍັງອະນຸຍາດໃຫ້ທ່ານສາມາດອັບໂຫລດຮູບຫຼາຍຮູບເພື່ອສົມທົບເຂົ້າໄປໃນຫນຶ່ງ, ເຊັ່ນ: ການສົມທົບຮູບຄົນກັບ cat ຂອງທ່ານເພື່ອສ້າງຮູບພາບຂອງທ່ານທັງສອງຂີ່ຮ່ວມກັນໃນຖະຫນົນຫົນທາງ.

Gemini ສະຫນັບສະຫນູນການແກ້ໄຂຫຼາຍຫັນ, ໃຫ້ຜູ້ໃຊ້ສາມາດເພີ່ມທຸກລາຍລະອຽດໃສ່ພື້ນທີ່: ຈາກຮູບວໍເປເປີ, ເຄື່ອງເຟີນີເຈີ, ເພື່ອທາສີ. ຈຸດບວກແມ່ນວ່າພຽງແຕ່ສ່ວນທີ່ຕ້ອງໄດ້ຮັບການແກ້ໄຂການປ່ຽນແປງ, ສ່ວນທີ່ເຫຼືອຍັງຄົງຢູ່ຄືກັນ.

ນອກຈາກນັ້ນ, Gemini ສາມາດປະສົມຮູບແບບລະຫວ່າງຮູບພາບ. ຕົວຢ່າງເຊັ່ນ, ປ່ຽນເກີບຝົນເປັນເກີບພິມດອກໄມ້, ຫຼືສ້າງເຄື່ອງນຸ່ງທີ່ມີຮູບແບບຜີເສື້ອ.

ການແຂ່ງຂັນການສ້າງຮູບພາບ AI ລະຫວ່າງຍັກໃຫຍ່ເຕັກໂນໂລຢີ

ການຍົກລະດັບຂອງ Google ເກີດຂຶ້ນໃນຂະນະທີ່ສົງຄາມຮູບພາບ AI ຮ້ອນຂຶ້ນ. OpenAI ຜ່ານມາໄດ້ເປີດຕົວ GPT-4o, ເຊິ່ງສາມາດສ້າງຮູບພາບໂດຍກົງ, ແລະໄດ້ແຜ່ລາມໄປດ້ວຍຊຸດຂອງ memes ແບບ Studio Ghibli. CEO Sam Altman ເປີດເຜີຍວ່າຈໍານວນຜູ້ໃຊ້ເພີ່ມຂຶ້ນຫຼາຍຈົນ GPU ຂອງບໍລິສັດ "ເກືອບຈະລະລາຍ."

ເພື່ອຮັກສາ, Meta ປະກາດການຮ່ວມມືກັບ Midjourney, ໃນຂະນະທີ່ການເລີ່ມຕົ້ນຂອງເຢຍລະມັນ Black Forest Labs ທີ່ມີຮູບແບບ FLUX ກໍາລັງຄອບງໍາຫຼາຍຕາຕະລາງ.

ຫຼາຍ turn editing.gif
ຄວາມສາມາດໃນການແກ້ໄຂຮູບພາບຫຼາຍຂັ້ນຕອນຂອງ Google Gemini. ແຫຼ່ງຂໍ້ມູນ: Google

Google ຫວັງວ່າ Gemini ສາມາດປິດຊ່ອງຫວ່າງກັບ ChatGPT. Gemini ປະຈຸບັນມີຜູ້ໃຊ້ 450 ລ້ານຄົນຕໍ່ເດືອນ, ອີງຕາມ CEO Sundar Pichai, ໄກຈາກ ChatGPT, ເຊິ່ງມີຫຼາຍກວ່າ 700 ລ້ານຄົນຕໍ່ອາທິດ.

Brichtova ກ່າວວ່າ Gemini ຖືກອອກແບບມາສໍາລັບສະຖານະການທີ່ແທ້ຈິງ, ຈາກການເບິ່ງເຫັນຫ້ອງດໍາລົງຊີວິດແລະສວນເພື່ອການສ້າງຮູບພາບທີ່ບັນເທີງ. ຮູບແບບດັ່ງກ່າວມີ "ຄວາມຮູ້ ຂອງໂລກ " ທີ່ດີກວ່າ, ແລະສາມາດລວມຮູບພາບແລະສີຫຼາຍສີເຂົ້າໄປໃນການສະແດງຜົນດຽວ.

ຢ່າງໃດກໍຕາມ, Google ຍັງກໍານົດຂອບເຂດຈໍາກັດຢ່າງເຂັ້ມງວດ. ຮູບພາບທີ່ສ້າງຂຶ້ນທັງໝົດມີລາຍນໍ້າທີ່ຊັດເຈນ ແລະເຄື່ອງໝາຍການລະບຸຕົວຕົນທີ່ເຊື່ອງໄວ້ໃນເມຕາເດຕາ. ບໍລິສັດໄດ້ຫ້າມຢ່າງເຂັ້ມງວດການສ້າງຮູບພາບທີ່ລະອຽດອ່ອນໂດຍບໍ່ມີການອະນຸຍາດເພື່ອປ້ອງກັນການລ່ວງລະເມີດເລິກ.

ກ່ອນຫນ້ານີ້ Google ໄດ້ຂໍອະໄພສໍາລັບຮູບພາບປະຫວັດສາດທີ່ບໍ່ຖືກຕ້ອງຂອງ Gemini. ເວລານີ້, ບໍລິສັດເຊື່ອວ່າມັນໄດ້ສ້າງຄວາມສົມດຸນລະຫວ່າງຄວາມຄິດສ້າງສັນແລະຄວາມປອດໄພ. Brichtova ເນັ້ນຫນັກວ່າ "ພວກເຮົາຕ້ອງການໃຫ້ຜູ້ໃຊ້ມີຄວາມຄິດສ້າງສັນ, ແຕ່ບໍ່ແມ່ນທຸກສິ່ງທຸກຢ່າງທີ່ຖືກອະນຸຍາດ."

ດ້ວຍ Gemini 2.5 Flash Image, Google ກໍາລັງພະນັນກ່ຽວກັບການຍົກລະດັບປະສົບການການແກ້ໄຂຮູບພາບ AI, ຫວັງວ່າຈະຮັກສາຜູ້ໃຊ້ເກົ່າແລະດຶງດູດຜູ້ໃຫມ່ໃນການແຂ່ງຂັນເຕັກໂນໂລຢີທີ່ຮຸນແຮງກັບ OpenAI, Meta, ແລະຄູ່ແຂ່ງອື່ນໆ.

(ອີງຕາມ TechCrunch, Tom's Guide)

ດ້ວຍເງິນ 85 ລ້ານດົ່ງຕໍ່ 'ສະໝອງ', Nvidia ໄດ້ເປີດທາງສູ່ຍຸກທີ່ມະນຸດສ້າງຫຸ່ນຍົນ. Nvidia ໄດ້ເປີດຕົວ Jetson AGX Thor - ຊິບທີ່ມີຂະຫນານນາມວ່າ "ສະຫມອງຫຸ່ນຍົນ", ສາມາດຊ່ວຍໃຫ້ເຄື່ອງຈັກເບິ່ງເຫັນ, ຄິດແລະປະຕິບັດຄືກັບມະນຸດ, ເປີດການແຂ່ງຂັນ AI ທາງດ້ານຮ່າງກາຍໃນລາຄາ 3,499 ໂດລາ.

ທີ່ມາ: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html