ການຍົກລະດັບ Google Gemini ໃຊ້ຮູບແບບຮູບພາບ "nano banana" ທີ່ພັດທະນາໂດຍ Google DeepMind. ຕອນນີ້ຄຸນສົມບັດນີ້ສາມາດໃຊ້ໄດ້ທົ່ວໂລກສຳລັບທັງຜູ້ໃຊ້ທີ່ເສຍເງິນ ແລະເສຍເງິນ. ຄວາມເຂັ້ມແຂງທີ່ໃຫຍ່ທີ່ສຸດຂອງມັນແມ່ນຄວາມສາມາດໃນການຮັກສາໃບຫນ້າແລະວັດຖຸທີ່ສອດຄ່ອງໃນຮູບພາບ, ບາງສິ່ງບາງຢ່າງເຄື່ອງມື AI ອື່ນໆມັກຈະຕໍ່ສູ້ກັບ.
Nicole Brichtova, ຜູ້ນໍາພາຜະລິດຕະພັນຂອງ DeepMind ກ່າວວ່າ "ພວກເຮົາໄດ້ຊຸກຍູ້ຄຸນນະພາບຂອງຮູບພາບແລະຄວາມສາມາດຂອງຕົວແບບໃນການປະຕິບັດຕາມຄໍາແນະນໍາ." "ການປັບປຸງນີ້ເຮັດໃຫ້ການແກ້ໄຂມີຄວາມສອດຄ່ອງຫຼາຍແລະຜົນໄດ້ຮັບແມ່ນດີພໍທີ່ຈະໃຊ້ສໍາລັບຈຸດປະສົງໃດກໍ່ຕາມ."
ຮັກສາ "ເຈົ້າ" ໃນທຸກໆຮູບ
ຫນຶ່ງໃນສິ່ງທີ່ເຮັດໃຫ້ຮູບພາບ AI ເບິ່ງປອມແມ່ນວ່າລາຍລະອຽດຂະຫນາດນ້ອຍໄດ້ຮັບການບິດເບືອນ. Google ກ່າວວ່າ Gemini ແກ້ໄຂບັນຫານີ້, ຊ່ວຍໃຫ້ທ່ານສາມາດປ່ຽນ scene ທັງຫມົດໃນຂະນະທີ່ຮັກສາໃບຫນ້າແລະການສະແດງອອກຄືກັນ. ທ່ານສາມາດລອງຊົງຜົມໃໝ່, ປ່ຽນສີຂອງຝາ, ຫຼືເອົາສັດລ້ຽງເຂົ້າມາໃນ scene ໂດຍບໍ່ຕ້ອງກັງວົນກ່ຽວກັບການບິດເບືອນຮູບພາບ.

Gemini ຍັງອະນຸຍາດໃຫ້ທ່ານສາມາດອັບໂຫລດຮູບຫຼາຍຮູບເພື່ອສົມທົບເຂົ້າໄປໃນຫນຶ່ງ, ເຊັ່ນ: ການສົມທົບຮູບຄົນກັບ cat ຂອງທ່ານເພື່ອສ້າງຮູບພາບຂອງທ່ານທັງສອງຂີ່ຮ່ວມກັນໃນຖະຫນົນຫົນທາງ.
Gemini ສະຫນັບສະຫນູນການແກ້ໄຂຫຼາຍຫັນ, ໃຫ້ຜູ້ໃຊ້ສາມາດເພີ່ມທຸກລາຍລະອຽດໃສ່ພື້ນທີ່: ຈາກຮູບວໍເປເປີ, ເຄື່ອງເຟີນີເຈີ, ເພື່ອທາສີ. ຈຸດບວກແມ່ນວ່າພຽງແຕ່ສ່ວນທີ່ຕ້ອງໄດ້ຮັບການແກ້ໄຂການປ່ຽນແປງ, ສ່ວນທີ່ເຫຼືອຍັງຄົງຢູ່ຄືກັນ.
ນອກຈາກນັ້ນ, Gemini ສາມາດປະສົມຮູບແບບລະຫວ່າງຮູບພາບ. ຕົວຢ່າງເຊັ່ນ, ປ່ຽນເກີບຝົນເປັນເກີບພິມດອກໄມ້, ຫຼືສ້າງເຄື່ອງນຸ່ງທີ່ມີຮູບແບບຜີເສື້ອ.
ການແຂ່ງຂັນການສ້າງຮູບພາບ AI ລະຫວ່າງຍັກໃຫຍ່ເຕັກໂນໂລຢີ
ການຍົກລະດັບຂອງ Google ເກີດຂຶ້ນໃນຂະນະທີ່ສົງຄາມຮູບພາບ AI ຮ້ອນຂຶ້ນ. OpenAI ຜ່ານມາໄດ້ເປີດຕົວ GPT-4o, ເຊິ່ງສາມາດສ້າງຮູບພາບໂດຍກົງ, ແລະໄດ້ແຜ່ລາມໄປດ້ວຍຊຸດຂອງ memes ແບບ Studio Ghibli. CEO Sam Altman ເປີດເຜີຍວ່າຈໍານວນຜູ້ໃຊ້ເພີ່ມຂຶ້ນຫຼາຍຈົນ GPU ຂອງບໍລິສັດ "ເກືອບຈະລະລາຍ."
ເພື່ອຮັກສາ, Meta ປະກາດການຮ່ວມມືກັບ Midjourney, ໃນຂະນະທີ່ການເລີ່ມຕົ້ນຂອງເຢຍລະມັນ Black Forest Labs ທີ່ມີຮູບແບບ FLUX ກໍາລັງຄອບງໍາຫຼາຍຕາຕະລາງ.

Google ຫວັງວ່າ Gemini ສາມາດປິດຊ່ອງຫວ່າງກັບ ChatGPT. Gemini ປະຈຸບັນມີຜູ້ໃຊ້ 450 ລ້ານຄົນຕໍ່ເດືອນ, ອີງຕາມ CEO Sundar Pichai, ໄກຈາກ ChatGPT, ເຊິ່ງມີຫຼາຍກວ່າ 700 ລ້ານຄົນຕໍ່ອາທິດ.
Brichtova ກ່າວວ່າ Gemini ຖືກອອກແບບມາສໍາລັບສະຖານະການທີ່ແທ້ຈິງ, ຈາກການເບິ່ງເຫັນຫ້ອງດໍາລົງຊີວິດແລະສວນເພື່ອການສ້າງຮູບພາບທີ່ບັນເທີງ. ຮູບແບບດັ່ງກ່າວມີ "ຄວາມຮູ້ ຂອງໂລກ " ທີ່ດີກວ່າ, ແລະສາມາດລວມຮູບພາບແລະສີຫຼາຍສີເຂົ້າໄປໃນການສະແດງຜົນດຽວ.
ຢ່າງໃດກໍຕາມ, Google ຍັງກໍານົດຂອບເຂດຈໍາກັດຢ່າງເຂັ້ມງວດ. ຮູບພາບທີ່ສ້າງຂຶ້ນທັງໝົດມີລາຍນໍ້າທີ່ຊັດເຈນ ແລະເຄື່ອງໝາຍການລະບຸຕົວຕົນທີ່ເຊື່ອງໄວ້ໃນເມຕາເດຕາ. ບໍລິສັດໄດ້ຫ້າມຢ່າງເຂັ້ມງວດການສ້າງຮູບພາບທີ່ລະອຽດອ່ອນໂດຍບໍ່ມີການອະນຸຍາດເພື່ອປ້ອງກັນການລ່ວງລະເມີດເລິກ.
ກ່ອນຫນ້ານີ້ Google ໄດ້ຂໍອະໄພສໍາລັບຮູບພາບປະຫວັດສາດທີ່ບໍ່ຖືກຕ້ອງຂອງ Gemini. ເວລານີ້, ບໍລິສັດເຊື່ອວ່າມັນໄດ້ສ້າງຄວາມສົມດຸນລະຫວ່າງຄວາມຄິດສ້າງສັນແລະຄວາມປອດໄພ. Brichtova ເນັ້ນຫນັກວ່າ "ພວກເຮົາຕ້ອງການໃຫ້ຜູ້ໃຊ້ມີຄວາມຄິດສ້າງສັນ, ແຕ່ບໍ່ແມ່ນທຸກສິ່ງທຸກຢ່າງທີ່ຖືກອະນຸຍາດ."
ດ້ວຍ Gemini 2.5 Flash Image, Google ກໍາລັງພະນັນກ່ຽວກັບການຍົກລະດັບປະສົບການການແກ້ໄຂຮູບພາບ AI, ຫວັງວ່າຈະຮັກສາຜູ້ໃຊ້ເກົ່າແລະດຶງດູດຜູ້ໃຫມ່ໃນການແຂ່ງຂັນເຕັກໂນໂລຢີທີ່ຮຸນແຮງກັບ OpenAI, Meta, ແລະຄູ່ແຂ່ງອື່ນໆ.
(ອີງຕາມ TechCrunch, Tom's Guide)

ທີ່ມາ: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html
(0)