Google Gemini ເອົາ AI ໄປສູ່ລະດັບຕໍ່ໄປ: ປ່ຽນພື້ນຫລັງ, ຊົງຜົມ, ແລະລວມຮູບພາບດ້ວຍຄໍາສັ່ງດຽວ

ດ້ວຍການປັບປຸງໃຫມ່, Google Gemini ອະນຸຍາດໃຫ້ຜູ້ໃຊ້ສາມາດປ່ຽນພື້ນຫລັງ, ຊົງຜົມ, ແລະຮູບພາບ collage ໃນຂະນະທີ່ຮັກສາໃບຫນ້າຂອງຫົວຂໍ້ແລະການກໍານົດລັກສະນະຕ່າງໆ.

VietNamNet•27/08/2025

ການຍົກລະດັບ Google Gemini ໃຊ້ຮູບແບບຮູບພາບ "nano banana" ທີ່ພັດທະນາໂດຍ Google DeepMind. ຕອນນີ້ຄຸນສົມບັດນີ້ສາມາດໃຊ້ໄດ້ທົ່ວໂລກສຳລັບທັງຜູ້ໃຊ້ທີ່ເສຍເງິນ ແລະເສຍເງິນ. ຄວາມເຂັ້ມແຂງທີ່ໃຫຍ່ທີ່ສຸດຂອງມັນແມ່ນຄວາມສາມາດໃນການຮັກສາໃບຫນ້າແລະວັດຖຸທີ່ສອດຄ່ອງໃນຮູບພາບ, ບາງສິ່ງບາງຢ່າງເຄື່ອງມື AI ອື່ນໆມັກຈະຕໍ່ສູ້ກັບ.

Nicole Brichtova, ຜູ້ນໍາພາຜະລິດຕະພັນຂອງ DeepMind ກ່າວວ່າ "ພວກເຮົາໄດ້ຊຸກຍູ້ຄຸນນະພາບຮູບພາບແລະຄວາມສາມາດຂອງຕົວແບບໃນການປະຕິບັດຕາມຄໍາແນະນໍາ." "ການອັບເດດນີ້ເຮັດໃຫ້ການແກ້ໄຂທີ່ລຽບງ່າຍແລະຜົນໄດ້ຮັບແມ່ນດີພໍທີ່ຈະໃຊ້ສໍາລັບຈຸດປະສົງໃດກໍ່ຕາມ."

ຮັກສາ "ເຈົ້າ" ໃນທຸກໆຮູບ

ຫນຶ່ງໃນສິ່ງທີ່ເຮັດໃຫ້ຮູບພາບ AI ເບິ່ງປອມແມ່ນວ່າລາຍລະອຽດຂະຫນາດນ້ອຍໄດ້ຮັບການບິດເບືອນ. Google ກ່າວວ່າ Gemini ແກ້ໄຂບັນຫານີ້, ຊ່ວຍໃຫ້ທ່ານສາມາດປ່ຽນ scene ທັງຫມົດໃນຂະນະທີ່ຮັກສາໃບຫນ້າແລະການສະແດງອອກຄືກັນ. ທ່ານສາມາດລອງຊົງຜົມໃໝ່, ປ່ຽນສີຂອງຝາ, ຫຼືເອົາສັດລ້ຽງເຂົ້າມາໃນສາກໄດ້ໂດຍບໍ່ຕ້ອງກັງວົນກ່ຽວກັບການບິດເບືອນຮູບພາບ.

ຜະສົມຮູບພາບເຂົ້າກັນ.gif — ຮວມຮູບພາບກັບບໍລິບົດໃໝ່ຈາກສອງຮູບທີ່ມີຢູ່ແລ້ວໂດຍໃຊ້ Google Gemini. ແຫຼ່ງຂໍ້ມູນ: Google

Gemini ຍັງອະນຸຍາດໃຫ້ທ່ານສາມາດອັບໂຫລດຮູບຫຼາຍຮູບເພື່ອສົມທົບເຂົ້າໄປໃນຫນຶ່ງ, ເຊັ່ນ: ການສົມທົບຮູບຄົນກັບ cat ຂອງທ່ານເພື່ອສ້າງຮູບພາບຂອງທ່ານທັງສອງຂີ່ຮ່ວມກັນໃນຖະຫນົນຫົນທາງ.

Gemini ສະຫນັບສະຫນູນການແກ້ໄຂຫຼາຍຫັນ, ໃຫ້ຜູ້ໃຊ້ສາມາດເພີ່ມທຸກລາຍລະອຽດໃສ່ພື້ນທີ່: ຈາກຮູບວໍເປເປີ, ເຄື່ອງເຟີນີເຈີ, ເພື່ອທາສີ. ຈຸດບວກແມ່ນວ່າພຽງແຕ່ສ່ວນທີ່ຕ້ອງໄດ້ຮັບການແກ້ໄຂການປ່ຽນແປງ, ສ່ວນທີ່ເຫຼືອຍັງຄົງຢູ່ຄືກັນ.

ນອກຈາກນັ້ນ, Gemini ສາມາດປະສົມຮູບແບບລະຫວ່າງຮູບພາບ. ຕົວຢ່າງເຊັ່ນ, ປ່ຽນເກີບຝົນເປັນເກີບພິມດອກໄມ້, ຫຼືສ້າງເຄື່ອງນຸ່ງທີ່ມີຮູບແບບຜີເສື້ອ.

ການແຂ່ງຂັນການສ້າງຮູບພາບ AI ລະຫວ່າງຍັກໃຫຍ່ເຕັກໂນໂລຢີ

ການຍົກລະດັບຂອງ Google ເກີດຂຶ້ນໃນຂະນະທີ່ສົງຄາມການຖ່າຍຮູບ AI ຮ້ອນຂຶ້ນ. OpenAI ຜ່ານມາໄດ້ເປີດຕົວ GPT-4o, ເຊິ່ງສາມາດສ້າງຮູບພາບໂດຍກົງ, ແລະໄດ້ແຜ່ລາມໄປດ້ວຍຊຸດຂອງ memes ແບບ Studio Ghibli. CEO Sam Altman ເປີດເຜີຍວ່າຈໍານວນຜູ້ໃຊ້ເພີ່ມຂຶ້ນຫຼາຍຈົນ GPU ຂອງບໍລິສັດເກືອບ "ລະລາຍ".

ເພື່ອຮັກສາ, Meta ປະກາດການຮ່ວມມືກັບ Midjourney, ໃນຂະນະທີ່ການເລີ່ມຕົ້ນຂອງເຢຍລະມັນ Black Forest Labs ທີ່ມີຮູບແບບ FLUX ກໍາລັງຄອບງໍາຫຼາຍຕາຕະລາງ.

ຫຼາຍ turn editing.gif — ຄວາມສາມາດໃນການແກ້ໄຂຮູບພາບຫຼາຍຂັ້ນຕອນຂອງ Google Gemini. ແຫຼ່ງຂໍ້ມູນ: Google

Google ຫວັງວ່າ Gemini ສາມາດປິດຊ່ອງຫວ່າງກັບ ChatGPT. ອີງຕາມ CEO Sundar Pichai, Gemini ປະຈຸບັນມີ 450 ລ້ານຜູ້ໃຊ້ປະຈໍາເດືອນ, ຕ່ໍາກວ່າ ChatGPT ຫຼາຍ, ເຊິ່ງມີຫຼາຍກວ່າ 700 ລ້ານຄົນຕໍ່ອາທິດ.

Brichtova ກ່າວວ່າ Gemini ຖືກອອກແບບມາສໍາລັບສະຖານະການທີ່ແທ້ຈິງ, ຈາກການເບິ່ງເຫັນຫ້ອງດໍາລົງຊີວິດແລະສວນເພື່ອການສ້າງຮູບພາບທີ່ບັນເທີງ. ຮູບແບບດັ່ງກ່າວມີ "ຄວາມຮູ້ ຂອງໂລກ " ທີ່ດີກວ່າ, ແລະສາມາດລວມຮູບພາບແລະສີຫຼາຍສີເຂົ້າໄປໃນການສະແດງຜົນດຽວ.

ຢ່າງໃດກໍຕາມ, Google ຍັງກໍານົດຂອບເຂດຈໍາກັດຢ່າງເຂັ້ມງວດ. ຮູບພາບທີ່ສ້າງຂຶ້ນທັງໝົດມີລາຍນ້ຳທີ່ຊັດເຈນ ແລະຕົວລະບຸທີ່ເຊື່ອງໄວ້ໃນເມຕາເດຕາ. ບໍລິສັດໄດ້ຫ້າມຢ່າງເຂັ້ມງວດໃນການສ້າງຮູບພາບທີ່ລະອຽດອ່ອນໂດຍບໍ່ສະໝັກໃຈເພື່ອປ້ອງກັນການລ່ວງລະເມີດຢ່າງເລິກເຊິ່ງ.

ກ່ອນຫນ້ານີ້ Google ໄດ້ຂໍອະໄພສໍາລັບຮູບພາບປະຫວັດສາດທີ່ບໍ່ຖືກຕ້ອງຂອງ Gemini. ເວລານີ້, ບໍລິສັດເຊື່ອວ່າມັນໄດ້ສ້າງຄວາມສົມດຸນລະຫວ່າງຄວາມຄິດສ້າງສັນແລະຄວາມປອດໄພ. Brichtova ເນັ້ນຫນັກວ່າ "ພວກເຮົາຕ້ອງການໃຫ້ຜູ້ໃຊ້ມີຄວາມຄິດສ້າງສັນ, ແຕ່ບໍ່ແມ່ນທຸກສິ່ງທຸກຢ່າງທີ່ຖືກອະນຸຍາດ."

ດ້ວຍ Gemini 2.5 Flash Image, Google ກໍາລັງພະນັນກ່ຽວກັບການຍົກລະດັບປະສົບການການແກ້ໄຂຮູບພາບ AI, ຫວັງວ່າຈະຮັກສາຜູ້ໃຊ້ເກົ່າແລະດຶງດູດຄົນໃຫມ່ໃນການແຂ່ງຂັນເຕັກໂນໂລຢີທີ່ຮຸນແຮງກັບ OpenAI, Meta ແລະຄູ່ແຂ່ງອື່ນໆ.

(ອີງຕາມ TechCrunch, Tom's Guide)

ດ້ວຍເງິນ 85 ລ້ານດົ່ງຕໍ່ 'ສະໝອງ', Nvidia ໄດ້ເປີດທາງສູ່ຍຸກທີ່ມະນຸດສ້າງຫຸ່ນຍົນ. Nvidia ໄດ້ເປີດຕົວ Jetson AGX Thor - ຊິບທີ່ມີຊື່ວ່າ "ສະຫມອງຫຸ່ນຍົນ", ສາມາດຊ່ວຍໃຫ້ເຄື່ອງຈັກເບິ່ງເຫັນ, ຄິດແລະປະຕິບັດຄືກັບມະນຸດ, ເປີດການແຂ່ງຂັນ AI ທາງດ້ານຮ່າງກາຍໃນລາຄາ 3,499 ໂດລາ.

ທີ່ມາ: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html