ChatGPT „rysuje jak fotografia”
26 marca globalne i wietnamskie społeczności użytkowników sztucznej inteligencji zawrzały, gdy OpenAI oficjalnie udostępniło Images in ChatGPT, narzędzie do tworzenia obrazów, przeznaczone dla użytkowników swojego inteligentnego modelu. Wcześniej ChatGPT również posiadał funkcje tworzenia obrazów, ale były one ograniczone i opierały się na innym, dobrze znanym modelu przetwarzania tekstu na obraz o nazwie DALL-E.
Możliwość przekształcania tekstu w rysunki i wykonywania „scalania obrazów o jakości Photoshopa” szybko przyciągnęła uwagę. Wielu użytkowników określiło jakość obrazu wyjściowego jako „zadziwiającą”, a większość oceniła ją jako „lepszą” niż inne popularne modele sztucznej inteligencji dostępne na rynku.
ChatGPT tworzy realistyczne obrazy filiżanek kawy za pomocą jednego polecenia.
Według Gabriela Goha, szefa działu badań w OpenAI, znaczącą poprawą możliwości generowania obrazów przez ChatGPT z wykorzystaniem modelu GPT-4o jest „wiązanie” – termin ten odnosi się do stopnia, w jakim generator obrazów AI utrzymuje powiązania między atrybutami i obiektami. Goh twierdzi, że GPT-4o może precyzyjnie i bezbłędnie łączyć atrybuty dla 15-20 różnych obiektów, co znacząco poprawia dokładność i niezawodność generowanych treści.
Images in ChatGPT nie tylko doskonale radzi sobie z tworzeniem obrazów, ale także rozwiązuje kluczowy problem innych narzędzi AI do tworzenia obrazów: renderowanie tekstu w obrazach. W rzeczywistości wiele obrazów zawierających tekst jest renderowanych dokładnie, co utrudnia odróżnianie obrazów prawdziwych od fałszywych.
Wadą narzędzia jest stosunkowo długi czas generowania obrazu, co jednak uznaje się za uzasadnione, ponieważ opóźnienie wynika z faktu, że wysokiej jakości obrazy z dokładnymi szczegółami i zgodne z opisem użytkownika zawsze wymagają cierpliwości. Zespół badawczy stwierdził, że problem z opóźnieniem zostanie rozwiązany w przyszłości.
Wiele obaw budzi możliwość manipulacji obrazem.
Poza początkową przyjemnością, jaką ChatGPT i OpenAI oferują użytkownikom, ponownie na pierwszy plan wysunęły się obawy dotyczące bezpieczeństwa informacji, prywatności i ryzyka wykorzystania. „Wkrótce obrazy, które widzisz w internecie, niekoniecznie będą prawdziwe” – wyraził swoje obawy użytkownik Facebooka z Wietnamu, który mógł poprosić ChatGPT o stworzenie całkowicie sfabrykowanych obrazów, które wyglądałyby równie realistycznie jak fotografie, na przykład zdjęcia aktora i byłego zapaśnika Dwayne'a Johnsona (The Rock) reklamującego markę gumy do żucia lub kota kaliko siedzącego na kuchence, który wygląda dokładnie jak fotografia.
Dzięki szczegółowym poleceniom użytkownicy mogą uzyskać zaskakujące rezultaty bez konieczności posiadania dogłębnej wiedzy na temat tradycyjnych narzędzi do edycji zdjęć.
W rzeczywistości wiele osób wypróbowało nawet funkcję „rozbierania” nowego narzędzia. TN ( Hanoi ) powiedziała, że wykorzystała zdjęcie modelki z internetu, aby poprosić ChatGPT o zmianę ubrania zgodnie z jej prośbą i prawie wszystkie prośby zostały zrealizowane z dużą dokładnością. „Jednakże zdarzyło się kilka razy, że prośby zostały odrzucone, głównie z powodu naruszenia polityki systemu dotyczącej tworzenia obrazów chronionych prawem autorskim lub treści nadmiernie sugestywnych” – dodała TN.
W testach przeprowadzonych przez gazetę Thanh Nien , ChatGPT odmówił tworzenia obrazów związanych ze znanymi lub chronionymi prawami autorskimi postaciami ze świata rzeczywistego, filmów i komiksów. „Nie mogę stworzyć obrazu zgodnie z żądaniem, ponieważ przesłany obraz referencyjny wyraźnie przedstawia Doktora Strange’a – postać Marvela chronioną prawami autorskimi – a to narusza naszą aktualną politykę treści” – odpowiedział system, gdy poproszono go o stworzenie obrazu Doktora Strange’a siedzącego… pijącego mrożoną herbatę w Wietnamie.
Jackie Shannon, szefowa działu produktów multimodalnych w ChatGPT, potwierdza, że obrazy w ChatGPT oferują solidną ochronę przed treściami deepfake, pornograficznymi i oszukańczymi. Co istotne, generowane obrazy zawierają standardowe metadane C2PA, które identyfikują je jako produkty AI, ale wymagają osobnego narzędzia do weryfikacji.
Jednak wiele osób nadal z powodzeniem „obchodzi zasady” i wykorzystuje wizerunki celebrytów w celach rozrywkowych. Na przykład zdjęcie prezesa Tima Cooka trzymającego telefon Samsung zamiast iPhone'a, zdjęcie aktora Roberta Downeya Jr. żującego cukierka warzywnego, czy seria obrazów Cristiano Ronaldo i Lionela Messiego rywalizujących o piłkę w małej uliczce w Wietnamie na oczach wielu gapiów…
Source: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Komentarz (0)