ChatGPT „rysuje jak zdjęcie”
26 marca społeczność użytkowników sztucznej inteligencji (AI) na całym świecie , a także w Wietnamie, zawrzała, gdy OpenAI oficjalnie udostępniło funkcję „Images in ChatGPT”, skupiającą się na możliwościach tworzenia obrazów dla użytkowników inteligentnego modelu firmy. Wcześniej ChatGPT również posiadał możliwość tworzenia obrazów, ale była ona ograniczona i musiała korzystać z innego, znanego modelu przetwarzania tekstu na obraz, DALL-E.
Możliwość przekształcania tekstu w rysunki i „łączenia obrazów jak w Photoshopie” szybko przyciągnęła uwagę. Wielu użytkowników stwierdziło, że jakość obrazu wyjściowego jest „niesamowita”, a większość oceniła ją jako „lepszą” w porównaniu z popularnymi modelami sztucznej inteligencji dostępnymi na rynku.
ChatGPT tworzy realistyczne filiżanki do kawy za pomocą prostego polecenia
Według Gabriela Goha, kierownika zespołu badawczego w OpenAI, znaczącą poprawą możliwości generowania obrazów przez ChatGPT z wykorzystaniem modelu GPT-4o jest „wiązanie” – termin określający stopień, w jakim generator obrazów AI utrzymuje połączenie między atrybutami i obiektami. Pan Goh zapewnił, że GPT-4o może precyzyjnie łączyć atrybuty dla 15-20 różnych obiektów bez pomyłek, co znacząco poprawia dokładność i niezawodność generowanych treści.
Images in ChatGPT nie tylko wyróżnia się swoimi możliwościami tworzenia obrazów, ale również rozwiązuje „fatalną” słabość innych narzędzi AI do generowania obrazów, czyli wyświetlanie tekstu i napisów wewnątrz obrazu. W rzeczywistości wiele obrazów zawierających tekst jest wyświetlanych poprawnie, co jeszcze bardziej utrudnia odróżnienie ich od oryginału.
Wadą tego narzędzia jest długi czas generowania obrazów, ale jest to uważane za uzasadnione, ponieważ opóźnienie jest spowodowane tym, że obrazy dobrej jakości, dokładne szczegóły i dopasowanie do opisu użytkownika zawsze wymagają cierpliwości. Zespół badawczy zapowiedział, że problem z opóźnieniem zostanie rozwiązany w przyszłości.
Wiele obaw dotyczących możliwości łączenia zdjęć
Oprócz początkowej przyjemności, jaką ChatGPT i OpenAI oferują użytkownikom, kwestia bezpieczeństwa informacji, prywatności, a także ryzyka wykorzystania danych ponownie wysuwa się na pierwszy plan. „W niedalekiej przyszłości obrazy, które widzisz w internecie, niekoniecznie będą prawdziwe” – wyraził zaniepokojenie pewien użytkownik Facebooka z Wietnamu, który mógłby poprosić ChatGPT o stworzenie całkowicie nierealnych obrazów, które wyglądałyby równie realistycznie jak zdjęcia, na przykład zdjęcia aktora i byłego wrestlera Dwayne'a Johnsona (The Rock) reklamującego markę gumy do żucia lub zdjęcia kota kaliko siedzącego na kuchence, które wygląda dokładnie jak zdjęcie.
Dzięki szczegółowym poleceniom użytkownicy mogą tworzyć zaskakujące rezultaty bez konieczności posiadania specjalistycznej wiedzy na temat obsługi tradycyjnych narzędzi do edycji zdjęć.
Wiele osób wypróbowało nawet funkcję „rozbierania” nowego narzędzia. TN ( Hanoi ) powiedział, że użył zdjęcia modelki pobranego z internetu, aby poprosić ChatGPT o zmianę ubrania na żądanie i prawie wszystkie zamówienia zostały zrealizowane z dużą dokładnością. „Jednak nadal zdarzały się odrzucenia, głównie z powodu naruszenia polityki systemu dotyczącej tworzenia obrazów chronionych prawem autorskim lub treści o charakterze nadmiernie seksualnym” – dodał TN.
W testach Thanh Niena , ChatGPT odmówił tworzenia obrazów związanych ze znanymi lub chronionymi prawami autorskimi postaciami ze świata rzeczywistego, filmów i opowiadań. „Nie mogę stworzyć obrazu zgodnie z żądaniem, ponieważ przesłany obraz referencyjny wyraźnie przedstawia postać Doktora Strange'a – postać chronioną prawami autorskimi Marvela, co narusza obowiązującą politykę treści” – odpowiedział system, gdy poproszono go o stworzenie obrazu przedstawiającego Doktora Strange'a siedzącego... i pijącego mrożoną herbatę w Wietnamie.
Jackie Shannon, szefowa działu produktów multimodalnych w ChatGPT, potwierdziła, że obrazy w ChatGPT oferują solidną ochronę przed treściami typu deepfake, pornografią i oszustwami. Co istotne, wygenerowane obrazy będą integrować metadane w standardzie C2PA, aby oznaczać je jako produkty AI, ale do ich weryfikacji potrzebne będą osobne narzędzia.
Jednak wciąż wiele osób z powodzeniem „nagina prawo” i wykorzystuje wizerunki znanych osób w celach rozrywkowych. Na przykład zdjęcie prezesa Tima Cooka trzymającego telefon Samsung zamiast iPhone'a, aktora Roberta Downeya Jr. żującego cukierka warzywnego, czy zdjęcie Cristiano Ronaldo grającego w piłkę z Lionelem Messim w małej uliczce w Wietnamie na oczach wielu ludzi…
Source: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Komentarz (0)