3月25日にライブ配信されたイベントで、OpenAIはChatGPTを使ってチャットボットに話しかけるだけで画像を編集できるデモを行いました。例えば、街中のカタツムリの写真を作成し、帽子などのディテールを追加したり、背景を変更したりといった操作が可能です。
ChatGPTによって生成された画像。写真:OpenAI
OpenAIによると、ChatGPTは明確な入力があればより高品質な画像を生成でき、仕事でグラフを描いたりロゴをデザインしたりするのに役立つという。ユーザーはチャットボットにメニューや地図の作成を依頼したり、画像レイアウトに関する複雑な指示を実行したりできる。
OpenAIは、汎用アプリケーションを目指し、ChatGPTに検索、音声アシスタント、動画作成などの機能を統合しています。最新の改良により、ChatGPTはイーロン・マスクのGrokをはじめとする他のチャットボットとの競争力を高め、個人と企業の両方のニーズに対応できるようになります。
それでも、ChatGPTの画像生成は完璧ではありません。例えば、画像にスペルミスが生じることがあります。OpenAIによると、これらのエラーは、ユーザーの指示が十分に具体的でない場合によく発生します。また、このAIは小さな文字やラテンアルファベット以外の文字を生成するのにも苦労しています。
CEOのサム・アルトマン氏によると、ChatGPTは高精細度のため、画像生成に約1分かかるとのことです。GPT-4oはDALL·Eに代わり、ChatGPTのデフォルトの画像生成モデルとなり、ChatGPT Free、Plus、Team、Proを含むすべてのユーザーが利用できます。
OpenAIは、昨年リリースされたGPT-4oの進歩は、モデルのトレーニングデータにラベルを付けた「人間のコーチ」のチームによって可能になったと述べている。
しかし、画像生成におけるAIの利用は依然として議論の的となっており、一部のアーティストはこれらのツールが作品を「模倣」し、生計を脅かすのではないかと懸念している。OpenAIによると、GPT-4oは公開データとShutterstockなどのパートナーからの独自ソースに基づいて学習されたという。
(WSJ、ブルームバーグによると)
出典: https://vietnamnet.vn/chatgpt-tao-anh-sieu-thuc-ve-do-thi-cho-nguoi-dung-2384665.html
コメント (0)