MidJourneyのモデルV7は、手などのディテールをより安定して再現できるという。写真: Xeophon |
ウェブ上で最初の AI 搭載画像ジェネレーターの 1 つである Midjourney が、ほぼ 1 年ぶりに最初の新モデルをリリースしました。
V7と呼ばれるこのモデルは、4月4日深夜(米国時間)にベータ版としてリリースされました。OpenAIは1週間前にChatGPTで同様の機能をリリースし、ジブリ風の写真を作成するという新しいトレンドとともに、たちまちソーシャルメディアで話題となりました。
Midjourneyを初めてご利用になる場合は、まず、あなたの好みに基づいて提案された200枚の画像を評価する必要があります。評価すると、あなたの美的感覚に合った写真を作成するためのパーソナライズされたプロフィールが作成されます。V7は、Midjourneyで初めてパーソナライゼーションがデフォルトで有効になったモデルです。
ウェブサイトの「バージョン」ツールバーをクリックすると、V7を有効または無効にできます。また、このモデルはMidjourneyのDiscordサーバーでも使用できます。
MidjourneyのCEO、David Holz氏はXの投稿でV7を「完全に異なるアーキテクチャ」と表現した。「V7はテキストコマンドの処理に関してははるかにスマートです」とHolz氏はDiscordで続けた。
彼は、このモデルは元画像の処理能力も非常に優れているとコメントしました。画質は大幅に向上し、完成度も高くなっています。手足などの体の部位からそばかすまで、陶器の模様は細部に至るまで一貫しています。
![]() |
V7モデルから作成されたサンプル画像。写真: X/MidJourney。 |
V7は、ターボモード(有料)とリラックスモードの2つのモードに加え、ドラフトモードと呼ばれる新しいツールを搭載しています。このモードでは、標準モードの10倍の速度とコストで画像を作成できます。ドラフトモードでは画質は低くなりますが、ユーザーはワンクリックで画像をアップグレードして再作成できます。
ホルツ氏によると、アップスケーリングやリテクスチャリングなど、Midjourneyの標準機能の一部はV7ではまだ利用できないとのことです。これらの機能は近い将来、おそらく今後2ヶ月以内に追加される予定です。
「これは全く新しいモデルであり、独自の長所と、おそらくいくつかの弱点も持ち合わせています」とホルツ氏はDiscordに記した。彼は、V7では新しい書き方が必要になる可能性が高いと指摘し、フィードバックを得るためにバージョンを試すよう人々に呼びかけた。
Techcrunchの記者カイル・ウィガーズ氏は、V7が基本的なコマンドをうまく実行したと指摘した。「Midjourneyのモデルは、少なくとも公式にはジブリ風に最適化されているわけではないが、それでも美的に美しい作品を生み出すことはできる」と付け加えた。
ベトナムのAI専門家によると、ChatGPTの画像生成機能は、MidJourneyやStable Diffusionといった初期の画像生成ツールよりも使いやすく便利である可能性があるとのことです。しかし、OpenAIのモデルは画像品質においてまだ画期的な進歩を遂げておらず、以前のツールよりも劣っている可能性があります。
Midjourneyはかなり珍しい企業です。PC周辺機器メーカーLeap Motionの共同創業者であるホルツ氏によって2022年に設立されたMidjourneyは、これまで外部からの投資を一切受けていません。
同社は収益を公表していないが、CBInsightsは2023年末までにミッドジャーニーの収益が約2億ドルに達すると予測している。同社は最近、非公開のプロジェクトに取り組むためのハードウェアチームを構築中であり、以前に発表したモデルのトレーニングを継続して行い、 動画や3Dオブジェクトを作成していると発表している。
ChatGPTと同様に、MidJourneyも、画像作成者の同意を得ずにウェブから収集した画像でAIツールをトレーニングすることで、何百万人ものアーティストの権利を侵害したとして、複数の訴訟に直面している。
出典: https://znews.vn/mo-hinh-tao-anh-ai-tot-hon-chatgpt-post1543472.html
コメント (0)