O V7, modelo da MidJourney, é considerado capaz de produzir detalhes como mãos com maior consistência. Foto: Xeophon . |
A Midjourney, uma das primeiras ferramentas de criação de imagens com inteligência artificial na web, acaba de lançar seu primeiro novo modelo em quase um ano.
O modelo, chamado V7, foi lançado em fase beta à meia-noite do dia 4 de abril (horário dos EUA). Uma semana antes, a OpenAI também havia lançado um recurso semelhante com o ChatGPT, que rapidamente se tornou uma sensação nas redes sociais, criando uma nova tendência de fotos no estilo Ghibli.
Se você é novo no Midjourney, primeiro precisará avaliar as 200 imagens sugeridas pela ferramenta, com base em suas preferências. Em seguida, a ferramenta criará um perfil personalizado para produzir imagens que correspondam à sua estética. O V7 é o primeiro modelo do Midjourney a ter a personalização ativada por padrão.
Você pode ativar ou desativar a versão 7 clicando na barra de ferramentas "versão" no site. Além disso, este modelo pode ser usado no servidor Discord da Midjourney.
David Holz, CEO da Midjourney, descreveu o V7 como uma "arquitetura completamente diferente" em uma publicação no X. "O V7 é muito mais inteligente no que diz respeito ao processamento de instruções de texto", anunciou Holz ainda no Discord.
Ele comentou que o modelo também lida muito bem com as imagens originais. A qualidade da imagem é visivelmente melhorada, com um alto grau de detalhe. De partes do corpo como mãos e pés a sardas e padrões de cerâmica, tudo é consistente até o menor detalhe.
![]() |
Algumas imagens de exemplo foram criadas usando o modelo V7. Foto: X/MidJourney. |
Além dos dois modos Turbo (mais caro) e Relax, a versão 7 oferece uma nova ferramenta chamada Modo Rascunho, que permite a criação de imagens até 10 vezes mais rápido e pela metade do custo do modo padrão. As imagens no Modo Rascunho terão qualidade inferior, mas os usuários podem redimensioná-las e recriá-las com apenas um clique.
Segundo Holz, alguns recursos padrão do Midjourney estão indisponíveis na versão 7, incluindo o aumento de escala e a retexturização. Ele afirmou que esses recursos serão adicionados em breve, possivelmente nos próximos dois meses.
“Este é um modelo completamente novo, com seus próprios pontos fortes e talvez algumas fraquezas também”, escreveu Holz no Discord. Ele observou que a versão 7 pode exigir um novo estilo de escrita na linha de comando e incentivou todos a experimentarem a versão para fornecer feedback construtivo.
O repórter do Techcrunch, Kyle Wiggers, comentou que o V7 conseguiu executar seus comandos básicos com eficiência. "O modelo da Midjourney não é especificamente otimizado para o estilo Ghibli, pelo menos não oficialmente, mas ainda assim consegue produzir trabalhos esteticamente agradáveis", acrescentou.
Segundo especialistas em IA no Vietnã, o recurso de geração de imagens do ChatGPT pode ser mais fácil e conveniente de usar do que ferramentas anteriores, como MidJourney e Stable Diffusion. No entanto, o modelo da OpenAI ainda não apresentou um avanço significativo em termos de qualidade de imagem e pode ser inferior a ferramentas anteriores.
A Midjourney é uma empresa bastante singular. Fundada em 2022 por Holz, cofundador da fabricante de periféricos para PC Leap Motion, a Midjourney nunca recebeu nenhum investimento externo.
A empresa também não divulga seu desempenho comercial, mas a CBInsights estimou que a receita da Midjourney no final de 2023 seria de cerca de US$ 200 milhões . Recentemente, a empresa afirmou que está formando uma equipe de hardware para trabalhar em diversos projetos não divulgados e continuando a treinar modelos previamente anunciados para criar vídeos e objetos em 3D.
Assim como o ChatGPT, o MidJourney enfrenta diversos processos judiciais que alegam violações dos direitos de milhões de artistas, por treinar ferramentas de IA em imagens coletadas da internet sem o consentimento dos criadores das imagens.
Fonte: https://znews.vn/mo-hinh-tao-anh-ai-tot-hon-chatgpt-post1543472.html







Comentário (0)