A OpenAI recentemente anunciou o DALL-E 3, a nova versão do seu modelo de inteligência artificial (IA) para criação de imagens. De acordo com a empresa, agora as imagens criadas terão ainda mais qualidade.
Além disso, a nova versão será integrada ao ChatGPT (Plus e Enterprise), ao criador de imagens do Bing e ao Microsoft Designer. A previsão é que o novo recurso chegue em outubro.
Entre as melhorias prometidas com a nova versão, o DALL-E 3 será capaz de criar imagens melhores, como criar textos e mãos humanas.
O que há de novo no DALL-E 3
Nas versões anteriores do DALL-E, os usuários precisavam fazer ajustes em seus pedidos usando um processo chamado de “engenharia de prompts”, o que poderia ser um pouco complicado. Assim, o DALL-E 3 veio para facilitar isso, criando imagens que correspondem melhor às instruções iniciais do usuário, sem a necessidade de ajustes complexos.
Por exemplo, enquanto o DALL-E 2 poderia gerar uma imagem um tanto vaga de um jogador de basquete, o DALL-E 3 produzirá uma representação mais precisa e expressiva com base no texto fornecido.
Este novo sistema é construído com base no ChatGPT, o que possibilita uma interação perfeita entre texto e imagens.
Agora, os usuários podem contar com o ChatGPT como um “parceiro de brainstorming” para aprimorar suas ideias de imagem. Se você gostar de uma imagem gerada, mas quiser fazer pequenas alterações, basta uma ou duas frases em uma conversa com o ChatGPT para obter as mudanças desejadas.
Mais regras contra acusações de plágio
Logo quando foram lançados esses geradores de imagem com IA, houve muitas reclamações, preocupações e até mesmo processos por plágio — uma vez que utilizavam imagens já criadas para criar novas.
Pensando nisso, a OpenAI criou novas regras que fará o DALL-E 3 rejeitar os pedidos para criar imagens ao estilo de artistas vivos. Você pode conseguir criar um quadro no estilo Van Gogh, mas não Romero Britto, por exemplo.
Além disso, os próprios artistas poderão impedir que todas as suas obras ou algumas delas não sejam usadas para treinar modelos de IA da OpenAI.
Ademais, os desenvolvedores também estão explorando maneiras de ajudar os usuários a identificar imagens geradas por IA. Eles estão pesquisando um “classificador de proveniência”, uma ferramenta interna que pode reconhecer se uma ideia se originou do DALL-E 3.
Esta ferramenta está em fase experimental, mas o seu desenvolvimento indica uma abordagem proativa para resolver problemas de desinformação e manipulação de imagens.
Quando o DALL-E 3 estará disponível?
O DALL·E 3 está programado para estar disponível para clientes ChatGPT Plus e Enterprise em outubro.
A OpenAI planeja oferecer licenciamento liberal, permitindo que os usuários do ChatGPT usem, vendam ou comercializem livremente as imagens que criam sem exigir permissão da plataforma.
A Microsoft também planeja adicionar suporte DALL-E 3 ao criador de imagem do Bing nas próximas semanas.
Adding enhanced image quality with the support for the latest DALL.E 3 model ✅ #MicrosoftEvent pic.twitter.com/hLtVQS1VJO
— Bing (@bing) September 21, 2023
Fonte: Search Engine Journal