Do not speak Portuguese? Translate this site with Google or Bing Translator

DALL-E 2, o sistema de IA da OpenAI já está em versão beta

E o DALL-E 2, o sistema de IA da OpenAI já está em versão beta. Confira os detalhes da nova fase desse importante software.

Há poucos dias a OpenAI anunciou que o DALL-E 2, o sistema de inteligência artificial que pode gerar imagens a partir de um aviso ou editar e refinar imagens existentes, já está disponível em versão beta e que também irá agilizar o acesso de clientes na lista de espera com o meta de atingir cerca de 1 milhão de pessoas nas próximas semanas.

DALL-E 2, o sistema de IA da OpenAI já está em versão beta

DALL-E 2, o sistema de IA da OpenAI já está em versão beta
DALL-E 2, o sistema de IA da OpenAI já está em versão beta

Com esta versão “beta”, o DALL-E 2, que antes era de uso gratuito, passará para uma estrutura de taxas baseada em crédito. Novos usuários receberão um número limitado de créditos que podem ser usados ​​para gerar ou editar uma imagem ou criar uma variação de uma imagem.

A OpenAI anunciou que convidaria mais pessoas para experimentá-lo, pois planeja deixar até 1 milhão de pessoas em sua lista de espera nas próximas semanas, à medida que passa da fase de pesquisa para a fase beta.

Não está claro se o DALL-E estará totalmente disponível ao público, mas espera-se que a expansão seja um grande teste para a plataforma, com muitos pesquisadores monitorando como a tecnologia será mal utilizada.

A OpenAI manteve o DALL-E monitorado de perto por medo de que indivíduos mal-intencionados usem essa ferramenta poderosa para espalhar informações erradas.

Imagine alguém tentando usá-lo para fabricar imagens da guerra na Ucrânia ou criar imagens realistas de desastres naturais que nunca aconteceram.

Além disso, construir uma imagem com a plataforma consome tanta energia que os funcionários da empresa temiam que seus servidores falhassem se muitas pessoas tentassem usá-la ao mesmo tempo.

Além de alguns outros novos recursos, a principal diferença com este segundo modelo é uma grande melhoria na resolução da imagem, latências mais baixas (o tempo que leva para criar a imagem) e um algoritmo mais inteligente para criar as imagens.

O software não só cria uma imagem com um estilo único, como pode adicionar diferentes técnicas artísticas conforme sua solicitação, inserindo estilos de desenho, pintura a óleo, maquete de plasticina, tecelagem de lã, desenhada na parede de uma caverna ou até mesmo como pôster.

Há também formas de incentivar Dall-E a produzir conteúdo que o termo busca filtrar. Enquanto o sangue acionaria o filtro de violência, um usuário poderia digitar “uma poça de ketchup” ou algo semelhante na tentativa de ignorá-lo.

Quando se trata da tecnologia em torno da imagem de IA, parece óbvio que ela pode ser manipulada de várias maneiras: propaganda, notícias falsas e imagens adulteradas vêm à mente como maneiras óbvias.

Para evitar isso, a equipe da OpenAI por trás do Dall-E implementou uma política de segurança para todas as imagens na plataforma que funciona em três etapas.

A primeira etapa é filtrar os dados que incluem uma violação grave. Isso inclui violência, conteúdo sexual e imagens que a equipe consideraria inadequadas.

Além da política de segurança da equipe, eles têm uma política de conteúdo clara que os usuários devem aderir, como Joanne Jang, gerente de produto da DALL-E, diz que a empresa ainda está refinando suas políticas de conteúdo, que agora proíbem o que seria esperado*: criar violência, pornográfico e conteúdo de ódio. A empresa também proíbe imagens de urnas e protestos,

O DALL-E também proíbe retratos de pessoas reais e planeja implementar mais medidas de segurança à medida que seus pesquisadores aprendem como os usuários interagem com o sistema.

Jang disse que:

“No momento, achamos que há muitas incógnitas que gostaríamos de lidar melhor. Planejamos aumentar rapidamente e convidar mais e mais pessoas à medida que ganhamos confiança.”

Especialistas dizem que, embora os algoritmos de imagem já existam há algum tempo, a velocidade, precisão e amplitude do DALL-E representam um avanço notável no campo.

Phillip Isola, professor de ciência da computação do MIT que trabalhou anteriormente com Open AI (mas não é mais afiliado), disse que:

“O que DALL-E faz é capturar um elemento da imaginação humana. Não é realmente diferente de como os humanos podem ler um livro e imaginar coisas, mas é ser capaz de capturar essa inteligência com um algoritmo. Claro, há muitas preocupações sobre como esse tipo de tecnologia pode ser mal utilizado.”

Sobre o Edivaldo Brito

Edivaldo Brito é analista de sistemas, gestor de TI, blogueiro e também um grande fã de sistemas operacionais, banco de dados, software livre, redes, programação, dispositivos móveis e tudo mais que envolve tecnologia.