O que a arte gerada por IA realmente significa para a criatividade humana

Foto Lee Unkrich, um dos animadores mais ilustres da Pixar, como aluno da sétima série. Ele olha a imagem de uma locomotiva na tela do primeiro computador de sua escola. Uau, ele pensa. Parte da magia desaparece, no entanto, quando Lee descobre que a imagem não apareceu simplesmente pedindo “uma foto de um trem”. Em vez disso, teve que ser meticulosamente codificado e renderizado por humanos que trabalham duro.

Agora imagine Lee 43 anos depois, tropeçando no DALL-E, uma inteligência artificial que gera obras de arte originais com base em prompts fornecidos por humanos que podem ser literalmente tão simples quanto uma “imagem de um trem”. Enquanto ele digita palavras para criar imagem após imagem, o uau está de volta. Exceto que desta vez, não vai embora. “É como um milagre”, disse ele. disse. “Quando os resultados saíram, eu engasguei e as lágrimas vieram aos meus olhos. É mágico.

Nossas máquinas ultrapassaram um limite. Durante toda a nossa vida, tivemos certeza de que os computadores eram incapazes de ser verdadeiramente criativos. No entanto, de repente, milhões de pessoas estão usando uma nova geração de IA para gerar imagens impressionantes e nunca antes vistas. A maioria desses usuários não são, como Lee Unkrich, artistas profissionais, e esse é o ponto: eles não precisam ser. Nem todo mundo pode escrever, dirigir e editar um vencedor do Oscar como Toy Story 3 Onde cocomas todos caixa inicie um gerador de imagens de IA e tenha uma ideia. O que aparece na tela é incrivelmente realista e detalhado. Então a resposta universal: Uau. Em apenas quatro serviços – Midjourney, Stable Diffusion, Artbreeder e DALL-E – os humanos que trabalham com IA estão agora co-criando mais de 20 milhões de imagens todos os dias. Com um pincel na mão, inteligência artificial tornou-se um motor wow.

Como essas IAs geradoras de surpresa aprenderam seu ofício com bilhões de imagens feitas pelo homem, sua produção gira em torno do que esperamos que as imagens pareçam. Mas como é uma IA alienígena, fundamentalmente misteriosa até mesmo para seus criadores, eles estão reestruturando a nova filmagem de maneiras que nenhum ser humano provavelmente pensaria, preenchendo detalhes que a maioria de nós não teria a arte de imaginar, muito menos o habilidades de execução. Eles também podem ser encarregados de gerar mais variações de algo que gostamos, no estilo que queremos, em segundos. Essa, em última análise, é sua vantagem mais poderosa: eles podem criar coisas novas que são compreensíveis e compreensíveis, mas, ao mesmo tempo, completamente inesperadas.

Na verdade, essas novas imagens geradas por IA são tão inesperadas que, no silêncio que se segue imediatamente ao uau– outro pensamento vem à mente de quase todos que os encontraram: a arte feita pelo homem deve agora ser concluída. Quem pode igualar a velocidade, o baixo custo, a escala e, sim, a criatividade selvagem dessas máquinas? A arte é outra atividade humana que devemos ceder aos robôs? E a próxima pergunta óbvia: se os computadores podem ser criativos, o que mais eles podem fazer que nos disseram que não podem?

Passei os últimos seis meses usando IAs para criar milhares de imagens impressionantes, muitas vezes perdendo uma noite de sono na busca sem fim para encontrar apenas mais um beleza escondida no código. E depois de entrevistar criadores, usuários avançados e outros usuários iniciais desses geradores, posso fazer uma previsão muito clara: a IA generativa mudará a maneira como projetamos quase tudo. Ah, e nenhum artista humano perderá o emprego por causa dessa nova tecnologia.

não é exagero para chamar imagens geradas usando AI co-criações. O segredo desse novo poder preocupante é que suas melhores aplicações não são o resultado de digitar um único prompt, mas conversas muito longas entre humanos e máquinas. O progresso de cada quadro vem de muitas, muitas iterações, idas e vindas, desvios e horas, às vezes dias, de trabalho em equipe, tudo graças a anos de avanços no aprendizado de máquina.

Os geradores de imagens AI nasceram do casamento de duas tecnologias distintas. Um deles era uma linha histórica de redes neurais de aprendizado profundo que poderiam gerar imagens realistas consistentes, e o outro era um modelo de linguagem natural que poderia interagir com o mecanismo de imagem. Os dois foram combinados em um gerador de imagens baseado em linguagem. Os pesquisadores vasculharam todas as imagens com texto adjacente, como legendas, da Internet e usaram bilhões desses exemplos para conectar formas visuais a palavras e palavras a formas. Com essa nova combinação, os usuários humanos poderiam inserir uma sequência de palavras – o prompt – descrevendo a imagem que estavam procurando, e o prompt geraria uma imagem com base nessas palavras.