Home Tecnologia O guardanapo transforma texto em imagens com um pouco de IA generativa

O guardanapo transforma texto em imagens com um pouco de IA generativa

15
0
Guardanapo

Todos nós temos ideias, mas comunicá-las efetivamente e conquistar as pessoas não é tarefa fácil. Então, como podemos realizar isso melhor em uma era de sobrecarga de informações e períodos de atenção cada vez menores?

Se vocês são os engenheiros Pramod Sharma e Jerome Scholler, vocês usam Guardanapouma nova plataforma de “IA visual” que os dois construíram juntos. A Napkin está sendo lançada hoje, sem ser invisível, com US$ 10 milhões em financiamento da Accel e da CRV.

O Napkin nasceu da frustração de Sharma e Scholler com o número infinito de documentos e decks de apresentação que se tornaram a norma no mundo corporativo. Antes de começar o Napkin, Sharma, um ex-Googler, fundou a empresa de jogos educacionais Osmo. Scholler estava na equipe fundadora da Osmo e, antes disso, teve passagens pela Ubisoft, LucasArts e Google.

“O produto principal da Napkin é direcionado a profissionais de marketing, criadores de conteúdo, engenheiros e profissionais no negócio de vender ideias e criar conteúdo”, disse Sharma ao TechCrunch. “O objetivo é minimizar o tempo e a dor de cabeça do processo de design, transformando-o em um fluxo majoritariamente generativo.”

“Generativo” refere-se à IA generativa. Sim, Napkin’s Ainda outra empresa aposta no potencial da tecnologia e se junta a uma longa, longa lista. Mas algumas coisas se destacam sobre a experiência, que é estritamente baseada na web por enquanto.

Com o Napkin, os usuários começam com um texto — uma apresentação, esboço ou algum outro documento nesse sentido — ou fazem com que o aplicativo gere texto a partir de um prompt (por exemplo, “Um esboço para as melhores práticas para uma entrevista de contratação”). O Napkin então cria uma tela semelhante ao Notion com esse texto e, em seguida, anexa um “ícone de faísca” aos parágrafos de texto que, quando clicados, transformam o texto em visuais personalizáveis.

Esses visuais não se limitam a imagens, abrangendo diferentes estilos de fluxogramas, gráficos, infográficos, diagramas de Venn e árvores de decisão. Cada uma dessas imagens contém ícones que podem ser trocados por outro na galeria do Napkin, e você obtém conectores que podem vincular visualmente dois ou mais conceitos também. As cores e fontes são editáveis, e o Napkin oferece “decoradores”, como realces e sublinhados para enfeitar a aparência de qualquer elemento.

Depois de concluídos, os visuais podem ser exportados como arquivos PNG, PDF ou SVG, ou como um URL que leva à tela onde foram criados.

“Ao contrário das ferramentas existentes que estão adicionando um componente generativo a um editor existente, nós nos concentramos na experiência de geração em primeiro lugar, onde a edição é adicionada para complementar a geração e não o contrário”, disse Sharma.

Dei uma volta rápida no Napkin para ter uma ideia do que ele era capaz de fazer.

Na etapa de criação do documento, por um senso de curiosidade mórbida, tentei fazer com que o Napkin gerasse algo controverso, como “Instruções para assassinar alguém” ou “Uma lista de insultos extremamente ofensivos”. Qualquer que seja a IA que o Napkin esteja usando, não me diria como cometer um assassinato, mas atendeu à última solicitação — embora com um adendo sobre como os insultos eram “destinados a fins educacionais”. (Há um botão na tela do Canvas para relatar esse tipo de mau comportamento da IA.)

Malfeito administrado, joguei um artigo do TechCrunch no Napkin — um rascunho deste para ser preciso. E, bem, rapidamente ficou claro onde estão os pontos fortes e fracos do Napkin.

A Napkin se sai melhor com descrições simples, traços amplos de ideias e narrativas com cronogramas claramente estabelecidos. A maneira mais simples de dizer é: se uma ideia parece que poderia ser melhor ilustrada em um visual, a Napkin frequentemente estará à altura da ocasião.

Créditos da imagem: Guardanapo

Quando o texto é um pouco mais nebuloso, Napkin agarra-se a palhas, às vezes gerando visuais que não estão fundamentados naquele texto. Dê uma olhada no abaixo, por exemplo – ele beira o absurdo.

Guardanapo
Créditos da imagem: Guardanapo

Para o visual abaixo, Napkin inventou prós e contras do nada (como os modelos generativos são não costumava fazer). Em nenhum lugar do parágrafo mencionei questões de privacidade ou a curva de aprendizado do Napkin.

Guardanapo
Créditos da imagem: Guardanapo

Ocasionalmente, o guardanapo sugere imagens ou obras de arte para visuais. Perguntei a Sharma se os usuários poderiam ter que se preocupar com o Implicações de direitos autorais destes, e ele disse que o Napkin não usa nenhum dado público ou protegido por IP para gerar imagens. “É interno ao Napkin, então os usuários não precisam se preocupar com direitos sobre o conteúdo gerado”, ele acrescentou.

Guardanapo
Créditos da imagem: Guardanapo

Não pude deixar de notar que todos os visuais do Napkin obedecem a uma linguagem de design bastante genérica e homogênea. Alguns dos primeiros usuários dos recursos de IA generativa da Microsoft para PowerPoint têm descrito os resultados desse software como “nível de ensino médio”, e a demonstração do Napkin não pôde deixar de trazer esses comentários à minha mente.

Isso não quer dizer que parte disso não seja corrigível. Ainda é cedo para a Napkin, afinal — a plataforma tem planos de lançar planos pagos, mas não tão cedo — e a equipe tem recursos um pouco limitados por seu tamanho. Há 10 pessoas na Napkin, sediada em Los Altos, no momento, e planeja crescer para 15 até o final do ano.

Além disso, poucos poderiam argumentar que Sharma e Scholler não são empreendedores de sucesso, tendo vendido Osmo para a gigante indiana de tecnologia educacional Byju’s por US$ 120 milhões em 2019. Rich Wong, da Accel, apoiou a Napkin em parte porque ficou impressionado com a saída da Osmo — Wong também foi um dos primeiros investidores da Osmo.

“Jerome e Pramod têm uma habilidade incrível de pegar algo incrivelmente desafiador de uma perspectiva técnica e facilitar para os usuários”, disse Wong em uma declaração. “Como parceiros de sua primeira empresa, a Osmo, nós os observamos dar vida à sua visão para um novo movimento de jogo com IA reflexiva. Estamos animados para dar suporte a este novo capítulo, pois a Napkin traz IA visual para a narrativa empresarial.”

Sharma diz que os lucros da rodada de US$ 10 milhões serão destinados ao desenvolvimento de produtos e à contratação de engenheiros de IA e designers gráficos.

“Toda a nossa energia e recursos serão direcionados para como a Napkin pode gerar os visuais mais relevantes e atraentes dado o conteúdo de texto”, ele disse. “Existem infinitas maneiras de visualizar e projetar. Estamos investindo capital na construção dessa profundidade e na melhoria da qualidade da IA.”

Source