Home Notícias Modelos de IA da Apple treinados com conteúdo do YouTube de MrBeast,...

Modelos de IA da Apple treinados com conteúdo do YouTube de MrBeast, MKBHD, PewDiePie e outros sem permissão

19
0

Apple, Nvidia, Salesforce e algumas das outras grandes empresas de tecnologia ao redor do mundo foram acusadas de treinar seus modelos de IA por meio de vídeos do YouTube de criadores famosos. De acordo com um relatório da Wired, os gigantes da tecnologia alimentaram arquivos de legenda baixados por uma empresa sem fins lucrativos de mais de 170.000 vídeos de criadores populares, incluindo MrBeast, Marques Brownlee (MKBHD), PewDiePie, John Oliver e Jimmy Kimmel e outros, sem seu consentimento. Para aqueles que não sabem, os arquivos de legenda são efetivamente transcrições do conteúdo do vídeo. Embora muitos possam pensar nisso como uma violação da privacidade e das regras do YouTube, também é uma grande preocupação de potencial violação de direitos autorais.

Leia também: IA híbrida é o caminho a seguir para tornar a inteligência artificial mais prática em smartphones: Won-Joon Choi da Samsung

Como a Apple e a Nvidia obtiveram os dados

O relatório alega que uma investigação da Proof News revelou que vários gigantes da tecnologia usaram legendas de milhares de vídeos no YouTube para treinar IA. Embora o YouTube tivesse uma política que não permite que ninguém colete materiais de sua plataforma sem permissões. No entanto, os grandes players de tecnologia supostamente obtiveram os dados da EleutherAI, uma plataforma que afirma ajudar pequenos desenvolvedores e acadêmicos a treinar modelos de IA. Parece que os dados extraídos pela EleutherAI também foram usados ​​por empresas como Apple e Nvidia.

Leia também: Apple Intelligence vs Samsung Galaxy AI: Quem está à frente na corrida da IA ​​em celulares?

O artigo de pesquisa da EleutherAI revela que seus conjuntos de dados, chamados de Pile, são abertos e acessíveis a qualquer pessoa com poder de computação e espaço suficientes para acessá-los. O artigo de pesquisa e as postagens de grandes empresas de tecnologia também refletem como essas empresas avaliadas em centenas de bilhões e trilhões de dólares usaram o Pile para treinar IA. Os documentos também esclarecem sobre a Apple usando o Pile da EleutherAI para treinar seu modelo de alto perfil chamado OpenELM, que estreou em abril.

Leia também: OpenAI desenvolve sistema para rastrear progresso em direção à IA de nível humano

A Apple é responsável pela violação?

Vale a pena notar que os termos e condições do YouTube não foram quebrados pela Apple, mas pela EleutherAI, que obteve os dados da plataforma de streaming de vídeo de propriedade do Google e os espalhou para vários desenvolvedores via Pile. Este não é o primeiro exemplo em que dados foram obtidos ilegalmente para treinar sistemas de IA. Muitas vezes, é possível identificar chatbots de IA fornecendo informações enquanto plagiam texto inteiro quando solicitados a fornecer informações sobre tópicos de nicho.

Mais uma coisa! Agora estamos nos Canais do WhatsApp! Siga-nos lá para não perder nenhuma atualização do mundo da tecnologia. ‎Para seguir o canal HT Tech no WhatsApp, clique aqui para se juntar agora!

Source link