Aposta de US$ 2,3 bilhões da General Intuition de que os videogames podem treinar agentes de IA para o mundo real


Assim que entrei no andar de P&D da General Intuition em seu escritório de Nova York, o cofundador e CEO da empresa, Pim de Witte, de 31 anos, dirigiu minha atenção para um monitor colocado sobre uma mesa vertical. Alguém parecia estar jogando algo parecido com Fortnite. Não foi uma pessoa.

“Nosso agente jogou 100 horas seguidas”, disse Kent Rollins, gerente de produto da empresa, radiante.

Antes que eu pudesse me absorver no espetáculo de uma IA navegando no ambiente virtual do jogo, ouvi os passos eletrônicos de um grande robô de quatro patas se aproximando.

“O mesmo cérebro que dirige o agente que joga o jogo dirige o robô”, disse-me de Witte. Josh Duplantis, um analista de dados que carregava um laptop transmitindo uma transmissão ao vivo da única câmera do robô, veio explicar que o modo padrão do bot era “exploração”.

O bot gigante parecido com um inseto caminhou até mim, me circulou e continuou no escritório, dependendo daquela câmera, seu olho singular. Ocasionalmente, ele cortava as pernas de uma cadeira ou esbarrava em uma lata de lixo errante, como uma criança que ainda não aprendeu como seu corpo se relaciona com o mundo ao seu redor. Duplantis disse que foram necessários apenas oito minutos de dados de robôs do mundo real para ajustar um modelo de IA para os quadrúpedes. Além do mais, esses dados foram coletados na rua, e não dentro do escritório onde o bot estava navegando.

Um modelo de agente que pode generalizar da jogabilidade à simulação e à incorporação é a razão de ser da General Intuition. E a capacidade desse modelo de descobrir o seu lugar no mundo garantiu o apoio de alguns pesos pesados.

Na quinta-feira, a General Intuition disse que arrecadou US$ 320 milhões em uma avaliação de US$ 2,3 bilhões, confirmando relatórios anteriores do TechCrunch. A rodada eleva o financiamento total divulgado da General Intuition para US$ 454 milhões, após a rodada de US$ 134 milhões que arrecadou no lançamento em outubro passado.

A startup surgiu de outra empresa de De Witte, a Medal, que permite aos jogadores fazer upload e compartilhar clipes de videogame. As centenas de milhões de horas de jogo carregadas forneceram o conjunto de dados inicial para treinar o modelo da General Intuition no raciocínio espaço-temporal – ou na compreensão de como se mover no espaço e no tempo.

Mas o ingrediente principal não foram as imagens do jogo; foram os rótulos de ação incorporados nesses clipes: registros de exatamente quais botões um jogador pressionou e quando. A maioria dos concorrentes, diz de Witte, tenta derivar ações apenas do vídeo, o que ele afirma ser insuficiente.

“Vemos isto apenas como a próxima fase do futuro pré-treinamento”, disse de Witte. “Temos um modelo único que pode responder às informações do Fortnite na tela e agir, mas também à dinâmica do mundo real de uma forma que um LLM nunca conseguiria.”

A certa altura, de Witte me configurou um laptop rodando o modelo de mundo da General Intuition, um ambiente simulado gerado quadro a quadro em vez de renderizado por um mecanismo de jogo tradicional. Como costumo fazer ao testar modelos mundiais, bati direto em uma série de paredes. Em outras demonstrações que experimentei, os agentes que você controla às vezes passam direto, mas esta não. Com os milhões de horas de jogo, ele aprendeu de alguma forma que paredes são paredes, escadas são para escalar e que as sombras ficam mais longas à medida que o sol se move.

Para a intuição geral, este modelo do mundo não é o produto; é o ambiente de treinamento (internamente denominado “ginásio”). Em última análise, a empresa quer vender o próprio modelo do agente, e de Witte afirma que os dados de ação incorporados na jogabilidade ajudam o modelo a distinguir o “eu” do “ambiente” de uma forma que lhe dá uma compreensão mais rica da causalidade.

Por mais impressionante que a tecnologia da General Intuition seja mostrada em demonstrações, a empresa não é a única tentando resolver esse problema. Além disso, ainda não foi possível fazer com que tal modelo se aplicasse ao mundo físico em grande escala. A maioria das abordagens desta natureza requer grandes quantidades de dados do mundo real que são recolhidos de forma lenta e dispendiosa. A aposta da General Intuition é que a jogabilidade seja um atalho escalável.

Seus investidores também concordam com esse esforço. A última rodada da General Intuition foi liderada pela Khosla Ventures com a participação da General Catalyst, Jeff Bezos, Eric Schmidt, Nico Rosberg e pesquisadores do Google DeepMind e do MIT.

A grande maioria da rodada será destinada ao dimensionamento da capacidade computacional. A General Intuition tem acordo com a CoreWeave e planeja focar no pré-treinamento da próxima versão do modelo. Uma fatia foi reservada para tornar sua API mais amplamente disponível até o final do verão.

Vinod Khosla, cuja empresa liderou a rodada, diz que ficou atraído pela visão de De Witte e pela posição de dados proprietários da empresa.

“Se você olhar para os LLMs, quando o raciocínio surgiu, foi um salto quântico”, disse-me Khosla em entrevista por telefone. “Nos modelos mundiais, acho que o salto quântico é o surgimento da intuição na IA, uma habilidade semelhante à intuição humana. Os dados de ação humana e de reação que você tem em jogo são a parte chave para o surgimento da intuição.”

A visão é uma empresa geracional

A intuição geral se baseia em dados dos clipes de videogame da Medal. Crédito da imagem:Medalha.TV

A General Intuition não é a única empresa a observar que os dados de ação humana da Medal são uma peça-chave no quebra-cabeça da construção de modelos mundiais dinâmicos e agentes gerais. Brianna Martin, chefe de gabinete da startup, disse que a empresa nasceu em parte depois que a Medal recusou uma oferta de aquisição de um laboratório maior. Também houve outras ofertas desde então.

De Witte e seus cofundadores, Eloi Alonso, Adam Jelley e Vincent Micheli, não estão interessados ​​em serem adquiridos, nem os investidores da startup estão procurando uma saída ainda. A quantidade e a qualidade dos dados proprietários que a General Intuition possui via Medal é uma das razões pelas quais Khosla está convencido de que a startup é uma aposta geracional, não um alvo de fusões e aquisições; que poderia se tornar a espinha dorsal de agentes generalizados e modelos mundiais na simulação e no mundo real.

“Neste ponto seria uma coleta de dados, o que é um tanto desinteressante”, disse Khosla.

Parte dessa aposta também envolve confiança nos valores de De Witte.

O empresário passou três anos trabalhando na área humanitária, inclusive com Médicos Sem Fronteiras. Como tal, ele traçou uma linha clara sobre como a tecnologia da General Intuition será usada: nenhum agente será usado para prejudicar as pessoas.

“Não queremos ser uma parte crescente do sistema”, disse de Witte. “Digamos que eu dissesse: ‘Estamos fazendo uma autonomia letal’. O que você acha que aconteceria em outros países?”

Esta fronteira de casos de uso militar surge à medida que o Vale do Silício se torna cada vez mais otimista em relação à guerra, embora De Witte diga que está feliz em ver seus modelos sendo usados ​​para missões de busca e resgate.

De Witte é holandês e grande parte da sua equipa é europeia, o que molda a identidade da empresa. Ele diz que desafiou Martin em parte por causa de sua decisão de deixar publicamente a Palantir por causa de seu trabalho com a Imigração e Alfândega dos EUA.

“Não sei por que o Vale do Silício faz o que faz”, disse ele. “Há uma razão pela qual eu não estou lá.”

A ética de De Witte não limita simplesmente o que os modelos não querem. Como um jogador que ganhou US$ 1,5 milhão construindo e hospedando um servidor RuneScape privado na adolescência, de Witte também pensa no que acontece com as pessoas deixadas para trás pelo que os modelos de IA podem fazer.

A General Intuition lançou recentemente uma plataforma chamada Nerve, um mercado de trabalho que permite aos jogadores ganhar dinheiro usando suas configurações existentes. Aqueles que se inscrevem começam com a marcação de dados e podem eventualmente passar para a telecirurgia robótica e outras tarefas. A base de utilizadores da Medal, observou de Witte, é precisamente a geração mais exposta ao deslocamento impulsionado pela IA, e ele quer que eles tenham uma participação no que vem a seguir.

Um volante de dados

De Witte deseja que a General Intuition seja um facilitador de ecossistema, como Anthropic ou OpenAI – um fornecedor modelo que permite que outros desenvolvam com base em sua tecnologia. Hoje, a startup tem um punhado de clientes em jogos, simulação e robótica.

“Não queremos construir uma empresa de automóveis autônomos”, disse de Witte. “Queremos tornar 10 vezes mais fácil para qualquer pessoa construir uma empresa de automóveis autônomos.”

A empresa diz que assim que colocar sua API nas mãos de mais clientes, ela poderá testar suas proezas com uma variedade de casos de uso – como testar um robô em um gêmeo digital de um chão de fábrica, operar um bot humanóide dentro de um estúdio de jogos ou enviar um veículo de quatro rodas para navegar em ambientes perigosos.

Embora um quadrúpede seja a primeira personificação física que a General Intuition experimentou no mundo real, ela também experimentou drones e outros dispositivos, incluindo testes do modelo em jogos de direção.

“Funciona em qualquer coisa que você possa controlar usando um controlador de jogo ou um teclado e mouse”, disse de Witte.

A possibilidade de construir um volante de dados é um dos objetivos.

“Escolheremos clientes onde possamos diversificar as implementações para as quais este modelo básico generalizado serve como espinha dorsal”, disse de Witte. “Portanto, priorizaremos a escolha dos clientes com base na possibilidade de eles oferecerem dados do mundo real que sejam interessantes e úteis para impulsionar a pesquisa. E se eles tiverem uma equipe interna ágil onde possamos ser verdadeiros parceiros integrados e aprender uns com os outros.”

Khosla disse que os dados proprietários da General Intuition foram o que o trouxe até aqui, e sua capacidade de continuar a coletar dados que ninguém mais possui será crítica. Especialmente porque, apesar das demonstrações impressionantes, é uma questão em aberto que ninguém respondeu totalmente ainda.

Correção: a manchete anteriormente distorcia quanto a Intuição Geral arrecadou nesta rodada. O erro foi corrigido.

Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isto não afeta a nossa independência editorial.



Link da fonte

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Releated