IA
General Intuition asegura 320 millones en financiación para desarrollar modelos de IA que aprenden en videojuegos y se aplican a robots en el mundo real.

En la sede de General Intuition en Nueva York, su cofundador y CEO, Pim de Witte, de 31 años, mostró un monitor donde un agente de inteligencia artificial jugaba Fortnite. “Nuestro agente ha estado jugando durante 100 horas seguidas”, comentó Kent Rollins, director de producto de la empresa.
Mientras observaba la IA interactuando en el entorno virtual, se escucharon pasos electrónicos de un robot cuadrúpedo que se acercaba. “El mismo cerebro que controla al agente en Fortnite impulsa al robot”, explicó de Witte. Josh Duplantis, analista de datos, indicó que el modo predeterminado del robot era la “exploración”.
Con su única cámara, el robot se desplazó alrededor del entrevistador, chocando ocasionalmente con objetos, similar a un niño pequeño que aún no domina su cuerpo en el espacio. Duplantis añadió que solo fueron necesarios ocho minutos de datos reales para ajustar el modelo de IA para el robot, y que esos datos se obtuvieron en la calle, no dentro de la oficina.
General Intuition basa su trabajo en un modelo agente capaz de generalizar desde el juego hasta la simulación y la interacción física. Este enfoque ha atraído inversiones significativas. El jueves, la compañía anunció una ronda de financiación de 320 millones de dólares, valorando la empresa en 2.300 millones, confirmando reportes previos. Con esta ronda, el total de fondos divulgados alcanza los 454 millones, sumados a los 134 millones obtenidos en octubre pasado.
La startup surgió de Medal, otra empresa de de Witte que permite a jugadores subir y compartir clips de videojuegos. Los cientos de millones de horas de juego subidas sirvieron como conjunto inicial para entrenar el modelo en razonamiento espacio-temporal, es decir, en cómo moverse en espacio y tiempo.
Sin embargo, el elemento clave no fue solo el video, sino las etiquetas de acción que indican qué botones se presionaron y cuándo. De Witte sostiene que la mayoría de competidores intentan inferir acciones solo a partir del video, lo que considera insuficiente.
“Esto es solo la siguiente etapa del preentrenamiento futuro”, afirmó de Witte. “Tenemos un modelo único que puede responder a la información de Fortnite en pantalla y actuar, pero también a dinámicas del mundo real de una forma que un modelo de lenguaje grande nunca podría”.
En una demostración, de Witte mostró un modelo de mundo simulado que genera cada cuadro en lugar de usar un motor gráfico tradicional. Al probarlo, el entrevistador chocó repetidamente contra paredes, y el modelo reconocía que las paredes son barreras, las escaleras sirven para subir y las sombras cambian según la posición del sol.
Para General Intuition, ese modelo de mundo es un entorno de entrenamiento interno llamado “el gimnasio”. El objetivo final es comercializar el modelo agente, que gracias a los datos de acción puede distinguir entre “yo” y “entorno”, otorgándole una comprensión más profunda de la causalidad.
Aunque la tecnología de General Intuition destaca en demostraciones, no es la única que busca resolver este desafío. Además, lograr que un modelo así funcione en el mundo físico a gran escala aún no se ha conseguido. Los métodos actuales requieren grandes cantidades de datos reales, obtenidos de forma lenta y costosa. La apuesta de General Intuition es que el juego es un atajo escalable.
La ronda de inversión fue liderada por Khosla Ventures, con participación de General Catalyst, Jeff Bezos, Eric Schmidt, Nico Rosberg y científicos de Google DeepMind y MIT. La mayor parte de los fondos se destinará a ampliar la capacidad de cómputo, con un acuerdo con CoreWeave, y a preentrenar la próxima versión del modelo. También se planea ampliar el acceso a la API para finales de verano.
Vinod Khosla, líder de la ronda, destacó que la visión de de Witte y la posición única de datos de la empresa fueron decisivas. “En los modelos de lenguaje, el razonamiento fue un salto cuántico. En los modelos de mundo, el salto es la emergencia de la intuición en la IA, una capacidad similar a la humana. Los datos de acción y reacción humana en juegos son la clave para esa intuición”.
General Intuition no es la única interesada en los datos de acción humana de Medal para construir modelos dinámicos y agentes generales. Brianna Martin, jefa de personal, señaló que la empresa nació tras rechazar una oferta de adquisición de un laboratorio importante, y que han recibido otras propuestas desde entonces.
De Witte y sus cofundadores Eloi Alonso, Adam Jelley y Vincent Micheli no están interesados en vender la empresa, ni sus inversores buscan una salida inmediata. La cantidad y calidad de datos propios que poseen es una de las razones por las que Khosla considera que la startup es una apuesta generacional, con potencial para ser la base de agentes generalizados y modelos de mundo tanto en simulación como en el mundo real.
“A estas alturas, sería solo una adquisición de datos, algo poco interesante”, afirmó Khosla.
Parte de la apuesta también implica confiar en los valores de de Witte. El empresario trabajó siete años en el ámbito humanitario, incluyendo con Médicos Sin Fronteras, y ha establecido límites claros sobre el uso de la tecnología: no se empleará para dañar a humanos.
“No queremos ser parte de un sistema que escale la violencia”, dijo de Witte. “Si dijera que hacemos autonomía letal, ¿qué crees que pasaría en otros países?”
Este límite en aplicaciones militares llega en un momento en que Silicon Valley se muestra cada vez más interesado en la guerra. De Witte acepta que sus modelos se usen en misiones de búsqueda y rescate, pero considera que la obsesión reciente con la defensa “contagia al ecosistema”.
De Witte es holandés y su equipo es mayoritariamente europeo, lo que influye en la identidad de la empresa. Explicó que incorporó a Martin en parte por su renuncia pública a Palantir debido a su trabajo con la agencia estadounidense de inmigración ICE.
“No entiendo por qué Silicon Valley hace lo que hace”, comentó. “Por eso no estoy allí”.
Los principios éticos de de Witte no solo limitan lo que los modelos no harán, sino que también considera el impacto en las personas desplazadas por la IA. De Witte, quien ganó 1,5 millones de dólares en su adolescencia creando y alojando un servidor privado de RuneScape, piensa en quienes podrían quedarse atrás.
Recientemente, General Intuition lanzó Nerve, un mercado laboral que permite a jugadores ganar dinero con sus equipos actuales. Los usuarios comienzan etiquetando datos y pueden avanzar hacia la teleoperación de robots y otras tareas. La base de usuarios de Medal, señaló de Witte, es precisamente la generación más expuesta al desplazamiento por IA, y quiere que participen en el futuro.
De Witte aspira a que General Intuition sea un habilitador de ecosistemas, similar a Anthropic u OpenAI, un proveedor de modelos que permita a otros construir sobre su tecnología. Actualmente, la startup cuenta con algunos clientes en gaming, simulación y robótica.
“No vamos a crear una empresa de coches autónomos”, afirmó. “Queremos facilitar diez veces más que otros puedan construir una”.
La compañía asegura que al ampliar el acceso a su API podrá probar su tecnología en diversos casos, como robots en gemelos digitales de fábricas, bots humanoides en estudios de videojuegos o cuadrúpedos en entornos peligrosos.
Aunque el cuadrúpedo es la primera encarnación física que han probado en el mundo real, también han experimentado con drones y otros dispositivos, incluyendo pruebas en juegos de conducción.
“Funciona con cualquier cosa que puedas controlar con un mando o teclado y ratón”, dijo de Witte.
Uno de los objetivos es crear un ciclo de datos continuo.
“Elegiremos clientes que diversifiquen las formas en que este modelo generalizado se aplica”, explicó de Witte. “Priorizaremos aquellos que puedan aportar datos reales que impulsen la investigación y que tengan equipos internos ágiles para colaborar y aprender mutuamente”.
Khosla destacó que los datos propios de General Intuition han sido clave para llegar hasta aquí, y que seguir recopilando datos exclusivos será fundamental. A pesar de las demostraciones, la capacidad de transferir la simulación al mundo real a gran escala sigue siendo una incógnita sin resolver.
Líbano
Tecnología y ciencia
Tecnología y ciencia
Mundo