BitcoinWorld El trabajo sucio de entrenar robots: XDOF recauda $70M para construir los canales de datos que los laboratorios de IA necesitan desesperadamente Hace dos semanas, OpenAI anunció queBitcoinWorld El trabajo sucio de entrenar robots: XDOF recauda $70M para construir los canales de datos que los laboratorios de IA necesitan desesperadamente Hace dos semanas, OpenAI anunció que

El trabajo sucio de entrenar robots: XDOF recauda 70 millones de dólares para construir los pipelines de datos que los laboratorios de IA necesitan desesperadamente

2026/06/18 00:05
Lectura de 8 min
Si tienes comentarios o inquietudes sobre este contenido, comunícate con nosotros mediante crypto.news@mexc.com

BitcoinWorld

El trabajo sucio de entrenar robots: XDOF recauda 70 millones de dólares para construir los pipelines de datos que los laboratorios de IA necesitan urgentemente

Hace dos semanas, OpenAI anunció que relanzaría su programa de robótica, cerrado en 2021 — la última señal de que los grandes laboratorios de IA están compitiendo por enseñar a las máquinas a operar en el mundo físico. Pero construir robots capaces requiere algo que la industria de la IA aún no tiene a escala: los datos de entrenamiento equivalentes a los que impulsan los modelos de lenguaje. Esa brecha está creando un nuevo tipo de negocio de infraestructura.

A diferencia de los grandes modelos de lenguaje entrenados con un vasto océano de texto disponible públicamente, los robots necesitan datos que capturen la interacción física — y ese tipo de datos apenas existe. Los videos de YouTube y el material grabado por trabajadores independientes son de baja fidelidad y difíciles de reconciliar con el mundo físico. Aquí entra XDOF (pronunciado "ecks-doff"), una startup que emerge hoy del modo sigiloso y que apuesta a que el próximo gran cuello de botella en la IA no son los modelos ni los chips, sino el ciclo de retroalimentación de datos necesario para enseñar a los robots a interactuar con el mundo físico.

Construyendo el ecosistema de datos para la IA física

XDOF tiene como objetivo construir los pipelines de datos, las herramientas de recopilación y los sistemas de anotación que los laboratorios de frontera y las empresas de robótica no pueden construir fácilmente por sí mismos. La empresa ha recaudado 70 millones de dólares de Thrive Capital, Spark Capital, a16z, Lux y WndrCo para lograrlo. El cofundador y CEO Philippe Wu dice que XDOF, que cuenta con unos 60 empleados, ya trabaja con 20 clientes, incluidos varios laboratorios de IA de frontera, aunque no puede nombrarlos.

"Todos los laboratorios más importantes están intentando incursionar en la robótica", dijo Wu en una entrevista. "Ya hemos visto algunas de las consecuencias de quedarse un poco atrás en la carrera de los modelos de lenguaje… no quieres estar en este tipo de situación donde persigues esta tecnología demasiado tarde, y todos estamos en el mismo barco donde la IA física es la próxima frontera."

Wu se encontró con este problema él mismo como estudiante de doctorado en UC Berkeley, donde su enfoque era permitir que los robots aprendieran habilidades a partir de conjuntos de datos a gran escala. Solo había un problema. "No teníamos datos a gran escala con los que trabajar", dijo. "Existía este problema del huevo y la gallina — primero necesitábamos recopilar datos antes de poder siquiera preguntarnos cómo entrenar un modelo fundacional para la robótica."

Wu y su futuro cofundador de XDOF y Director de Tecnología (CTO), Fred Shentu, trabajaron en un proyecto llamado GELLO, un sistema de teleoperación de bajo costo que permite a un operador humano controlar un brazo robótico para generar datos de entrenamiento. "Terminó convirtiéndose en un artículo muy influyente en robótica, porque mucha gente tenía necesidades y cuellos de botella similares, y muchos comenzaron a aprovechar este tipo de dispositivo para la recopilación de datos", dijo Wu.

Viendo la oportunidad, Wu, Shentu y el tercer cofundador y Director de Operaciones Nemo Jin lanzaron XDOF en octubre de 2024 para proporcionar un ecosistema de datos a las empresas que buscan modelos de robótica. Conscientes de que la provisión de datos por sí sola puede ser un negocio sin salida, la empresa también se centra en la limpieza de datos, las herramientas y la anotación — creando un ciclo de retroalimentación que se refuerza a sí mismo para los entrenadores de robots.

El conjunto de datos ABC: un nuevo punto de referencia para la investigación en robótica

Como punto de partida, la empresa se está asociando con el laboratorio de Investigación de IA de UC Berkeley para lanzar lo que cree que es la mayor colección de datos de entrenamiento de robots de alta calidad jamás reunida, denominada ABC. Incluye 130.000 trayectorias de datos de manipulación de robots, 300 horas de simulación y 100 horas de evaluaciones. Este tipo de datos de preentrenamiento a escala nunca había estado disponible para el mundo académico antes.

"Hemos visto en el lenguaje, la generación de imágenes y otros campos, que cuando se publican modelos y datos, la comunidad logra cosas que no necesariamente habrías esperado", dijo David McAllister, un estudiante de doctorado de Berkeley que ayudó a organizar el lanzamiento, a Bitcoin World. El equipo ya ha utilizado los datos para entrenar robots en tareas de referencia como doblar camisetas, aplanar cajas y cargar AirPods en sus estuches.

Tres niveles de recopilación de datos

La empresa planea trabajar en tres niveles de una pirámide de datos. El nivel más valioso son los datos de teleoperación recopilados en el robot real que se está desplegando; luego vienen los robots teleoperados que recopilan datos más generales, como con GELLO; y finalmente los datos "egocéntricos" recopilados por humanos realizando tareas cotidianas, para los cuales XDOF planea construir sus propios sensores portátiles.

"La elección de tu cámara va a afectar la calidad de tus datos — lo que va a afectar el rendimiento de tu algoritmo de seguimiento de manos", dijo Wu. "Si no diseñas bien el hardware desde el principio, los datos que recopiles pueden tener problemas muy específicos que no anticipaste."

La empresa planea contratar y entrenar ejércitos de teleoperadores y operadores de datos egocéntricos en todo el mundo — un modelo intensivo en mano de obra que plantea una pregunta obvia: ¿Por qué los grandes laboratorios no están haciendo este trabajo de producción de datos ellos mismos?

"Necesitas un almacén de cientos de miles de metros cuadrados con cientos de robots", dijo Wu. "Necesitas mantener estos robots, calibrar sus parámetros físicos y entrenar correctamente a los operadores." Es una expansión que requiere enfoque, capital y escala operativa que la mayoría de los laboratorios de IA prefieren externalizar — que es precisamente el mercado en el que XDOF está apostando.

Por qué esto importa para la industria de la IA

La aparición de XDOF señala un cambio más amplio en el panorama de la IA. A medida que los laboratorios de frontera corren hacia la IA física — robots que pueden operar en entornos humanos no estructurados — el cuello de botella de datos se está volviendo tan crítico como la potencia de cómputo o la arquitectura del modelo. Las empresas que pueden proporcionar datos de entrenamiento confiables y de alta calidad para la interacción física se están posicionando como proveedores de infraestructura esencial.

El nombre XDOF es un juego con el término de robótica "grados de libertad", que describe el número de movimientos independientes que puede realizar un robot. Tu brazo, desde el hombro hasta la muñeca, tiene siete grados de libertad. El último robot de la empresa de robótica humanoide Figure.AI tiene 30. La X en el nombre de la empresa captura su ambición: "Grados de libertad arbitrarios, grados de libertad ilimitados", dice Wu.

Conclusión

La recaudación de 70 millones de dólares de XDOF y el anuncio de su salida del modo sigiloso subrayan un reconocimiento creciente en la industria de la IA: el camino hacia una IA física capaz pasa por la infraestructura de datos, no solo por mejores modelos. A medida que más laboratorios sigan el ejemplo de OpenAI al reiniciar programas de robótica, la demanda de datos de entrenamiento de alta calidad y con base física solo se intensificará. XDOF se está posicionando en el centro de esa demanda, construyendo los pipelines que podrían determinar qué empresas tienen éxito en la carrera por construir robots que puedan trabajar realmente en el mundo real.

FAQs

P1: ¿Qué es XDOF y qué hace?
XDOF es una startup que construye pipelines de datos, herramientas de recopilación y sistemas de anotación para entrenar robots. Proporciona los datos de entrenamiento del mundo físico que los laboratorios de IA necesitan para enseñar a los robots a interactuar con sus entornos.

P2: ¿Por qué los datos de entrenamiento de robots son diferentes de los datos de entrenamiento de modelos de lenguaje?
Los modelos de lenguaje pueden entrenarse con vastas cantidades de texto disponibles en internet. Los datos de entrenamiento de robots deben capturar interacciones físicas — como agarrar objetos o doblar ropa — lo que requiere métodos de recopilación especializados como la teleoperación o los sensores portátiles.

P3: ¿Cuánto Financiamiento ha recaudado XDOF y quiénes son los inversores?
XDOF ha recaudado 70 millones de dólares de Thrive Capital, Spark Capital, a16z, Lux y WndrCo. La empresa cuenta con unos 60 empleados y ya trabaja con 20 clientes, incluidos varios laboratorios de IA de frontera.

Esta publicación El trabajo sucio de entrenar robots: XDOF recauda 70 millones de dólares para construir los pipelines de datos que los laboratorios de IA necesitan urgentemente apareció primero en BitcoinWorld.

Oportunidad de mercado
Logo de Gensyn
Precio de Gensyn(AI)
$0.0241
$0.0241$0.0241
-2.27%
USD
Gráfico de precios en vivo de Gensyn (AI)

Combo del Mundial: apunta a 200x

Combo del Mundial: apunta a 200xCombo del Mundial: apunta a 200x

Combina hasta 20 partidos del Mundial en una orden

Aviso legal: Los artículos republicados en este sitio provienen de plataformas públicas y se ofrecen únicamente con fines informativos. No reflejan necesariamente la opinión de MEXC. Todos los derechos pertenecen a los autores originales. Si consideras que algún contenido infringe derechos de terceros, comunícate a la dirección crypto.news@mexc.com para solicitar su eliminación. MEXC no garantiza la exactitud, la integridad ni la actualidad del contenido y no se responsabiliza por acciones tomadas en función de la información proporcionada. El contenido no constituye asesoría financiera, legal ni profesional, ni debe interpretarse como recomendación o respaldo por parte de MEXC.

Consigue tu parte de 50K USDT

Consigue tu parte de 50K USDTConsigue tu parte de 50K USDT

Completa tareas DEX+ y desbloquea la Ruleta Campeón