Google lanza Gemini Robotics ER 1.6: modelo SOTA para robots, experto en razonamiento visual y espacial

Google DeepMind ha presentado un nuevo modelo base para robots, Gemini Robotics ER 1.6, donde ER representa Embodied Reasoning (razonamiento encarnado). Este modelo alcanza el mejor nivel actual (SOTA) en razonamiento visual y espacial, y ya está disponible mediante la Gemini API. Logan Kilpatrick, responsable de relaciones con desarrolladores de Google AI, publicó esta noticia en redes sociales. (Fuente)

¿Qué es el Embodied Reasoning?

Embodied Reasoning se refiere a la capacidad de los modelos de IA para comprender y razonar sobre el mundo físico. A diferencia de los modelos tradicionales de lenguaje, los modelos de razonamiento encarnado necesitan manejar objetos, posiciones en el espacio tridimensional, formas, materiales y relaciones de interacción física. Gemini Robotics ER 1.6 está optimizado específicamente para este tipo de tareas, permitiendo que los robots comprendan con mayor precisión el entorno y tomen decisiones adecuadas de acción.

Capacidades principales

Las principales ventajas de Gemini Robotics ER 1.6 se concentran en dos aspectos:

Capacidad Explicación Razonamiento visual Puede identificar objetos a partir de imágenes y videos, comprender la estructura de la escena y tomar decisiones en función de ello Razonamiento espacial Comprender la posición relativa, la distancia y la dirección de los objetos en el espacio tridimensional, con soporte para una planificación de operaciones compleja

La combinación de estas dos capacidades permite a los robots manejar tareas del mundo real más complejas. Por ejemplo, en entornos de almacén, el robot necesita identificar simultáneamente objetos de diferentes formas y calcular el mejor ángulo de agarre y la posición de colocación; este es precisamente el tipo de escenario en el que destaca Gemini Robotics ER 1.6.

Uso mediante Gemini API

A diferencia de muchos modelos de robots del pasado que solo se quedaban en la fase de artículos, Gemini Robotics ER 1.6 ya ofrece acceso a través de Gemini API. Esto significa que los desarrolladores y los fabricantes de hardware pueden integrar directamente este modelo en sus propios sistemas de robots, sin necesidad de entrenar el modelo desde cero.

La apertura de la API también reduce el umbral de desarrollo de la IA para robots. Antes, desarrollar un sistema de robots con capacidades de razonamiento visual y espacial requería una gran cantidad de recolección de datos y trabajo de entrenamiento de modelos. Ahora, los desarrolladores pueden centrarse en el desarrollo del diseño de hardware y en los escenarios de aplicación, dejando las capacidades de razonamiento subyacentes a Gemini Robotics ER 1.6.

Diseño de la IA robótica de Google

Gemini Robotics ER 1.6 es el último logro de Google DeepMind en el campo de la robótica. Desde el RT-2 de los inicios hasta la serie Gemini Robotics de hoy, Google continúa extendiendo las capacidades de los grandes modelos de lenguaje a la interacción con el mundo físico. La versión ER 1.6 mejora aún más la precisión del razonamiento sobre la base de las generaciones anteriores, mostrando un rendimiento especialmente excelente en escenarios que requieren operaciones finas.

A medida que la industria de la robótica entra en una nueva etapa de crecimiento, los modelos base con capacidades sólidas de razonamiento visual y espacial se convertirán en infraestructura clave. Para saber más sobre el desarrollo del ecosistema Gemini, puedes consultar la guía completa de Gemini.

Este artículo Google presenta Gemini Robotics ER 1.6: modelo SOTA para robots, experto en razonamiento visual y espacial apareció por primera vez en Cadena Noticias ABMedia.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

La API DeepSeek V4-Pro obtiene un 75% de descuento hasta el 5 de mayo; el precio de salida baja a $0.87 por cada millón de tokens

Mensaje de Gate News, 26 de abril — DeepSeek anunció un descuento del 75% por tiempo limitado en los precios de la API V4-Pro, válido hasta el 5 de mayo a las 15:59 UTC. Después del descuento, los precios por cada millón de tokens son: caché de entrada con aciertos $0.03625

GateNewsHace30m

Anthropic implementa salvaguardas electorales para Claude antes de las elecciones legislativas de mitad de mandato de 2026

Anthropic anunció el viernes un conjunto de medidas de integridad electoral diseñadas para evitar que su chatbot de IA Claude sea utilizado como arma para difundir desinformación o manipular a los votantes antes de las elecciones legislativas de mitad de período de EE. UU. de 2026 y otros grandes comicios en todo el mundo este año. Con sede en San Francisco,

CryptoFrontierhace5h

DeepRoute.ai sistema avanzado de asistencia a la conducción supera las 300.000 unidades desplegadas: objetivo 2026 de 1.000.000 flotas urbanas NOA

DeepRoute.ai anuncia que su avanzado sistema de asistencia para conducción ha acumulado más de 300.000 vehículos desplegados en China, y que durante el último año ha ayudado a evitar más de 180.000 incidentes potenciales. El objetivo para 2026 es alcanzar un parque de NOA para ciudades de 1 millón de vehículos, con una utilización superior al 50%, lo que se considera clave para la comercialización a gran escala de Robotaxi. Esta medida muestra que la conducción autónoma en China ya ha entrado en un uso normalizado, al tiempo que crea una división con la ruta de integración vertical que sigue Estados Unidos, lo que afecta la cronología de la cadena de suministro en Asia-Pacífico.

ChainNewsAbmediahace7h

DeepSeek lanza los modelos V4-Pro y V4-Flash con un costo un 98% menor que el GPT-5.5 Pro de OpenAI

Mensaje de Gate News, 25 de abril — DeepSeek lanzó versiones de vista previa de V4-Pro y V4-Flash el 24 de abril, ambos modelos de código abierto con ventanas de contexto de un millón de tokens. V4-Pro presenta 1,6 billones de parámetros totales, pero activa solo 49 mil millones por pasada de inferencia usando una arquitectura Mixture-of-Experts.

GateNewshace12h

El juez desestima las acusaciones de fraude en la demanda de Elon Musk contra OpenAI; el caso avanza a juicio con dos acusaciones restantes

Mensaje de Gate News, 24 de abril — Un juez federal ha desestimado las acusaciones de fraude de la demanda de Elon Musk contra OpenAI, Sam Altman, Greg Brockman y Microsoft, despejando el camino para que el caso avance a juicio con dos acusaciones restantes: incumplimiento de la confianza caritativa y enriquecimiento injusto. EE. UU.

GateNewshace15h

El CEO de OpenAI, Sam Altman, se disculpa por no reportar a la policía la cuenta prohibida del agresor de una escuela

Mensaje de Gate News, 25 de abril — El director ejecutivo de OpenAI, Sam Altman, se disculpó con la comunidad de Tamborine en Canadá por el fallo de la empresa al no notificar a la policía sobre una cuenta prohibida vinculada a Jesse Van Rootselaar, quien mató a ocho personas en una escuela en febrero antes de quitarse la vida. OpenAI

GateNewshace16h
Comentar
0/400
Sin comentarios