¿Cómo funciona la infraestructura de datos on-chain? Análisis de la arquitectura del protocolo DATA y los mecanismos de flujo de datos

2 de julio de 2026 — Según los datos de mercado de Gate, DataBot (DATA) cotiza a 0,3028 $, con un aumento del 3,73 % en las últimas 24 horas, una capitalización de mercado aproximada de 107 millones de dólares y un volumen de negociación de 485 900 $ en las últimas 24 horas. En comparación con su mínimo local de 0,00359 $ registrado el 30 de enero de 2026, el precio se ha multiplicado por más de 80. Esta revalorización del token refleja, en esencia, una reevaluación generalizada del sector de la infraestructura de datos descentralizada.

Se prevé que el mercado global de big data e inteligencia artificial crezca desde 454 500 millones de dólares en 2025 hasta 536 480 millones en 2026, lo que supone una tasa de crecimiento anual compuesta (CAGR) del 18,0 %. Al mismo tiempo, el consumo diario promedio de tokens en China pasó de unos 100 000 millones a principios de 2024 a 140 billones en marzo de 2026, un aumento de más de mil veces en solo dos años. El apetito insaciable de la IA por los datos está transformando la lógica subyacente de la infraestructura de datos a un ritmo exponencial. Sin embargo, en un contexto descentralizado, ¿cómo se puede lograr la gestión completa del ciclo de vida de los datos (generación, recopilación, verificación, indexación, garantía de disponibilidad y, finalmente, consumo por modelos de IA)? Precisamente esta es la cuestión central que el protocolo DATA busca resolver.

Tomando como caso de estudio el protocolo DATA (Streamr), este artículo desglosa de manera sistemática la arquitectura y los mecanismos de flujo de datos de la infraestructura de datos on-chain en cuatro dimensiones: mecanismos de recopilación y verificación de datos, sistemas de indexación descentralizados, capas de disponibilidad de datos (DA Layer) y lógica de consumo de datos por modelos de IA.

Mecanismos de recopilación y verificación de datos: de las fuentes al activo confiable on-chain

El primer paso en la infraestructura de datos on-chain es determinar cómo los datos del mundo real o de sistemas off-chain ingresan a la red blockchain. El protocolo DATA ha construido una red de datos en tiempo real basada en una arquitectura peer-to-peer (P2P), cuyo objetivo principal es permitir que los datos fluyan libremente por todo el mundo como una "corriente de información".

En la capa de recopilación de datos, cualquier fuente de datos (ya sean dispositivos IoT, endpoints de API, feeds de redes sociales o smart contracts on-chain) puede conectarse a la red DATA para publicar datos en tiempo real, mientras que los suscriptores pueden recibir estos datos al instante. Esto permite un mecanismo de distribución de datos de baja latencia y alta eficiencia. El modelo de publicación/suscripción (pub-sub) constituye el paradigma fundamental para la transmisión de datos en el protocolo DATA.

El mecanismo de verificación de datos es un elemento diferenciador clave entre la infraestructura de datos descentralizada y la centralizada. En el protocolo DATA, la verificación de datos no la realiza una única entidad centralizada, sino que se coordina a través de una red distribuida de nodos. Streamr integra blockchain (principalmente Ethereum) y smart contracts para gestionar el comportamiento de los nodos, el control de permisos y los incentivos económicos. Concretamente:

Mecanismos de staking e incentivos para nodos: Los operadores de nodos deben depositar tokens DATA en un contrato de Sponsorship, lo que demuestra su compromiso de mantener los nodos en línea y retransmitir flujos de datos de forma continua. Este mecanismo vincula directamente los incentivos económicos a la calidad del servicio en la red: cualquier comportamiento malicioso o desconexión de los nodos conlleva penalizaciones sobre los tokens depositados.

Verificación criptográfica de identidad: La red DATA utiliza un sistema de claves públicas/privadas para proteger los flujos de datos. Las claves privadas controlan el acceso y los derechos de publicación de datos, mientras que las claves públicas verifican la identidad de las fuentes de datos y los suscriptores. Esto garantiza la integridad de los datos y la trazabilidad de las fuentes durante toda la transmisión.

Control de acceso mediante smart contracts: Los publicadores de datos pueden personalizar los permisos de suscripción y las condiciones asociadas, ejecutándose todas las comprobaciones de permisos y la distribución de ingresos mediante smart contracts on-chain. Esto permite interacciones sin necesidad de confianza.

Desde una perspectiva técnica, el mecanismo de recopilación y verificación de datos del protocolo DATA forma un circuito cerrado: las fuentes de datos se conectan a la red mediante identidades criptográficas → los nodos participan en la retransmisión de datos a través del staking → los smart contracts aplican el control de acceso y el reparto de ingresos → la red distribuida de nodos verifica la integridad de los datos. El valor central de este mecanismo es que otorga a los datos atributos de activo verificable, rastreable y valorable desde el momento de la recopilación, en lugar de relegarlos a un almacenamiento pasivo en servidores centralizados.

Sistemas de indexación descentralizados: hacer que los datos on-chain sean accesibles

Una vez recopilados y verificados los datos, surge la siguiente cuestión clave: ¿cómo hacer que estos datos sean accesibles y recuperables? Aquí entran en juego los sistemas de indexación descentralizados.

Si bien el protocolo DATA destaca en la transmisión de datos en tiempo real, un ecosistema de economía de datos completo también requiere sólidas capacidades de indexación y consulta. El ecosistema de Streamr aborda esta necesidad en dos frentes:

Marketplace de datos: Esta plataforma descentralizada funciona como una "tienda de datos", permitiendo a los usuarios valorar, negociar y suscribirse a flujos de datos. Además, incorpora un sistema de reputación que indica la calidad y fiabilidad de los datos, ayudando a los usuarios a identificar fuentes de alto valor. El marketplace transforma los flujos de datos de un caos informativo en activos negociables, indexados, categorizados y evaluables.

Herramientas de visualización y análisis en tiempo real: Streamr ofrece un conjunto de herramientas para desarrolladores que permiten crear aplicaciones de procesamiento y análisis de datos en tiempo real sin necesidad de infraestructuras complejas. Estas herramientas constituyen, en la práctica, una capa ligera de indexación y consulta, ayudando a los usuarios a extraer información valiosa de grandes volúmenes de datos en tiempo real.

Desde una perspectiva más amplia, la evolución de los sistemas de indexación descentralizados se está acelerando. Protocolos como The Graph ofrecen a las DApps capacidades de "motor de búsqueda" para datos blockchain. En 2026, The Graph publicó una hoja de ruta técnica detallada, con planes para evolucionar de una red centrada en la indexación a una columna vertebral de datos modular y multiservicio. A principios de 2026, The Graph daba soporte a más de 60 redes blockchain y procesaba más de 1,27 billones de consultas. Proyectos como SubQuery y Subsquid también están avanzando notablemente en este campo.

Existe una sinergia natural entre el protocolo DATA y estas infraestructuras de indexación descentralizada: la red DATA gestiona la transmisión y verificación de datos en tiempo real, mientras que los protocolos de indexación estructuran y hacen accesibles esos datos. Juntos, forman una cadena completa para los datos on-chain, desde el "flujo" hasta la "usabilidad".

Capa de disponibilidad de datos (DA Layer): del almacenamiento a la verificabilidad

La capa de disponibilidad de datos es una de las tendencias tecnológicas más transformadoras en la infraestructura blockchain de 2026. En la primera mitad de 2026, a medida que muchas redes de capa 2 abandonaron las soluciones nativas de disponibilidad de datos de Ethereum y adoptaron capas externas especializadas, la disponibilidad de datos pasó de ser un concepto técnico a convertirse en un sector competitivo con ingresos y valoración de tokens reales. Según estudios de mercado, se prevé que el mercado de capas de disponibilidad de datos crezca de 1 970 millones de dólares en 2025 a 2 410 millones en 2026, con una CAGR del 22,4 %.

La función principal de la capa de disponibilidad de datos es garantizar que todos los participantes de la red blockchain puedan verificar la integridad y disponibilidad de los datos almacenados off-chain sin necesidad de descargarlos por completo. Este mecanismo es fundamental para escalar el rendimiento de las blockchains.

El enfoque del protocolo DATA ante esta tendencia es especialmente relevante. La red subyacente de Streamr emplea nodos distribuidos y tecnología de sharding para mejorar la escalabilidad, permitiendo un funcionamiento estable incluso en escenarios de transmisión de datos con alta concurrencia. El sharding optimiza la disponibilidad de datos al distribuir la carga entre múltiples fragmentos de nodos, lo que permite procesar varios flujos de datos en paralelo y aumentar el rendimiento sin comprometer la seguridad.

A escala sectorial, las blockchains públicas en 2026 están pasando de arquitecturas monolíticas a diseños modulares, separando las capas de consenso, ejecución, disponibilidad de datos y liquidación. La tendencia hacia capas independientes de disponibilidad de datos es cada vez más marcada. Soluciones como Celestia, EigenLayer y Polygon CDK están madurando, reduciendo los ciclos de despliegue de nuevas cadenas de seis meses a dos semanas y abaratando los costes en un 85 %. Las capas de disponibilidad de datos ahora abarcan no solo el almacenamiento, sino también mecanismos de verificación y sistemas económicos.

El protocolo DATA demuestra que la infraestructura de datos descentralizada debe abordar no solo la transmisión de datos, sino también las garantías verificables en la capa de disponibilidad. La combinación de staking de nodos, arquitectura sharded e integración blockchain otorga a la red DATA una ventaja competitiva única en disponibilidad de datos: no es solo una capa de almacenamiento, sino una infraestructura integral que integra transmisión, verificación e incentivos.

Lógica de consumo de datos por modelos de IA: de los flujos de datos a las entradas inteligentes

La demanda de datos por parte de la IA se está convirtiendo rápidamente en el principal motor del desarrollo de la infraestructura de datos on-chain. El protocolo DATA es especialmente activo en este ámbito.

StreamGPT y la IA impulsada por datos en tiempo real: Streamr ha lanzado StreamGPT, un agente autónomo que genera insights a partir de flujos de datos en tiempo real, demostrando cómo los datos en vivo pueden alimentar modelos de IA y crear demanda incremental de datos. A medida que los proyectos pagan por incorporar conjuntos de datos en tiempo real en flujos de trabajo de IA, la actividad de patrocinio on-chain aumenta proporcionalmente. Este mecanismo vincula directamente la utilidad del token DATA al consumo de datos por IA.

Infraestructura verificable para datos de entrenamiento de IA: El 25 de junio de 2026, Story Protocol anunció su cambio de marca a DATA Foundation, reorientando su estrategia por completo hacia la infraestructura de datos de entrenamiento para IA. DATA Foundation presentó "Trace", un registro on-chain diseñado para infraestructura de datos de entrenamiento autorizada y verificable. Actualmente, la red cubre 1 100 millones de registros y ha establecido una colaboración con el marketplace de datos humanos de Kled AI. Este movimiento sitúa al protocolo DATA en la intersección de dos industrias intensivas en capital: la infraestructura blockchain y el desarrollo de modelos de IA.

Patrones de consumo de datos por agentes de IA: En el primer trimestre de 2026, varios de los principales protocolos DeFi anunciaron la integración de funciones de AI Agent, permitiendo a los usuarios ejecutar operaciones complejas on-chain mediante comandos en lenguaje natural. Cada ejecución requiere grandes consultas de datos on-chain: historiales de transacciones, profundidad de liquidez, curvas de precios, correlaciones de direcciones. Esta tendencia plantea nuevos requisitos para la infraestructura de datos: los datos deben ser no solo accesibles, sino también disponibles para los agentes de IA con baja latencia y alta fiabilidad.

El diseño central del protocolo DATA para el consumo de datos por IA puede resumirse así: los productores de datos publican flujos en tiempo real a través de la red DATA → los flujos se verifican e indexan para su usabilidad → los modelos o agentes de IA se suscriben y consumen los flujos pagando tokens DATA → el consumo de datos activa patrocinios on-chain e incentivos para los nodos. Este circuito cerrado convierte al token DATA en un medio de intercambio dentro de la economía de datos para IA, y no solo en un activo especulativo.

Conclusión: la evolución de la infraestructura de datos on-chain

Desde la recopilación y verificación de datos, pasando por la indexación descentralizada, la garantía de disponibilidad y, finalmente, el consumo por modelos de IA, la infraestructura de datos on-chain construida por el protocolo DATA está formando progresivamente una cadena de valor de datos completa. Las características definitorias de esta cadena son: cada etapa opera de manera descentralizada, cada etapa incorpora incentivos económicos y cada etapa otorga a los datos atributos de activo verificable, valorable y negociable.

A 2 de julio de 2026, la capitalización de mercado del token DATA ronda los 107 millones de dólares, con un volumen de negociación de 485 900 $ en 24 horas. En comparación con los más de 5 000 holders del token Streamr en enero de 2026, el ecosistema sigue expandiéndose. El suministro total de DATA asciende a 1 029 millones de tokens.

Por supuesto, esta evolución aún enfrenta numerosos retos. Si bien la arquitectura sharded y P2P de Streamr mejora el rendimiento, las implementaciones reales siguen limitadas por la calidad de los nodos, la estandarización de los datos y la complejidad de la coordinación cross-chain. Los smart contracts ofrecen mecanismos de incentivos transparentes, pero también introducen riesgos de seguridad y costes de ejecución. Además, la integración de la infraestructura de datos descentralizada con los flujos de trabajo tradicionales de desarrollo de IA, y la consecución de verificabilidad preservando la privacidad de los datos, siguen siendo desafíos para el sector.

El desenlace final de la infraestructura de datos on-chain aún es incierto, pero la dirección es clara: los datos están evolucionando de ser un subproducto de plataformas centralizadas a convertirse en un activo nativo dentro de redes descentralizadas. El protocolo DATA se posiciona como una capa fundamental en esta transformación histórica.

Preguntas frecuentes

P1: ¿Cuál es la relación entre el protocolo DATA y Streamr?

DATA es el token nativo de la red Streamr. Streamr es una red descentralizada peer-to-peer de datos en tiempo real. El token DATA se utiliza para incentivar a los nodos, pagar por flujos de datos, delegar staking y gobernar el protocolo dentro de la red.

P2: ¿Cuáles son los principales usos del token DATA?

Los usos principales del token DATA incluyen el pago de suscripciones a flujos de datos, el staking de operadores de nodos para obtener recompensas por retransmisión, el staking delegado para retornos compartidos y la participación en votaciones de gobernanza de la red. Con el lanzamiento de productos de IA como StreamGPT, DATA también se utiliza en escenarios de consumo de datos por IA.

P3: ¿Qué problema resuelve la capa descentralizada de disponibilidad de datos (DA Layer)?

La DA Layer aborda la verificabilidad de los datos en las redes blockchain, garantizando que todos los participantes puedan comprobar la integridad y disponibilidad de los datos almacenados off-chain sin necesidad de descargarlos por completo. Esto permite que las blockchains aumenten significativamente su rendimiento sin sacrificar la seguridad y constituye un componente clave de la arquitectura blockchain modular.

P4: ¿Cómo acceden los modelos de IA a los datos a través del protocolo DATA?

Los modelos de IA acceden a flujos de datos en tiempo real mediante el mecanismo de publicación/suscripción de la red DATA. Los publicadores conectan los flujos a la red y los modelos de IA, como suscriptores, pagan tokens DATA para acceder a los datos. StreamGPT es un ejemplo típico de este modelo, generando insights a partir de datos en tiempo real para alimentar flujos de trabajo de IA.

P5: ¿Cuáles son los principales riesgos a los que se enfrenta el protocolo DATA?

Los riesgos clave incluyen: calidad inconsistente de los nodos que afecta a la estabilidad de la transmisión de datos, insuficiente estandarización de los datos que limita el crecimiento del ecosistema, alta complejidad en la coordinación cross-chain y riesgos de seguridad y costes de ejecución de los smart contracts. Además, los ciclos macro del mercado cripto y la incertidumbre regulatoria representan riesgos importantes a la baja.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement

¿Cómo funciona la infraestructura de datos on-chain? Análisis de la arquitectura del protocolo DATA y los mecanismos de flujo de datos

Mecanismos de recopilación y verificación de datos: de las fuentes al activo confiable on-chain

Sistemas de indexación descentralizados: hacer que los datos on-chain sean accesibles

Capa de disponibilidad de datos (DA Layer): del almacenamiento a la verificabilidad

Lógica de consumo de datos por modelos de IA: de los flujos de datos a las entradas inteligentes

Conclusión: la evolución de la infraestructura de datos on-chain

Preguntas frecuentes

Última hora

La Casa Blanca publicará estándares de lanzamiento de modelos de IA la próxima semana, revirtiendo la promesa anterior de ligereza regulatoria de Trump.

Morgan Stanley informa que el inventario de semiconductores de América del Norte aumentó solo 9 días en el primer trimestre, por debajo del promedio estacional de 19 días.

Unitree Robotics obtiene aprobación de registro de OPI por parte del regulador de valores de China

El KOSPI de Corea del Sur se desploma un 7,89% hoy, borrando cerca de 579 billones de wones.

La salida a bolsa de OpenAI se retrasa hasta 2027

El modelo de valoración de tres motores de Amazon: cómo AWS, la publicidad y el comercio electrónico transforman el valor de AMZN

El token TAC se dispara más de un 220 % en 7 días