Da leitura e indexação à análise, resuma brevemente a trilha de indexação de dados da Web3

intermediário9/27/2024, 3:37:05 PM
Este artigo explora o processo de desenvolvimento da acessibilidade aos dados da blockchain, compara a arquitetura e as características de aplicação da tecnologia de IA de três protocolos de serviço de dados, The Graph, Chainbase e Espaço e Tempo, e aponta que os serviços de dados da blockchain estão caminhando para a inteligência e estão se desenvolvendo na direção da segurança e continuarão desempenhando um papel importante como infraestrutura da indústria no futuro.

Este artigo explora a evolução da acessibilidade de dados de blockchain, comparando as características de três protocolos de serviços de dados - The Graph, Chainbase e Space and Time - em termos de arquitetura e aplicações de tecnologia de IA. Ele aponta que os serviços de dados de blockchain estão evoluindo para uma maior inteligência e segurança, e continuarão a desempenhar um papel crucial como infraestrutura fundamental na indústria no futuro.

1. Introdução

A partir da primeira onda de dApps em 2017, incluindo Etheroll, ETHLend e CryptoKitties, agora vemos uma variedade florescente de dApps financeiros, de jogos e sociais baseados em diferentes blockchains. Ao discutir aplicativos descentralizados on-chain, já consideramos as fontes dos vários dados que esses dApps utilizam em suas interações?

Em 2024, o foco é em IA e Web3. No mundo da inteligência artificial, os dados são como a força vital para seu crescimento e evolução. Assim como as plantas dependem da luz solar e da água para prosperar, os sistemas de IA dependem de grandes quantidades de dados para "aprender" e "pensar" continuamente. Sem dados, mesmo os algoritmos de IA mais sofisticados são meros castelos no ar, incapazes de liberar sua inteligência e eficácia pretendidas.

Este artigo analisa a evolução da indexação de dados blockchain sob a perspectiva da acessibilidade de dados, comparando o protocolo estabelecido de indexação de dados The Graph com os protocolos emergentes de serviços de dados blockchain Chainbase e Space and Time. Ele explora especialmente as similaridades e diferenças nos serviços de dados e na arquitetura de produto entre esses dois novos protocolos que incorporam tecnologia de inteligência artificial.

2. Complexidade e simplicidade do índice de dados: dos nós blockchain ao banco de dados completo da cadeia

2.1 Fontes de Dados: Nós da Blockchain

Desde o momento em que começamos a entender o que é blockchain, frequentemente nos deparamos com a frase: blockchain é um livro-razão descentralizado. Os nós da blockchain são a base de toda a rede blockchain, responsáveis por gravar, armazenar e disseminar todos os dados de transações on-chain. Cada nó possui uma cópia completa dos dados da blockchain, garantindo a descentralização da rede. No entanto, para usuários comuns, construir e manter um nó de blockchain não é uma tarefa fácil. Isso requer não apenas habilidades técnicas especializadas, mas também incorre em altos custos de hardware e largura de banda. Além disso, as capacidades de consulta dos nós comuns são limitadas, tornando difícil recuperar dados no formato que os desenvolvedores requerem. Portanto, embora teoricamente qualquer pessoa possa executar seu próprio nó, na prática, os usuários tendem a depender de serviços de terceiros.

Para resolver esse problema, surgiram os provedores de nós RPC (Remote Procedure Call). Esses provedores lidam com os custos e gerenciamento dos nós e oferecem dados por meio de pontos de extremidade RPC, permitindo que os usuários acessem dados da blockchain sem construir seus próprios nós. Os pontos de extremidade públicos de RPC são gratuitos, mas têm limites de taxa, o que pode impactar negativamente a experiência do usuário dos dApps. Os pontos de extremidade privados de RPC oferecem melhor desempenho ao reduzir a congestão, mas mesmo a recuperação de dados simples requer uma comunicação substancial de ida e volta. Isso os torna pesados em termos de solicitações e ineficientes para consultas de dados complexas. Além disso, os pontos de extremidade privados de RPC frequentemente enfrentam desafios de escalabilidade e falta de compatibilidade entre diferentes redes. No entanto, as interfaces de API padronizadas fornecidas pelos provedores de nós reduzem as barreiras para os usuários acessarem dados on-chain, preparando o terreno para análises de dados e aplicativos subsequentes.

2.2 Análise de Dados: De Dados Brutos a Dados Utilizáveis

Os dados obtidos dos nós de blockchain geralmente são dados brutos que foram criptografados e codificados. Embora esses dados mantenham a integridade e segurança da blockchain, sua complexidade aumenta a dificuldade de análise de dados. Para usuários comuns ou desenvolvedores, lidar diretamente com esses dados brutos requer conhecimento técnico substancial e recursos computacionais.

Neste contexto, o processo de análise de dados torna-se particularmente importante. Ao analisar dados brutos complexos e transformá-los em formatos mais compreensíveis e operacionais, os usuários podem compreender e utilizar intuitivamente esses dados. O sucesso da análise de dados afeta diretamente a eficiência e eficácia das aplicações de dados em blockchain, tornando-a uma etapa crítica em todo o processo de indexação de dados.

2.3 Evolução dos Indexadores de Dados

À medida que o volume de dados da blockchain aumenta, a demanda por indexadores de dados também cresceu. Os indexadores desempenham um papel crucial na organização de dados on-chain e no envio para bancos de dados para facilitar a consulta. O princípio de funcionamento de um indexador é indexar os dados da blockchain e disponibilizá-los prontamente por meio de uma linguagem de consulta semelhante a SQL (como APIs do GraphQL). Ao fornecer uma interface unificada para a consulta de dados, os indexadores permitem que os desenvolvedores obtenham rapidamente e com precisão as informações de que precisam usando linguagens de consulta padronizadas, simplificando significativamente o processo.

Diferentes tipos de indexadores otimizam a recuperação de dados de várias maneiras:

· Indexadores de Nós Completos: Esses indexadores executam nós completos da blockchain e extraem dados diretamente deles, garantindo a integridade e precisão dos dados, mas exigem armazenamento e capacidade de processamento substanciais.

· Indexadores Leves: Esses indexadores dependem de nós completos para buscar dados específicos conforme necessário, reduzindo os requisitos de armazenamento, mas potencialmente aumentando o tempo de consulta.

· Indexadores Especializados: Esses indexadores se concentram em tipos específicos de dados ou blockchains específicas, otimizando a recuperação para casos de uso específicos, como dados NFT ou transações DeFi.

· AggreGated Indexadores: Esses indexadores extraem dados de várias blockchains e fontes, incluindo informações off-chain, fornecendo uma interface de consulta unificada, o que é especialmente útil para dApps multi-chain.

Atualmente, um nó de arquivo Ethereum no cliente Geth no modo de arquivamento ocupa cerca de 13,5 TB de espaço de armazenamento, enquanto no cliente Erigon o requisito de arquivamento é de cerca de 3 TB. À medida que o blockchain continua a crescer, os requisitos de armazenamento de dados para nós de arquivamento também aumentarão. Diante de grandes quantidades de dados, os principais protocolos de indexação não apenas oferecem suporte à indexação de várias cadeias, mas também personalizam estruturas de análise de dados adaptadas a diferentes necessidades de dados de aplicativos. Por exemplo, a estrutura de "subgrafos" do The Graph é um exemplo típico.

O surgimento dos indexadores melhora significativamente a eficiência da indexação e consulta de dados. Em comparação com os pontos de extremidade RPC tradicionais, os indexadores podem indexar eficientemente grandes quantidades de dados e suportar consultas de alta velocidade. Esses indexadores permitem que os usuários realizem consultas complexas, filtrem facilmente os dados e os analisem após a extração. Além disso, alguns indexadores suportam a agregação de fontes de dados de várias blockchains, evitando a necessidade de implantar várias APIs em dApps de várias cadeias. Ao serem executados distribuídos em vários nós, os indexadores oferecem maior segurança e desempenho, reduzindo os riscos de interrupções e tempos de inatividade associados aos provedores de RPC centralizados.

Por outro lado, os indexadores permitem que os usuários obtenham as informações de que precisam diretamente usando linguagens de consulta predefinidas, sem ter que lidar com os dados complexos subjacentes. Esse mecanismo melhora significativamente a eficiência e confiabilidade da recuperação de dados, representando uma inovação importante no acesso a dados em blockchain.

2.4 Bases de Dados de Cadeia Completa: Alinhando-se em Direção ao Streaming Primeiro

Usar nós indexados para consultar dados geralmente significa que APIs se tornam a única Gateway para digerir dados on-chain. No entanto, quando um projeto entra na fase de escalonamento, muitas vezes requer fontes de dados mais flexíveis, que APIs padronizadas não conseguem fornecer. À medida que as demandas de aplicativos se tornam mais complexas, os indexadores de dados primários com seus formatos de indexação padronizados gradualmente lutam para atender às necessidades de consulta cada vez mais diversas, como pesquisa, acesso entre cadeias ou mapeamento de dados off-chain.

Na arquitetura moderna de pipeline de dados, uma abordagem “stream-first” tornou-se uma solução para as limitações do processamento em lote tradicional, permitindo a ingestão, processamento e análise de dados em tempo real. Essa mudança de paradigma permite que as organizações respondam imediatamente aos dados recebidos, fornecendo insights e tomando decisões quase que instantaneamente. Da mesma forma, o desenvolvimento de provedores de serviços de dados de blockchain está progredindo em direção à construção de streams de dados de blockchain. Provedores de serviços de indexação tradicionais lançaram produtos que obtêm dados de blockchain em tempo real por meio de streams de dados, como Substreams da The Graph e Mirror da Goldsky, além de lagos de dados em tempo real como Chainbase e SubSquid, que geram streams de dados com base em blockchains.

Esses serviços visam atender à demanda por análise em tempo real de transações em blockchain e fornecer capacidades de consulta mais abrangentes. Assim como a arquitetura de 'stream-first' revoluciona o processamento e consumo de dados em pipelines de dados tradicionais, reduzindo a latência e aprimorando a responsividade, esses provedores de fluxo de dados em blockchain também buscam apoiar o desenvolvimento de mais aplicativos e auxiliar na análise de dados em cadeia por meio de fontes de dados mais avançadas e maduras.

Redefinindo os desafios dos dados on-chain do ponto de vista das pipelines de dados modernas, podemos visualizar a gestão, armazenamento e provisão de dados on-chain por uma nova perspectiva, realizando seu pleno potencial. Quando começamos a ver subgráficos e serviços de indexação Ethereum ETL como fluxos de dados dentro da pipeline de dados, em vez de saídas finais, podemos vislumbrar um possível mundo onde conjuntos de dados de alta performance são adaptados para qualquer caso de uso empresarial.

3. AI + Banco de Dados? Comparação Profunda do The Graph, Chainbase e Espaço e Tempo

3.1 O Graph

A rede Graph alcança serviços de indexação e consulta de dados de várias cadeias por meio de uma rede descentralizada de nós, permitindo que os desenvolvedores indexem convenientemente os dados do blockchain e criem aplicativos descentralizados. Seus principais modelos de produto incluem o mercado de execução de consulta de dados e o mercado de cache de indexação de dados, que atendem às necessidades de consulta de produtos dos usuários. O mercado de execução de consulta de dados refere-se especificamente aos consumidores que pagam nós de índice adequados pelos dados de que necessitam, enquanto o mercado de cache de indexação de dados envolve nós de índice alocando recursos com base em fatores como a popularidade histórica de indexação de subgráficos, as taxas de consulta coletadas e a demanda de curadores on-chain por saídas de subgráficos.

Os subgrafos são as estruturas de dados fundamentais dentro da rede The Graph. Eles definem como extrair e transformar dados do blockchain em um formato consultável (por exemplo, esquema GraphQL). Qualquer pessoa pode criar um subgrafo e várias aplicações podem reutilizar esses subgrafos, aumentando a reutilização de dados e a eficiência operacional.

A rede Graph é composta por quatro papéis-chave: Indexadores, Delegadores, Curadores e Desenvolvedores, que trabalham juntos para fornecer suporte de dados para aplicativos Web3. Suas responsabilidades respectivas são as seguintes:

· Indexers: Os indexadores são operadores de nó dentro da rede The Graph que participam apostando GRT (o token nativo do The Graph). Eles fornecem serviços de indexação e processamento de consultas.

· Delegadores: Delegadores são usuários que apostam tokens GRT para apoiar a operação dos nós de índice. Eles ganham uma parte das recompensas com base nos nós de índice aos quais delegam.

· Curadores: os curadores são responsáveis por sinalizar quais subgráficos devem ser indexados pela rede. Eles ajudam a garantir que subgráficos valiosos sejam priorizados para processamento.

· Desenvolvedores: Ao contrário dos três papéis anteriores, os Desenvolvedores são o lado da demanda e são os principais usuários do The Graph. Eles criam e enviam subgráficos para a rede The Graph, aguardando que a rede atenda às suas necessidades de dados.

3.1 O Gráfico

O Graph agora passou completamente para um serviço de hospedagem de subgráficos descentralizado, com incentivos econômicos fluindo entre diferentes participantes para garantir a operação do sistema:

· Recompensas do Indexador: Os indexadores ganham renda por meio das taxas de consulta do consumidor e uma parte das recompensas em bloco de tokens GRT.

· Recompensas para Delegadores: Delegadores recebem uma parte das recompensas dos indexadores que eles apoiam.

· Recompensas do Curador: Se os curadores sinalizarem subgrafos valiosos, eles podem receber uma parte das taxas de consulta.

Na verdade, os produtos da The Graph estão evoluindo rapidamente na onda de IA. Como uma das equipes de desenvolvimento principais no ecossistema The Graph, a Semiotic Labs tem se concentrado em alavancar a tecnologia de IA para otimizar a precificação de indexação e a experiência de consulta do usuário. Atualmente, as ferramentas desenvolvidas pela Semiotic Labs, como AutoAgora, Allocation Optimizer e AgentC, aprimoram vários aspectos do desempenho do ecossistema.

· O AutoAgora introduz um mecanismo de precificação dinâmico que ajusta os preços em tempo real com base no volume de consultas e no uso de recursos, otimizando as estratégias de preços para garantir a competitividade do indexador e maximizar a receita.

· O Otimizador de Alocação aborda as questões complexas da alocação de recursos de subgráficos, ajudando os indexadores a obter a configuração ideal de recursos para melhorar a receita e o desempenho.

· AgentC é uma ferramenta experimental que permite aos usuários acessar os dados blockchain do The Graph usando linguagem natural, melhorando assim a experiência do usuário.

A aplicação dessas ferramentas permitiu que o The Graph aprimorasse ainda mais a inteligência do sistema e a facilidade de uso com a assistência de IA.

3.2 Chainbase

O Chainbase é uma rede de dados abrangente que integra todos os dados de blockchain em uma única plataforma, tornando mais fácil para os desenvolvedores construir e manter aplicativos. Suas características únicas incluem:

· Data Lake em tempo real: O Chainbase fornece um data lake em tempo real especificamente para fluxos de dados de blockchain, permitindo acesso instantâneo aos dados conforme são gerados.

· Arquitetura de dupla cadeia: Chainbase é construída sobre a camada Eigenlayer AVS, criando uma camada de execução que funciona em paralelo com o algoritmo de consenso CometBFT. Este design melhora a programabilidade e composabilidade de dados em cadeias cruzadas, suportando alto rendimento, baixa latência e finalidade, ao mesmo tempo que melhora a segurança da rede por meio de um modelo de duplo staking.

· Padrão de Formato de Dados Inovador: O Chainbase introduz um novo padrão de formato de dados chamado “manuscritos,” otimizando a estruturação e utilização de dados na indústria de criptomoedas.

· Modelo Cryptoworld: Com seus extensos recursos de dados blockchain, a Chainbase combina tecnologia de modelo de IA para criar modelos de IA que entendem, prevêem e interagem efetivamente com transações blockchain. O modelo básico, Theia, agora está disponível para uso público.

Esses recursos diferenciam a Chainbase dos protocolos de indexação de blockchain, concentrando-se na acessibilidade de dados em tempo real, formatos de dados inovadores e na criação de modelos mais inteligentes por meio da integração de dados on-chain e off-chain para aprimorar insights.

O modelo de IA da Chainbase, Theia, é um destaque chave que o diferencia de outros protocolos de serviços de dados. Com base no modelo DORA da NVIDIA, Theia aprende e analisa padrões de criptografia integrando dados on-chain e off-chain juntamente com atividades espaço-temporais. Através do raciocínio causal, ele responde para aprofundar a exploração do valor potencial e dos padrões de dados on-chain, proporcionando aos usuários serviços de dados mais inteligentes.

Serviços de dados habilitados para IA transformaram a Chainbase de meramente uma plataforma de serviços de dados de blockchain em um provedor de serviços de dados inteligentes mais competitivo. Com recursos de dados robustos e análises proativas de IA, a Chainbase pode oferecer insights de dados mais amplos e otimizar fluxos de processamento de dados dos usuários.

3.3 Espaço e Tempo

A Space and Time (SxT) tem como objetivo criar uma camada de computação verificável que estende as provas de conhecimento zero em um armazém de dados descentralizado, fornecendo processamento de dados confiável para contratos inteligentes, modelos de linguagem grandes e empresas. A Space and Time recentemente garantiu $20 milhões em sua última rodada de financiamento da Série A, liderada pela Framework Ventures, Lightspeed Faction, Arrington Capital e Hivemind Capital.

No campo da indexação e verificação de dados, o Space and Time introduz uma nova abordagem técnica — Proof of SQL. Esta é uma tecnologia inovadora de prova de conhecimento zero (ZKP) desenvolvida pela Space and Time que garante que as consultas SQL executadas no data warehouse descentralizado sejam invioláveis e verificáveis. Quando uma consulta é executada, a Prova de SQL gera uma prova criptográfica que verifica a integridade e a precisão dos resultados da consulta. Essa prova é anexada aos resultados da consulta, permitindo que qualquer verificador (como contratos inteligentes) confirme independentemente que os dados não foram adulterados durante o processamento. As redes blockchain tradicionais geralmente dependem de mecanismos de consenso para verificar a autenticidade dos dados, enquanto a Prova de SQL do Espaço e do Tempo implementa um método de verificação de dados mais eficiente. Especificamente, no sistema Space and Time, um nó é responsável pela aquisição de dados, enquanto outros nós usam a tecnologia zk para verificar a autenticidade desses dados. Essa abordagem reduz o consumo de recursos de vários nós indexando redundantemente os mesmos dados para chegar a um consenso, melhorando assim o desempenho geral do sistema. À medida que essa tecnologia amadurece, ela serve como uma pedra angular para as indústrias tradicionais que se concentram na confiabilidade de dados para construir produtos baseados em dados de blockchain.

Ao mesmo tempo, a SxT tem colaborado de perto com o laboratório de inovação conjunta de IA da Microsoft para acelerar o desenvolvimento de ferramentas de IA generativa, permitindo que os usuários processem facilmente dados de blockchain por meio de linguagem natural. Atualmente, no Space and Time Studio, os usuários podem inserir consultas em linguagem natural, e a IA as converterá automaticamente em SQL e executará a consulta em nome do usuário para apresentar os resultados finais necessários.

3.4 Comparação das diferenças

4. Conclusão e perspectivas

Em resumo, a tecnologia de indexação de dados blockchain evoluiu de fontes de dados iniciais do nó, através do desenvolvimento de analisadores de dados e indexadores, para um serviço completo de dados de cadeia habilitado para IA, marcando um processo contínuo de melhoria. Essa evolução contínua da tecnologia não apenas aprimora a eficiência e a precisão do acesso aos dados, mas também oferece aos usuários uma experiência inteligente sem precedentes.

Olhando para o futuro, com o contínuo desenvolvimento de novas tecnologias como IA e provas de conhecimento zero, os serviços de dados blockchain se tornarão ainda mais inteligentes e seguros. Temos motivos para acreditar que os serviços de dados blockchain continuarão desempenhando um papel vital como infraestrutura, fornecendo um suporte sólido para o progresso e a inovação na indústria.

Aviso Legal:

  1. Este artigo é reproduzido de [Laboratórios sem confiança], os direitos autorais pertencem ao autor original [Trustless Labs], se você tiver alguma objeção à reimpressão, entre em contato com o Gate Learnequipe e a equipe lidará com isso o mais rápido possível de acordo com os procedimentos relevantes.

  2. Aviso legal: As opiniões e pontos de vista expressos neste artigo representam apenas as opiniões pessoais do autor e não constituem qualquer conselho de investimento.

  3. Outras versões do artigo são traduzidas pela equipe Gate Learn e não são mencionadas emGate.io, o artigo traduzido não pode ser reproduzido, distribuído ou plagiado.

* Les informations ne sont pas destinées à être et ne constituent pas des conseils financiers ou toute autre recommandation de toute sorte offerte ou approuvée par Gate.io.
* Cet article ne peut être reproduit, transmis ou copié sans faire référence à Gate.io. Toute contravention constitue une violation de la loi sur le droit d'auteur et peut faire l'objet d'une action en justice.

Da leitura e indexação à análise, resuma brevemente a trilha de indexação de dados da Web3

intermediário9/27/2024, 3:37:05 PM
Este artigo explora o processo de desenvolvimento da acessibilidade aos dados da blockchain, compara a arquitetura e as características de aplicação da tecnologia de IA de três protocolos de serviço de dados, The Graph, Chainbase e Espaço e Tempo, e aponta que os serviços de dados da blockchain estão caminhando para a inteligência e estão se desenvolvendo na direção da segurança e continuarão desempenhando um papel importante como infraestrutura da indústria no futuro.

Este artigo explora a evolução da acessibilidade de dados de blockchain, comparando as características de três protocolos de serviços de dados - The Graph, Chainbase e Space and Time - em termos de arquitetura e aplicações de tecnologia de IA. Ele aponta que os serviços de dados de blockchain estão evoluindo para uma maior inteligência e segurança, e continuarão a desempenhar um papel crucial como infraestrutura fundamental na indústria no futuro.

1. Introdução

A partir da primeira onda de dApps em 2017, incluindo Etheroll, ETHLend e CryptoKitties, agora vemos uma variedade florescente de dApps financeiros, de jogos e sociais baseados em diferentes blockchains. Ao discutir aplicativos descentralizados on-chain, já consideramos as fontes dos vários dados que esses dApps utilizam em suas interações?

Em 2024, o foco é em IA e Web3. No mundo da inteligência artificial, os dados são como a força vital para seu crescimento e evolução. Assim como as plantas dependem da luz solar e da água para prosperar, os sistemas de IA dependem de grandes quantidades de dados para "aprender" e "pensar" continuamente. Sem dados, mesmo os algoritmos de IA mais sofisticados são meros castelos no ar, incapazes de liberar sua inteligência e eficácia pretendidas.

Este artigo analisa a evolução da indexação de dados blockchain sob a perspectiva da acessibilidade de dados, comparando o protocolo estabelecido de indexação de dados The Graph com os protocolos emergentes de serviços de dados blockchain Chainbase e Space and Time. Ele explora especialmente as similaridades e diferenças nos serviços de dados e na arquitetura de produto entre esses dois novos protocolos que incorporam tecnologia de inteligência artificial.

2. Complexidade e simplicidade do índice de dados: dos nós blockchain ao banco de dados completo da cadeia

2.1 Fontes de Dados: Nós da Blockchain

Desde o momento em que começamos a entender o que é blockchain, frequentemente nos deparamos com a frase: blockchain é um livro-razão descentralizado. Os nós da blockchain são a base de toda a rede blockchain, responsáveis por gravar, armazenar e disseminar todos os dados de transações on-chain. Cada nó possui uma cópia completa dos dados da blockchain, garantindo a descentralização da rede. No entanto, para usuários comuns, construir e manter um nó de blockchain não é uma tarefa fácil. Isso requer não apenas habilidades técnicas especializadas, mas também incorre em altos custos de hardware e largura de banda. Além disso, as capacidades de consulta dos nós comuns são limitadas, tornando difícil recuperar dados no formato que os desenvolvedores requerem. Portanto, embora teoricamente qualquer pessoa possa executar seu próprio nó, na prática, os usuários tendem a depender de serviços de terceiros.

Para resolver esse problema, surgiram os provedores de nós RPC (Remote Procedure Call). Esses provedores lidam com os custos e gerenciamento dos nós e oferecem dados por meio de pontos de extremidade RPC, permitindo que os usuários acessem dados da blockchain sem construir seus próprios nós. Os pontos de extremidade públicos de RPC são gratuitos, mas têm limites de taxa, o que pode impactar negativamente a experiência do usuário dos dApps. Os pontos de extremidade privados de RPC oferecem melhor desempenho ao reduzir a congestão, mas mesmo a recuperação de dados simples requer uma comunicação substancial de ida e volta. Isso os torna pesados em termos de solicitações e ineficientes para consultas de dados complexas. Além disso, os pontos de extremidade privados de RPC frequentemente enfrentam desafios de escalabilidade e falta de compatibilidade entre diferentes redes. No entanto, as interfaces de API padronizadas fornecidas pelos provedores de nós reduzem as barreiras para os usuários acessarem dados on-chain, preparando o terreno para análises de dados e aplicativos subsequentes.

2.2 Análise de Dados: De Dados Brutos a Dados Utilizáveis

Os dados obtidos dos nós de blockchain geralmente são dados brutos que foram criptografados e codificados. Embora esses dados mantenham a integridade e segurança da blockchain, sua complexidade aumenta a dificuldade de análise de dados. Para usuários comuns ou desenvolvedores, lidar diretamente com esses dados brutos requer conhecimento técnico substancial e recursos computacionais.

Neste contexto, o processo de análise de dados torna-se particularmente importante. Ao analisar dados brutos complexos e transformá-los em formatos mais compreensíveis e operacionais, os usuários podem compreender e utilizar intuitivamente esses dados. O sucesso da análise de dados afeta diretamente a eficiência e eficácia das aplicações de dados em blockchain, tornando-a uma etapa crítica em todo o processo de indexação de dados.

2.3 Evolução dos Indexadores de Dados

À medida que o volume de dados da blockchain aumenta, a demanda por indexadores de dados também cresceu. Os indexadores desempenham um papel crucial na organização de dados on-chain e no envio para bancos de dados para facilitar a consulta. O princípio de funcionamento de um indexador é indexar os dados da blockchain e disponibilizá-los prontamente por meio de uma linguagem de consulta semelhante a SQL (como APIs do GraphQL). Ao fornecer uma interface unificada para a consulta de dados, os indexadores permitem que os desenvolvedores obtenham rapidamente e com precisão as informações de que precisam usando linguagens de consulta padronizadas, simplificando significativamente o processo.

Diferentes tipos de indexadores otimizam a recuperação de dados de várias maneiras:

· Indexadores de Nós Completos: Esses indexadores executam nós completos da blockchain e extraem dados diretamente deles, garantindo a integridade e precisão dos dados, mas exigem armazenamento e capacidade de processamento substanciais.

· Indexadores Leves: Esses indexadores dependem de nós completos para buscar dados específicos conforme necessário, reduzindo os requisitos de armazenamento, mas potencialmente aumentando o tempo de consulta.

· Indexadores Especializados: Esses indexadores se concentram em tipos específicos de dados ou blockchains específicas, otimizando a recuperação para casos de uso específicos, como dados NFT ou transações DeFi.

· AggreGated Indexadores: Esses indexadores extraem dados de várias blockchains e fontes, incluindo informações off-chain, fornecendo uma interface de consulta unificada, o que é especialmente útil para dApps multi-chain.

Atualmente, um nó de arquivo Ethereum no cliente Geth no modo de arquivamento ocupa cerca de 13,5 TB de espaço de armazenamento, enquanto no cliente Erigon o requisito de arquivamento é de cerca de 3 TB. À medida que o blockchain continua a crescer, os requisitos de armazenamento de dados para nós de arquivamento também aumentarão. Diante de grandes quantidades de dados, os principais protocolos de indexação não apenas oferecem suporte à indexação de várias cadeias, mas também personalizam estruturas de análise de dados adaptadas a diferentes necessidades de dados de aplicativos. Por exemplo, a estrutura de "subgrafos" do The Graph é um exemplo típico.

O surgimento dos indexadores melhora significativamente a eficiência da indexação e consulta de dados. Em comparação com os pontos de extremidade RPC tradicionais, os indexadores podem indexar eficientemente grandes quantidades de dados e suportar consultas de alta velocidade. Esses indexadores permitem que os usuários realizem consultas complexas, filtrem facilmente os dados e os analisem após a extração. Além disso, alguns indexadores suportam a agregação de fontes de dados de várias blockchains, evitando a necessidade de implantar várias APIs em dApps de várias cadeias. Ao serem executados distribuídos em vários nós, os indexadores oferecem maior segurança e desempenho, reduzindo os riscos de interrupções e tempos de inatividade associados aos provedores de RPC centralizados.

Por outro lado, os indexadores permitem que os usuários obtenham as informações de que precisam diretamente usando linguagens de consulta predefinidas, sem ter que lidar com os dados complexos subjacentes. Esse mecanismo melhora significativamente a eficiência e confiabilidade da recuperação de dados, representando uma inovação importante no acesso a dados em blockchain.

2.4 Bases de Dados de Cadeia Completa: Alinhando-se em Direção ao Streaming Primeiro

Usar nós indexados para consultar dados geralmente significa que APIs se tornam a única Gateway para digerir dados on-chain. No entanto, quando um projeto entra na fase de escalonamento, muitas vezes requer fontes de dados mais flexíveis, que APIs padronizadas não conseguem fornecer. À medida que as demandas de aplicativos se tornam mais complexas, os indexadores de dados primários com seus formatos de indexação padronizados gradualmente lutam para atender às necessidades de consulta cada vez mais diversas, como pesquisa, acesso entre cadeias ou mapeamento de dados off-chain.

Na arquitetura moderna de pipeline de dados, uma abordagem “stream-first” tornou-se uma solução para as limitações do processamento em lote tradicional, permitindo a ingestão, processamento e análise de dados em tempo real. Essa mudança de paradigma permite que as organizações respondam imediatamente aos dados recebidos, fornecendo insights e tomando decisões quase que instantaneamente. Da mesma forma, o desenvolvimento de provedores de serviços de dados de blockchain está progredindo em direção à construção de streams de dados de blockchain. Provedores de serviços de indexação tradicionais lançaram produtos que obtêm dados de blockchain em tempo real por meio de streams de dados, como Substreams da The Graph e Mirror da Goldsky, além de lagos de dados em tempo real como Chainbase e SubSquid, que geram streams de dados com base em blockchains.

Esses serviços visam atender à demanda por análise em tempo real de transações em blockchain e fornecer capacidades de consulta mais abrangentes. Assim como a arquitetura de 'stream-first' revoluciona o processamento e consumo de dados em pipelines de dados tradicionais, reduzindo a latência e aprimorando a responsividade, esses provedores de fluxo de dados em blockchain também buscam apoiar o desenvolvimento de mais aplicativos e auxiliar na análise de dados em cadeia por meio de fontes de dados mais avançadas e maduras.

Redefinindo os desafios dos dados on-chain do ponto de vista das pipelines de dados modernas, podemos visualizar a gestão, armazenamento e provisão de dados on-chain por uma nova perspectiva, realizando seu pleno potencial. Quando começamos a ver subgráficos e serviços de indexação Ethereum ETL como fluxos de dados dentro da pipeline de dados, em vez de saídas finais, podemos vislumbrar um possível mundo onde conjuntos de dados de alta performance são adaptados para qualquer caso de uso empresarial.

3. AI + Banco de Dados? Comparação Profunda do The Graph, Chainbase e Espaço e Tempo

3.1 O Graph

A rede Graph alcança serviços de indexação e consulta de dados de várias cadeias por meio de uma rede descentralizada de nós, permitindo que os desenvolvedores indexem convenientemente os dados do blockchain e criem aplicativos descentralizados. Seus principais modelos de produto incluem o mercado de execução de consulta de dados e o mercado de cache de indexação de dados, que atendem às necessidades de consulta de produtos dos usuários. O mercado de execução de consulta de dados refere-se especificamente aos consumidores que pagam nós de índice adequados pelos dados de que necessitam, enquanto o mercado de cache de indexação de dados envolve nós de índice alocando recursos com base em fatores como a popularidade histórica de indexação de subgráficos, as taxas de consulta coletadas e a demanda de curadores on-chain por saídas de subgráficos.

Os subgrafos são as estruturas de dados fundamentais dentro da rede The Graph. Eles definem como extrair e transformar dados do blockchain em um formato consultável (por exemplo, esquema GraphQL). Qualquer pessoa pode criar um subgrafo e várias aplicações podem reutilizar esses subgrafos, aumentando a reutilização de dados e a eficiência operacional.

A rede Graph é composta por quatro papéis-chave: Indexadores, Delegadores, Curadores e Desenvolvedores, que trabalham juntos para fornecer suporte de dados para aplicativos Web3. Suas responsabilidades respectivas são as seguintes:

· Indexers: Os indexadores são operadores de nó dentro da rede The Graph que participam apostando GRT (o token nativo do The Graph). Eles fornecem serviços de indexação e processamento de consultas.

· Delegadores: Delegadores são usuários que apostam tokens GRT para apoiar a operação dos nós de índice. Eles ganham uma parte das recompensas com base nos nós de índice aos quais delegam.

· Curadores: os curadores são responsáveis por sinalizar quais subgráficos devem ser indexados pela rede. Eles ajudam a garantir que subgráficos valiosos sejam priorizados para processamento.

· Desenvolvedores: Ao contrário dos três papéis anteriores, os Desenvolvedores são o lado da demanda e são os principais usuários do The Graph. Eles criam e enviam subgráficos para a rede The Graph, aguardando que a rede atenda às suas necessidades de dados.

3.1 O Gráfico

O Graph agora passou completamente para um serviço de hospedagem de subgráficos descentralizado, com incentivos econômicos fluindo entre diferentes participantes para garantir a operação do sistema:

· Recompensas do Indexador: Os indexadores ganham renda por meio das taxas de consulta do consumidor e uma parte das recompensas em bloco de tokens GRT.

· Recompensas para Delegadores: Delegadores recebem uma parte das recompensas dos indexadores que eles apoiam.

· Recompensas do Curador: Se os curadores sinalizarem subgrafos valiosos, eles podem receber uma parte das taxas de consulta.

Na verdade, os produtos da The Graph estão evoluindo rapidamente na onda de IA. Como uma das equipes de desenvolvimento principais no ecossistema The Graph, a Semiotic Labs tem se concentrado em alavancar a tecnologia de IA para otimizar a precificação de indexação e a experiência de consulta do usuário. Atualmente, as ferramentas desenvolvidas pela Semiotic Labs, como AutoAgora, Allocation Optimizer e AgentC, aprimoram vários aspectos do desempenho do ecossistema.

· O AutoAgora introduz um mecanismo de precificação dinâmico que ajusta os preços em tempo real com base no volume de consultas e no uso de recursos, otimizando as estratégias de preços para garantir a competitividade do indexador e maximizar a receita.

· O Otimizador de Alocação aborda as questões complexas da alocação de recursos de subgráficos, ajudando os indexadores a obter a configuração ideal de recursos para melhorar a receita e o desempenho.

· AgentC é uma ferramenta experimental que permite aos usuários acessar os dados blockchain do The Graph usando linguagem natural, melhorando assim a experiência do usuário.

A aplicação dessas ferramentas permitiu que o The Graph aprimorasse ainda mais a inteligência do sistema e a facilidade de uso com a assistência de IA.

3.2 Chainbase

O Chainbase é uma rede de dados abrangente que integra todos os dados de blockchain em uma única plataforma, tornando mais fácil para os desenvolvedores construir e manter aplicativos. Suas características únicas incluem:

· Data Lake em tempo real: O Chainbase fornece um data lake em tempo real especificamente para fluxos de dados de blockchain, permitindo acesso instantâneo aos dados conforme são gerados.

· Arquitetura de dupla cadeia: Chainbase é construída sobre a camada Eigenlayer AVS, criando uma camada de execução que funciona em paralelo com o algoritmo de consenso CometBFT. Este design melhora a programabilidade e composabilidade de dados em cadeias cruzadas, suportando alto rendimento, baixa latência e finalidade, ao mesmo tempo que melhora a segurança da rede por meio de um modelo de duplo staking.

· Padrão de Formato de Dados Inovador: O Chainbase introduz um novo padrão de formato de dados chamado “manuscritos,” otimizando a estruturação e utilização de dados na indústria de criptomoedas.

· Modelo Cryptoworld: Com seus extensos recursos de dados blockchain, a Chainbase combina tecnologia de modelo de IA para criar modelos de IA que entendem, prevêem e interagem efetivamente com transações blockchain. O modelo básico, Theia, agora está disponível para uso público.

Esses recursos diferenciam a Chainbase dos protocolos de indexação de blockchain, concentrando-se na acessibilidade de dados em tempo real, formatos de dados inovadores e na criação de modelos mais inteligentes por meio da integração de dados on-chain e off-chain para aprimorar insights.

O modelo de IA da Chainbase, Theia, é um destaque chave que o diferencia de outros protocolos de serviços de dados. Com base no modelo DORA da NVIDIA, Theia aprende e analisa padrões de criptografia integrando dados on-chain e off-chain juntamente com atividades espaço-temporais. Através do raciocínio causal, ele responde para aprofundar a exploração do valor potencial e dos padrões de dados on-chain, proporcionando aos usuários serviços de dados mais inteligentes.

Serviços de dados habilitados para IA transformaram a Chainbase de meramente uma plataforma de serviços de dados de blockchain em um provedor de serviços de dados inteligentes mais competitivo. Com recursos de dados robustos e análises proativas de IA, a Chainbase pode oferecer insights de dados mais amplos e otimizar fluxos de processamento de dados dos usuários.

3.3 Espaço e Tempo

A Space and Time (SxT) tem como objetivo criar uma camada de computação verificável que estende as provas de conhecimento zero em um armazém de dados descentralizado, fornecendo processamento de dados confiável para contratos inteligentes, modelos de linguagem grandes e empresas. A Space and Time recentemente garantiu $20 milhões em sua última rodada de financiamento da Série A, liderada pela Framework Ventures, Lightspeed Faction, Arrington Capital e Hivemind Capital.

No campo da indexação e verificação de dados, o Space and Time introduz uma nova abordagem técnica — Proof of SQL. Esta é uma tecnologia inovadora de prova de conhecimento zero (ZKP) desenvolvida pela Space and Time que garante que as consultas SQL executadas no data warehouse descentralizado sejam invioláveis e verificáveis. Quando uma consulta é executada, a Prova de SQL gera uma prova criptográfica que verifica a integridade e a precisão dos resultados da consulta. Essa prova é anexada aos resultados da consulta, permitindo que qualquer verificador (como contratos inteligentes) confirme independentemente que os dados não foram adulterados durante o processamento. As redes blockchain tradicionais geralmente dependem de mecanismos de consenso para verificar a autenticidade dos dados, enquanto a Prova de SQL do Espaço e do Tempo implementa um método de verificação de dados mais eficiente. Especificamente, no sistema Space and Time, um nó é responsável pela aquisição de dados, enquanto outros nós usam a tecnologia zk para verificar a autenticidade desses dados. Essa abordagem reduz o consumo de recursos de vários nós indexando redundantemente os mesmos dados para chegar a um consenso, melhorando assim o desempenho geral do sistema. À medida que essa tecnologia amadurece, ela serve como uma pedra angular para as indústrias tradicionais que se concentram na confiabilidade de dados para construir produtos baseados em dados de blockchain.

Ao mesmo tempo, a SxT tem colaborado de perto com o laboratório de inovação conjunta de IA da Microsoft para acelerar o desenvolvimento de ferramentas de IA generativa, permitindo que os usuários processem facilmente dados de blockchain por meio de linguagem natural. Atualmente, no Space and Time Studio, os usuários podem inserir consultas em linguagem natural, e a IA as converterá automaticamente em SQL e executará a consulta em nome do usuário para apresentar os resultados finais necessários.

3.4 Comparação das diferenças

4. Conclusão e perspectivas

Em resumo, a tecnologia de indexação de dados blockchain evoluiu de fontes de dados iniciais do nó, através do desenvolvimento de analisadores de dados e indexadores, para um serviço completo de dados de cadeia habilitado para IA, marcando um processo contínuo de melhoria. Essa evolução contínua da tecnologia não apenas aprimora a eficiência e a precisão do acesso aos dados, mas também oferece aos usuários uma experiência inteligente sem precedentes.

Olhando para o futuro, com o contínuo desenvolvimento de novas tecnologias como IA e provas de conhecimento zero, os serviços de dados blockchain se tornarão ainda mais inteligentes e seguros. Temos motivos para acreditar que os serviços de dados blockchain continuarão desempenhando um papel vital como infraestrutura, fornecendo um suporte sólido para o progresso e a inovação na indústria.

Aviso Legal:

  1. Este artigo é reproduzido de [Laboratórios sem confiança], os direitos autorais pertencem ao autor original [Trustless Labs], se você tiver alguma objeção à reimpressão, entre em contato com o Gate Learnequipe e a equipe lidará com isso o mais rápido possível de acordo com os procedimentos relevantes.

  2. Aviso legal: As opiniões e pontos de vista expressos neste artigo representam apenas as opiniões pessoais do autor e não constituem qualquer conselho de investimento.

  3. Outras versões do artigo são traduzidas pela equipe Gate Learn e não são mencionadas emGate.io, o artigo traduzido não pode ser reproduzido, distribuído ou plagiado.

* Les informations ne sont pas destinées à être et ne constituent pas des conseils financiers ou toute autre recommandation de toute sorte offerte ou approuvée par Gate.io.
* Cet article ne peut être reproduit, transmis ou copié sans faire référence à Gate.io. Toute contravention constitue une violation de la loi sur le droit d'auteur et peut faire l'objet d'une action en justice.
Lancez-vous
Inscrivez-vous et obtenez un bon de
100$
!