O papel dos dados ‘silenciosos’ na nova era dos negócios

Quem nunca ouviu a metáfora de que “Os dados são o novo petróleo”, é porque provavelmente passou os últimos 20 anos dentro de uma caverna.

Brincadeiras à parte, nossa sociedade é atualmente tão dependente da tecnologia que diria que os dados já passaram a ter até mesmo mais utilidade do que o combustível. Ao meu ver, a bolha se rompeu na pandemia, quando o planeta foi obrigado a usar a internet para praticamente qualquer coisa.

Hoje, geramos tanta informação que nossa dificuldade atual está em classificar e utilizar essa informação para gerar valor. Plataformas voltadas para o consumidor, como redes sociais, utilizam o conteúdo gerado como produto para venda de espaço publicitário aos anunciantes e o problema desse modelo é que ele tende a saturar.

Em um mundo saturado de informação, as empresas precisam criar modelos de monetização através do uso desses dados de forma transparente, sem que o usuário perceba. E isso tem-se definido como a era dos dados invisíveis.

No meu mundo, isso começou há bastante tempo. Meu primeiro contato com um modelo de monetização de dados foi quando tínhamos uma fábrica de software chamada Informant.

Em 2012, conheci dois caras fantásticos, Thiago e Benjamin, que na época estavam à frente do GuiaBolso, uma empresa de consolidação financeira pessoal. Eles tinham essa dor: apesar de nos Estados Unidos existirem empresas especializadas na coleta de dados financeiros de instituições financeiras, elas não tinham a capacidade de coletar os dados de bancos brasileiros.

O motivo era que nosso sistema financeiro já era mais avançado que o americano, e os controles de segurança dos bancos eram considerados inquebráveis pelos estrangeiros. Em um papo de bar, eles me desafiaram a encontrar uma forma de baixar esses dados. Se eu conseguisse, eles me dariam uma parte da empresa por ter ajudado a resolver esse impasse.

Em cerca de seis meses, criei um scraper (software especializado para baixar dados não formatados) para cada um dos cinco maiores bancos, tornando-me acionista da companhia até sua venda para o PicPay.

Nesse meio tempo, uma vez que eles tiveram um sucesso considerável, o Banco Central começou a falar do OpenBanking, que nada mais é do que obrigar os bancos a fazerem o que nós tivemos que fazer manualmente, e dar a propriedade dos dados para quem de fato é o dono: o cliente.

Hoje, o OpenFinance (nome comercial do OpenBanking) brasileiro é considerado o mais avançado do mundo, e posso dizer, do lado de quem detém alguns milhões de contas abertas, que ele funciona tanto para envio quanto para recepção de dados. O desafio neste momento está justamente em como monetizá-los de forma adequada, uma vez que essa interconexão tem um custo altíssimo para ser mantida e evoluída.

Exemplo de soluções que conseguem monetizar dados invisíveis são as carteiras digitais. Se você hoje importa seu cartão de crédito para a Apple Wallet, fica constantemente abismado com as facilidades que isso gera, como, por exemplo, entrar em um website e com um clique do botão e um face match, realizar um pagamento e, às vezes, ter dados essenciais prontos para compartilhamento com o website.

A complexidade por trás de uma transação dessas só é possível pelo compartilhamento de dados entre diversas partes, a ponto de parecer mágica para quem não entende como funciona a infraestrutura de pagamentos eletrônicos.

No entanto, o maior desafio na utilização de dados para gerar valor está no processamento e na formatação deles. É extremamente complexo formatar dados de forma determinística; tabulá-los, como chamamos, é um trabalho constante quando sua entrada não está na mesma estrutura, e esse era o grande problema que eu tinha ao desenvolver os scrapers dos bancos.

A cada mudança, alguém precisava mexer no software para se adequar, tanto que montamos times focados em cada um dos conectores para mantê-los atualizados. Isso foi a única solução viável até o lançamento do Word2Vec, uma técnica de processamento de dados por meio de vetorização revolucionária, criada pelo Google em 2013, que ironicamente foi a base para a existência do ChatGPT, hoje considerado seu principal concorrente na missão de organizar os dados do mundo.

Os primeiros modelos pareciam papagaios; conseguiam falar perfeitamente, mas o que eles falavam, para qualquer coisa diferente de pequenas respostas, trazia informações sem qualquer conexão com a realidade. No entanto, após a terceira ou quarta geração, eles começaram a ser capazes de transformar dados não estruturados em dados estruturados quase que perfeitamente.

Hoje, aqui no Asaas, temos modelos interpretando contratos para entender se estão de acordo com os parâmetros para aprovação de crédito ou até mesmo processando notas fiscais pré-existentes para configuração de emissão em nossas aplicações, coisas que não seriam nem de perto possíveis com outra tecnologia.

E, para adicionar ainda mais capacidade, vieram os MCPs, Model Context Protocols, que, em resumo, ajudam os LLMs a acessar serviços externos de forma que eles possam ler e enviar dados, um caso interessante para demonstrar sua utilidade, são sistemas legados baseados em aplicações desktop; quem trabalha em empresas menos tecnológicas deve conviver com algum desses objetos de museu em forma de executável.

Estamos caminhando para um mundo em que é possível conversar com qualquer aplicação como se ela fosse um humano, e isso já está revolucionando a forma como interagimos como a informação e a consumimos. Estamos vendo nascer a próxima evolução das interfaces homem-máquina, em que a troca de informações não mais depende de equipamentos físicos, como computadores ou celulares.

Até mesmo um áudio pode resolver um problema complexo ou executar uma atividade que antes exigiria, no mínimo, um dispositivo de entrada e saída para ser feita com sucesso.

Aqui, temos trabalhado em um assistente chamado IAN, cuja missão é ajudar pessoas sem acesso à web ou ao nosso aplicativo de celular a utilizar todas as funcionalidades da nossa plataforma, seja por mensagens ou por voz.

Por fim, ainda nem começamos a falar do que a Neuralink está em vias de começar a testar em humanos, onde sequer precisaremos falar ou escrever para interagir com o mundo virtual… Tem muito assunto para conversarmos ainda.

Leave a Reply

Your email address will not be published.

Gostou das informações ? Então espalhe pela rede : )

Instagram
Subscrever
RSS