O futuro do mercado de dados

by Digital Rights LAC on April 2, 2023

No que toca à proteção de dados pessoais o Brasil está bastante atrasado, inclusive em relação a seus vizinhos. Argentina, México, Uruguai, Peru e Chile já contam com seus marcos regulatórios. Canadá, além de diversos países europeus por conta da Diretiva Europeia 95/46, de 1995, também. Desde janeiro de 2013 discute-se um anteprojeto de proteção a dados pessoais no Ministério da Justiça. O texto, entretanto, encontra-se parado, já que as atenções neste momento estão voltadas para o Marco Civil da Internet.

De, Pablo Cerdeira

O fato importante é que, mesmo com a existência de legislação tratando do tema em diversos países, o quadro normativo existente não foi suficiente para impedir abusos como os que tem sido revelandos recentementes. Vale notar que os recentes escândalos envolvendo NSA, seu irmão britânico GCHQ - com o caso da captura não-autorizada de imagens em vídeo-conferências do Yahoo e outros foram praticados por órgãos públicos, mas com a utilização de dados do setor privado - fornecidos ou capturados expontaneamente ou não.

A revelação de tais escândalos demonstra não apenas a ineficácia do quadro normativo atual em adoção por diversos países, quando existente, como também cria um ambiente de oposição e tensão entre setores públicos e privados. O ano de 2013 ficou marcado por um grande afastamento entre esses setores no que toca à atuação conjunta em projetos de análise de dados, ainda que os projetos não envolvessem dados pessoais. E isso pode ser prejudicial para toda a sociedade.

Diante das grandes mudanças no cenário, o atraso brasileiro pode, ao final, ser uma oportunidade positiva para que o país discuta um projeto de lei mais adequado, seja no âmbito interno, seja no âmbito internacional; seja do setor privado, seja do setor público.

A proteção de dados pessoais no Brasil hoje

Mesmo sem uma lei específica para proteção de dados pessoais, não se pode dizer que o cidadão brasileiro encontra-se completamente desamparado em relação à proteção de seus dados. A Constituição brasileira considera, dentre as garantias fundamentais, o direito inviolável à vida privada e à intimidade. No âmbito público, o cidadão pode valer-se da recente LAI - Lei de Acesso à Informação para requisitar acesso a dados governamentais no caso de qualquer suspeita relacionada ao armazenamento e análise de dados pessoais. No âmbito privado, contamos com o artigo 43 do Código de Defesa do Consumidor (Lei 8.078/90) que determina: *”O consumidor, (…) terá acesso às informações existentes em cadastros, fichas, registros e dados pessoais e de consumo arquivados sobre ele, bem como sobre as suas respectivas fontes”*. Tal disposição, entretanto, tem sido aplicada especificamente para os casos de cadastros para fins de concessão de crédito, mesmo que a lei não obste seu uso para o acesso a quaisquer bancos de dados do setor privado.

Podemos dizer que, apesar de desejável, não há urgência na promulgação de uma lei de proteção de dados pessoais, especialmente porque as legislações existentes em outros países já se mostraram não-eficazes após os últimos escândalos.

Assim, entendemos que o Brasil poderia aproveitar esse momento não para acelerar o atual anteprojeto de lei, que é baseado nas normas existentes em outros países, mas para uma reflexão mais profunda e séria, que realmente poderia contribuir para o cenário regulatório internacional, de todo um mercado de dados, e não apenas da proteção pessoal.

O mercado de dados

O mundo físico ao qual estamos acostumados é medido em metros, quilos, litros, galões etc e seus derivados. A área ocupada pelo mercado imobiliário pode ser medida em quilômetros quadrados. A produção anual de grãos, em toneladas. A produção de petróleo, em galões. A medida básica do mundo digital é o bit e seus derivados (bytes, kilobytes, megabytes, gigabytes etc). O “tamanho” do mundo digital, portanto, pode ser medido pela quantidade de bits da qual ele é composto.

Considerando que os dados que compõem o mundo digital são, para fins jurídicos, bens imateriais, podemos concluir pela existência de um mercado, tal qual o de produção de grãos, de petróleo etc composto por dados e medido pelo seu volume em bits. O conceito de mercado que estou usando aqui é o mais simples possível: um ambiente composto de bens com valor de uso ou de troca.

Como qualquer mercado, o mercado de dados precisa ser melhor compreendido e analisado para que sua regulamentação seja realizada de forma a melhor atender aos interesses de toda a sociedade. É através de sua compreensão que será possível estabelecer limites para a produção e uso dos dados, quais os tipos de dados componentes desse mercado, quem são os proprietários naturais de cada um dos tipos de dados, quais os atores dessa cadeia e suas responsabilidades. Assim como ocorreu com o mercado de propriedade intelectual, de petróleo, de energia elétrica, imobiliário e tantos outros.

O mercado que mais cresce no mundo

Sem qualquer margem para dúvidas, o mercado que mais cresce atualmente, em números relativos e absolutos, é o mercado de dados. Estudos[[1](https://www.emc.com/leadership/digital-universe/iview/executive-summary-a-universe-of.htm)] apontam que o volume médio de dados armazenados por ano entre 2005 e 2020 crescerá um total de 30.000%. Com estimativa de dobrar a cada dois anos.

Apesar de não ser claro para o cidadão, mecanismos que permitem a coleta de enormes volumes de dados se multiplicam todos os anos. A compra em um supermercado com cartão de fidelidade fornece descontos. Mas ao mesmo tempo permite à rede ter um perfil extremamente preciso de cada cliente. Extrapolar o perfil de compras para se obter outras informações a respeito do consumidor, até mesmo informações pessoais, não é difícil. Quem compra queijos e vinhos frequentemente tem um padrão de vida diferente daquele que compra fraldas e leite em pó. Mesmo dentre os que compram fraldas e leite em pó, dependendo das marcas escolhidas, pode-se concluir muito a respeito de sua condição financeira, por exemplo. Desnecessário citar o clássico caso Target, no qual a loja, antes mesmos dos pais, descobriu uma gravidez não-planejada e precoce.

Geramos dados a todos os momentos, mesmo que involuntariamente. Os restaurantes, locais frequentados e valores das contas de determinada pessoa, informação presente no histórico de uso dos cartões de crédito, são outros bons indicadores que permitem deduzir, com muita precisão, diversos outros aspectos de sua vida. As mesmas informações podem ser extraídas, ainda com mais detalhes, a partir dos históricos de localização gerados pelos aparelhos de celular. O mesmo vale para as notas-fiscais eletrônicas, para as *tags* para passagem em pedágios e estacionamentos entre tantos outros.

Uma legislação de proteção de dados pessoais seria importante nesse cenário. Mas não seria o bastante. A proteção dos dados pessoais é apenas uma pequena parcela de um mercado bastante grande e complexo.

A nova corrida do ouro

Dada a ausência de regulamentação, vivemos uma nova *”corrida do ouro”*. Setores públicos e privados em busca de gerar o maior volume possível de dados para “acumular capital”, ou para “fazer caixa”, ainda que esses dados não tenham aplicação imediata.

É o exemplo da NSA, revelado por Snowden. Mesmo que incapazes de atualmente analisar todos os dados coletados, a agência de segurança norte-americana buscou realizar a coleta mais extensiva possível, ainda que para análises - ou negociações - futuras. É o mesmo comportamento que já vimos em outros mercados totalmente desregulados em seus primeiros anos (ocupação de territórios virgens, corridas por metais e pedras preciosas em diversos países etc).

O mesmo se dá no setor privado, e em proporções muito maiores do que no setor público. O aplicativo WhatsApp, comprado pelo Facebook por U$ 19 bilhões de dólares é apenas um exemplo. Trata-se da aquisição de um aplicativo gratuito para a maioria de seus usuários e que tem por princípio não incluir propaganda entre as conversas. Com sua carteira de 400 milhões de usuários, mesmo que todos fossem pagantes e que todo o valor fosse lucro, o Facebook levaria quase 50 anos para começar a ter retorno do investimento. Não parece ser um investimento muito interessante.

A não ser que se considere as cerca de 10 bilhões de mensagens trocadas diariamente como um ativo. E, melhor ainda, um ativo em um mercado muito pouco regulado, no qual a “mão invisível” pode ser facilmente controlada pelos maiores atores.

Nesse cenário regulatório obscuro e ineficaz diante dos recentes escândalos, é natural - e desejável - que a população e a sociedade civil organizada se posicionem de forma contrária e refratária à esse crescimento desmedido na coleta de dados, em especial se houver qualquer colaboração entre setores públicos e privados.

Uso de dados e o interesse público

A coleta e análise de grandes volumes de dados, *per se*, não é boa nem ruim. É importante que se leve em conta sua finalidade e a transparência com que são realizadas. Os mesmos dados coletados por órgãos governamentais e empresas privadas, hoje vistos com muita desconfiança pela sociedade, podem ter usos bastante importantes e nobres na administração pública. Alguns exemplos:

Mobilidade urbana

Um dos pontos de gestão mais complexa de toda grande cidade é a mobilidade urbana. Trata-se de setor que, para além dos bilionários prejuízos decorrentes das horas perdidas nos engarrafamentos, é responsável também por enormes desperdícios de recursos (ônibus circulando vazios em um local, e outros lotados do outro lado da cidade) que encarecem o transporte público; desperdício de combustível e aumento nas emissões de gases; atrasos no deslocamento de policiais, ambulâncias e bombeiros que podem resultar na perda de vidas, dentre inúmeros outros problemas.

Para racionalizar a mobilidade nos centros urbanos o Brasil tornou obrigatório para todos os municípios com mais de 20 mil habitantes a elaboração de um plano de mobilidade (Lei 12.587/12). Um dos elementos mais importantes para isso é a chamada matriz origem-destino, ou matriz OD. É ela quem mapeia como as pessoas se locomovem dentro da cidade.

O modelo tradicional de elaboração de matrizes OD é baseado em pesquisas amostrais caríssimas e relativamente limitadas. Apenas para as capitais, estima-se gastos em mais de 1 bilhão de reais para sua elaboração.

Mas o Brasil conta hoje com mais de 270 milhões de celulares, para uma população de 190 milhões de habitantes. Quase todo habitante das grandes cidades, mesmo os com menos recursos, costuma carregar consigo um aparelho celular em seus deslocamentos. E os registros de posicionamento desses aparelhos podem ser obtidos junto às empresas de telefonia atraves dos registros de CDRs - Call Detail Records, que são coletados para efeitos de cobrança, compensação recíproca entre as empresas pelo uso de antenas e para melhorias na cobertura do sinal.

Com tais registros, mesmo que anonimizados, é possível elaborar matriz OD muito mais precisas do que as realizadas por pesquisas amostrais e a um custo centenas de vezes menor. Some-se a isso um grau de precisão incontavelmente superior, permitindo inclusive a elaboração de matrizes OD para eventos específicos, como grandes eventos esportivos, carnaval, reveillon etc.

Previsões Epidemiológicas

Governos já estão testando o rastreamento de ocorrências de palavras-chave, tais como “dengue, febre, dor no corpo, náusea, enjoo, diarréia etc” em redes sociais para a elaboração de modelos de alertas epidemiológicos mais precisos e mais rápidos. Testes práticos já realizados demonstram que, conjuntamente com outros indicadores, modelos de alerta baseados no rastreamento de redes sociais podem antecipar em até uma semana o alerta epidemiológico, também com precisão muito maior do que os modelos tradicionais baseados exclusivamente em exames laboratoriais.

Em conjunto com os dados de uma matriz OD bastante detalhada, como a citada acima, por exemplo, torna-se possível, inclusive antecipar como deve ser o espalhamento da doença pela cidade.

Outros casos

Há diversos outros casos em que setor público e setor privado podem colaborar com a troca de dados para o benefício da sociedade. A parceria entre a Cidade do Rio de Janeiro e o Waze, por exemplo, forneceu aos gestores públicos uma série de informações importantes sobre a ocorrência de engarrafamentos, de acidentes, problemas nas vias etc. A atuação da cidade no combate a pontos de alagamento prioritários levou em consideração os alertas de tráfego informados pelos próprios cidadãos através do Waze. A troca de dados entre o setor público e o privado pode ser um fator de fortalecimento da participação democrática na administração pública, como neste caso.

Em contrapartida, todas as alterações viárias realizadas na cidade são informadas ao Waze e outros aplicativos de mapas para que as rotas oferecidas aos seus usuários sejam as melhores possíveis. A título de exemplo, as mudanças no centro do Rio de Janeiro em decorrência do fechamento do Elevado da Perimetral, os desvios em Copacabana por conta do Reveillon, os desvios e fechamentos de acordo com a agenda de blocos de carnaval foram informados para que os aplicativos recomendassem rotas que não passassem por tais locais.

A utilização de dados de câmeras leitoras de placas de veículo já foram utilizadas, também em testes preliminares, para identificação de veículos roubados e não-recuperados, com uma taxa de localização de 40%. Um número altíssimo também a um custo extremamente baixo.

Conclusão

Como vimos, o mercado de dados é bastante novo e tem crescido de forma absolutamente incomparável com qualquer outro setor da economia. Sua regulação, entretanto, ainda não existe no Brasil, e os debates ainda estão em fase relativamente inicial.

Em uma visão liberal-garantista, talvez o ponto mais importante a ser discutido seja a elaboração de uma lei de proteção de dados pessoais. Apesar de importante, os modelos existentes se mostraram insuficientes para conter abusos. Especialmente por conta da questão territorial, já que as maiores detentoras de dados, em geral, são empresas sediadas nos EUA, afastadas, portanto, da jurisdição brasileira. A necessidade de proteção a dados pessoais existe, mas precisa ser tratada na esfera internacional para que se alcance a efetividade necessária.

Por outro lado, em uma visão utilitarista-publicista, muito pouco, ou quase nada, tem sido discutido a respeito das possibilidades de utilização, pelo poder público, de dados gerados pelo setor privado para elaboração de políticas e soluções públicas. Esse é um debate já bastante evoluído em outras áreas, como na utilização de recursos do subsolo, na ocupação de espaços urbanos, no setor financeiro; mas ainda inexistente no que toca à utilização de dados. É preciso colocar na pauta a discussão relativa ao interesse público no acesso a dados do setor privado e, especialmente, os limites, para ambos os setores, no que toca aos dados privados.

O Brasil, por uma série de coincidências, encontra-se em posição privilegiada para assumir papel de liderança internacional nesse tema. Se por um lado estamos atrasados na elaboração de uma lei de proteção a dados pessoais, por outro temos a oportunidade de aprender com os erros dos demais para a elaboração de um quadro normativo mais eficaz. Ao mesmo tempo, o posicionamento protagonista recente do Brasil em foros internacionais frente às violações internacionais de dados nacionais também nos coloca em posição própria para proposições inovadoras.

Assim, o caminho a seguir passa, necessariamente pelo tratamento da proteção de dados pessoais. Mas não pode ficar restrito ao tratamento interno da questão e nem se esgotar nela. É preciso que o mercado de dados seja tratado não apenas como mais um mercado, mas como uma questão de estado.