Quando os dados criam vantagem competitiva… e quando não criam

Muitos executivos e investidores assumem que é possível usar as capacidades de dados do cliente para obter uma vantagem competitiva imbatível. Quanto mais clientes você tem, mais dados pode coletar, e esses dados, quando analisados com ferramentas de aprendizado de máquina, permitem que você ofereça um produto melhor que atrai mais clientes.

Você pode então coletar ainda mais dados e eventualmente marginalizar seus concorrentes da mesma forma que as empresas com efeitos de rede consideráveis fazem. Ou pelo menos é o que se pensa. Mais frequentemente do que não, essa suposição está errada. Na maioria das vezes, as pessoas superestimam grosseiramente a vantagem que os dados conferem. Os ciclos virtuosos gerados pelo aprendizado habilitado por dados podem parecer semelhantes aos dos efeitos de rede regulares, nos quais uma oferta – como uma plataforma de mídia social – se torna mais valiosa à medida que mais pessoas a usam e, finalmente, alcança uma massa crítica de usuários que exclui os concorrentes.

Mas, na prática, os efeitos de rede regulares duram mais tempo e tendem a ser mais poderosos. Para estabelecer a posição competitiva mais forte, você precisa deles e do aprendizado habilitado por dados. No entanto, poucas empresas são capazes de desenvolver ambos. No entanto, sob as condições certas, dados gerados pelo cliente podem ajudá-lo a construir defesas competitivas, mesmo se os efeitos de rede não estiverem presentes. Neste artigo, vamos guiá-lo sobre quais são essas condições e explicar como avaliar se elas se aplicam ao seu negócio.

O que mudou?

Empresas construídas com base em dados existem há muito tempo. Pegue as agências de crédito e os agregadores de informações LexisNexis, Thomson Reuters e Bloomberg, apenas para citar algumas. Essas empresas são protegidas por barreiras significativas à entrada devido às economias de escala envolvidas na aquisição e estruturação de grandes quantidades de dados, mas seus modelos de negócios não envolvem a obtenção de dados dos clientes e a mineração deles para entender como melhorar as ofertas.

Coletar informações do cliente e usá-las para criar produtos e serviços melhores é uma estratégia antiga, mas o processo costumava ser lento, limitado em escopo e difícil de dimensionar. Para montadoras, empresas de bens de consumo embalados e muitos outros fabricantes tradicionais, isso exigia a análise de dados de vendas, a realização de pesquisas com clientes e a realização de grupos focais. Mas os dados de vendas muitas vezes não estavam vinculados a clientes individuais, e como as pesquisas e grupos focais eram caros e demorados, apenas dados de um número relativamente pequeno de clientes eram coletados.

Isso mudou drasticamente com o surgimento da nuvem e novas tecnologias que permitem às empresas processar rapidamente e dar sentido a vastas quantidades de dados. Produtos e serviços conectados à Internet agora podem coletar informações diretamente dos clientes, incluindo seus detalhes pessoais, comportamento de pesquisa, escolhas de conteúdo, comunicações, postagens em mídias sociais, localização GPS e padrões de uso.
Depois que algoritmos de aprendizado de máquina analisam esse “excesso digital”, as ofertas de uma empresa podem ser ajustadas automaticamente para refletir os resultados e até mesmo personalizadas para indivíduos. Esses desenvolvimentos tornam o aprendizado habilitado por dados muito mais poderoso do que os insights do cliente que as empresas produziram no passado. No entanto, eles não garantem barreiras defensáveis.
Construindo trincheiras com aprendizado habilitado por dados

Para determinar em que medida uma vantagem competitiva fornecida pelo aprendizado habilitado por dados é sustentável, as empresas devem responder a sete perguntas:

1 – Quanto valor é adicionado pelos dados do cliente em relação ao valor autônomo da oferta?

Quanto maior o valor adicionado, maior a chance de criar uma vantagem duradoura. Vamos analisar um negócio onde o valor dos dados do cliente é muito alto: a Mobileye, líder fornecedora de sistemas avançados de assistência ao motorista (ADAS, do inglês Advanced Driver Assistance Systems), que incluem avisos de prevenção de colisões e saída de faixa para veículos.

A Mobileye vende seus sistemas principalmente para fabricantes de carros, que os testam extensivamente antes de incorporá-los em seus produtos. É crucial que os sistemas sejam à prova de falhas, e os dados de teste são essenciais para melhorar sua precisão. Ao coletá-los de dezenas de seus clientes, a Mobileye conseguiu elevar a precisão de seus ADAS para 99,99%.

Por outro lado, o valor de aprender com os clientes é relativamente baixo para fabricantes de smart TVs. Alguns agora incluem software que pode fornecer recomendações personalizadas para programas ou filmes com base nos hábitos de visualização de um indivíduo, bem como no que é popular entre outros usuários. Até agora, os consumidores não se importam muito com esse recurso (que também é oferecido por provedores de serviços de streaming como Amazon e Netflix). Eles consideram principalmente o tamanho da TV, qualidade da imagem, facilidade de uso e durabilidade ao tomar decisões de compra. Se aprender com os clientes fosse um fator maior, talvez o negócio de smart TV fosse menos competitivo.

2 – Quão rapidamente o valor marginal do aprendizado habilitado por dados diminui?

Em outras palavras, em quanto tempo a empresa alcança um ponto em que dados adicionais do cliente não mais aumentam o valor de uma oferta? Quanto mais lentamente o valor marginal diminui, mais forte é a barreira. Ao responder a esta pergunta, você deve avaliar o valor do aprendizado pela disposição dos clientes em pagar e não por alguma outra medida específica da aplicação, como a porcentagem de consultas de chat-bot que poderiam ser respondidas corretamente ou a fração de vezes que uma recomendação de filme foi clicada.

Digamos que você grafou a precisão dos sistemas ADAS da Mobileye como uma função do uso do cliente (total de milhas percorridas pelos fabricantes de carros que o testam) e descobriu que alguns fabricantes e um nível moderado de testes seriam suficientes para alcançar, digamos, 90% de precisão, mas que seriam necessários muitos mais testes com um conjunto maior de fabricantes de carros para chegar a 99%, quanto mais 99,99%.

Interpretar isso como significando que o valor marginal dos dados do cliente estava diminuindo rapidamente seria, é claro, incorreto: o valor da melhoria adicional de 9 pontos percentuais (ou mesmo de 0,99 ponto) na precisão permanece extremamente alto, dadas as implicações de vida ou morte. Seria difícil para qualquer fabricante de carros individual — mesmo o maior deles — gerar a quantidade necessária de dados por si só ou para quaisquer concorrentes potenciais da Mobileye replicarem os dados. É por isso que a Mobileye foi capaz de estabelecer uma posição dominante no mercado de ADAS, tornando-se uma aquisição altamente atraente para a Intel, que a comprou por US$ 15 bilhões em 2017.

Quando o valor marginal do aprendizado a partir de dados do cliente permanece alto mesmo depois de uma base de clientes muito grande ter sido adquirida, produtos e serviços tendem a ter vantagens competitivas significativas. Isso pode ser visto com sistemas projetados para prever doenças raras (como os oferecidos pela RDMD) e motores de busca online como Baidu e Google. Embora a Microsoft tenha investido muitos anos e bilhões de dólares no Bing, não conseguiu abalar a dominância do Google na busca. Motores de busca e sistemas de previsão de doenças precisam de enormes quantidades de dados do usuário para fornecer resultados consistentemente confiáveis.

Um contraexemplo de um negócio onde o valor marginal dos dados do usuário cai rapidamente são os termostatos inteligentes. Esses produtos precisam apenas de alguns dias para aprender as preferências de temperatura dos usuários ao longo do dia. Nesse contexto, o aprendizado habilitado por dados não pode fornecer muita vantagem competitiva. Embora tenha lançado os primeiros termostatos inteligentes que aprendem com o comportamento do cliente em 2011, a Nest (adquirida pelo Google em 2014) agora enfrenta uma concorrência significativa de players como Ecobee e Honeywell.

3 – Quão rapidamente a relevância dos dados do usuário se deprecia?

Se os dados se tornam obsoletos rapidamente, então, todas as outras coisas sendo iguais, será mais fácil para um concorrente entrar no mercado, porque não precisa igualar os anos de aprendizado dos dados do titular.

Todos os dados acumulados ao longo dos anos pela Mobileye a partir dos fabricantes de carros permanecem valiosos nas versões atuais de seus produtos. O mesmo acontece com os dados dos usuários de mecanismos de busca que o Google coletou ao longo de décadas.

Embora as buscas por alguns termos possam se tornar raras com o tempo, enquanto buscas por novos termos podem começar a aparecer com mais frequência, ter anos de dados históricos de busca é de valor inegável para atender aos usuários de hoje. A baixa taxa de depreciação de seus dados ajuda a explicar por que tanto a Mobileye quanto o Google Search provaram ser negócios muito resilientes.

No entanto, com jogos sociais casuais para computadores e dispositivos móveis, o valor do aprendizado a partir de dados do usuário tende a diminuir rapidamente. Em 2009, esse mercado decolou quando a Zynga introduziu seu jogo FarmVille, altamente bem-sucedido. Embora a empresa fosse famosa por depender muito da análise de dados do usuário para tomar decisões de design, descobriu-se que as percepções aprendidas de um jogo não se transferiam muito bem para o próximo: os jogos sociais casuais estão sujeitos a modismos, e as preferências do usuário mudam rapidamente ao longo do tempo, tornando difícil construir vantagens competitivas sustentáveis baseadas em dados.

Depois de alguns sucessos adicionais, incluindo FarmVille 2 e CityVille, a Zynga parou de produzir novos sucessos, e em 2013 perdeu quase metade de sua base de usuários. Foi superada por fabricantes de jogos como Supercell (Clash of Clans) e Epic Games (Fortnite). Depois de atingir o pico de US$ 10,4 bilhões em 2012, o valor de mercado da Zynga ficou abaixo de US$ 4 bilhões na maior parte dos seis anos seguintes.

4 – Os dados são proprietários – o que significa que não podem ser adquiridos de outras fontes, facilmente copiados ou engenharia reversa?

Ter dados exclusivos do cliente com poucos ou nenhum substituto é fundamental para criar uma barreira defensável.

Considere a Adaviv, uma startup da região de Boston na qual investimos, que oferece um sistema de gerenciamento de culturas que permite aos produtores (agora principalmente de cannabis) monitorar continuamente plantas individuais. O sistema utiliza IA, software de visão computacional e uma técnica proprietária de anotação de dados para rastrear biometria de plantas não visíveis a olho nu, como sinais precoces de doenças ou falta de nutrientes adequados. Em seguida, ele traduz os dados em insights que os produtores podem usar para prevenir surtos de doenças e melhorar os rendimentos.

Quanto mais produtores a Adaviv atende, mais ampla se torna a gama de variantes, condições agrícolas e outros fatores que ela pode aprender, e maior a precisão de suas previsões para clientes novos e existentes. Contraste sua situação com a de provedores de filtros de spam, que podem adquirir dados do usuário relativamente baratos. Isso ajuda a explicar a existência de dezenas desses provedores.

É importante ter em mente que o progresso tecnológico pode minar uma posição baseada em dados exclusivos ou proprietários. Um exemplo disso é o software de reconhecimento de fala. Historicamente, os usuários precisavam treinar o software para entender suas vozes e padrões de fala individuais, e quanto mais uma pessoa o usava, mais preciso ele se tornava. Esse mercado foi dominado pelas soluções Dragon da Nuance por muitos anos. No entanto, na última década, houve melhorias rápidas em sistemas de reconhecimento de fala independente de alto-falantes, que podem ser treinados em conjuntos de dados de fala publicamente disponíveis e levar pouco ou nenhum tempo para aprender a entender a voz de um novo falante. Esses avanços permitiram que muitas empresas fornecessem novas aplicações de reconhecimento de fala (atendimento automatizado ao cliente por telefone, serviços de transcrição automatizada de reuniões, assistentes virtuais) e estão colocando pressão crescente sobre a Nuance em seus mercados principais.

5 – Quão difícil é imitar melhorias no produto baseadas em dados do cliente?

Mesmo quando os dados são únicos ou proprietários e produzem insights valiosos, é difícil construir uma vantagem competitiva duradoura se as melhorias resultantes puderem ser copiadas por concorrentes sem dados semelhantes.

Um par de fatores afeta a capacidade das empresas de superar esse desafio. Um deles é se as melhorias estão ocultas ou profundamente incorporadas em um processo de produção complexo, tornando-as difíceis de replicar.

O Pandora, o serviço de streaming de música, se beneficia dessa barreira. Sua oferta aproveitou o Music Genome Project proprietário da empresa, que categorizou milhões de músicas com base em cerca de 450 atributos, permitindo que o Pandora personalizasse estações de rádio de acordo com as preferências individuais dos usuários.

Quanto mais um usuário ouve suas estações e classifica músicas para cima ou para baixo, melhor o Pandora pode adaptar as seleções musicais para esse usuário. Essa personalização não pode ser facilmente imitada por nenhum concorrente porque está profundamente ligada ao Music Genome Project.

Em contraste, as melhorias de design baseadas no aprendizado do uso do cliente de muitos produtos de software de produtividade de escritório, como o Calendly para coordenar calendários e o Doodle para fazer pesquisas sobre horários de reuniões, podem ser facilmente observadas e copiadas. É por isso que dezenas de empresas oferecem software semelhante.

O segundo fator é quão rapidamente os insights dos dados do cliente mudam. Quanto mais rapidamente isso acontece, mais difícil é para os outros imitá-los. Por exemplo, muitos recursos de design da interface do Google Maps podem ser facilmente copiados (e foram, pelo Apple Maps, entre outros). Mas uma parte fundamental do valor do Google Maps é sua capacidade de prever o tráfego e recomendar rotas ótimas, o que é muito mais difícil de copiar porque se baseia em dados de usuários em tempo real que se tornam obsoletos em questão de minutos. Apenas empresas com bases de usuários igualmente grandes (como a Apple nos Estados Unidos) podem esperar replicar esse recurso. O Apple Maps está reduzindo a diferença em relação ao Google Maps nos Estados Unidos, mas não em países onde a Apple tem uma base de usuários relativamente pequena.

6 – Os dados de um usuário ajudam a melhorar o produto para o mesmo usuário ou para outros?

Idealmente, eles farão ambos, mas a diferença entre os dois é importante. Quando os dados de um usuário melhoram o produto para essa pessoa, a empresa pode personalizá-lo individualmente, criando custos de mudança. Quando os dados de um usuário melhoram o produto para outros usuários, isso pode — mas pode não — criar efeitos de rede. Ambos os tipos de melhorias ajudam a fornecer uma barreira à entrada, mas o primeiro torna os clientes existentes muito apegados, enquanto o último fornece uma vantagem chave na competição por novos clientes.

Por exemplo, o Pandora foi o primeiro grande player em streaming de música digital, mas depois ficou para trás do Spotify e do Apple Music, que ainda estão crescendo. Como observamos, o principal ponto de venda do Pandora é que ele pode adaptar estações aos gostos de cada usuário. Mas a aprendizagem entre os usuários é muito limitada: os votos para cima ou para baixo de um usuário individual permitem que o Pandora identifique atributos musicais que o usuário gosta e, em seguida, sirva músicas que compartilham esses atributos.

Em contraste, o Spotify focou muito mais em fornecer aos usuários recursos de compartilhamento e descoberta, como a capacidade de pesquisar e ouvir estações de outras pessoas, criando assim efeitos de rede diretos e atraindo clientes adicionais. O serviço do Pandora continua disponível apenas nos Estados Unidos (onde possui uma base de usuários leais), enquanto o Spotify e o Apple Music se tornaram players globais.

Embora o Pandora tenha sido adquirido pela Sirius XM por US$ 3,5 bilhões em fevereiro de 2019, o Spotify tornou-se uma empresa pública em abril de 2018 e, no início de novembro de 2019, valia US$ 26 bilhões. Claramente, a personalização baseada na aprendizagem dos dados de um usuário individual ajuda a manter os clientes existentes presos, mas não leva ao tipo de crescimento exponencial que os efeitos de rede proporcionam.

7 – Com que rapidez os insights dos dados do usuário podem ser incorporados aos produtos?

Ciclos de aprendizado rápidos dificultam que os concorrentes acompanhem, especialmente se ocorrerem múltiplos ciclos de melhoria do produto durante o contrato médio do cliente. Mas quando são necessários anos ou gerações sucessivas de produtos para fazer melhorias com base nos dados, os concorrentes têm mais chance de inovar no intervalo e começar a coletar seus próprios dados do usuário.

Portanto, a vantagem competitiva dos dados do cliente é mais forte quando a aprendizagem dos clientes de hoje se traduz em melhorias mais frequentes do produto para esses mesmos clientes, em vez de apenas para futuros clientes do produto ou serviço. Vários dos exemplos de produtos que discutimos anteriormente — mapas, mecanismos de busca e sistemas de gerenciamento de culturas baseados em IA — podem ser atualizados rapidamente para incorporar a aprendizagem dos clientes atuais.

Um contraexemplo é oferecido pelos credores diretos online, como LendUp e LendingPoint, que aprendem a tomar decisões de empréstimo melhores examinando o histórico de pagamento dos usuários e como ele se correlaciona com vários aspectos dos perfis e comportamentos dos usuários. Aqui, a única aprendizagem relevante para os mutuários atuais é a dos mutuários anteriores, que já está refletida nos contratos e taxas oferecidos aos mutuários atuais.

Não há motivo para os mutuários se preocuparem com qualquer aprendizado futuro que o credor possa se beneficiar, já que seus contratos existentes não serão afetados. Por esse motivo, os clientes não se preocupam com quantos outros mutuários se inscreverão ao decidir se devem ou não fazer um empréstimo de um determinado credor. Os mutuários existentes podem preferir permanecer com seus credores atuais, que os conhecem melhor do que outros credores, mas o mercado para novos mutuários continua muito competitivo.

Os dados conferem efeitos de rede?

As respostas às perguntas 6 e 7 vão lhe dizer se a aprendizagem habilitada por dados criará verdadeiros efeitos de rede. Quando a aprendizagem de um cliente se traduz em uma melhor experiência para outros clientes e quando essa aprendizagem pode ser incorporada ao produto rápido o suficiente para beneficiar seus usuários atuais, os clientes se importarão com quantas outras pessoas estão adotando o produto. O mecanismo em ação aqui é muito semelhante ao que está subjacente aos efeitos de rede com plataformas online. A diferença é que os usuários de plataformas preferem ingressar em redes maiores porque desejam interagir com mais pessoas, não porque mais usuários geram mais insights que melhoram os produtos.

Vamos olhar para o Google Maps novamente. Os motoristas o usam em parte porque esperam que muitos outros também o usem, e quanto mais dados de tráfego o software coleta deles, melhores são suas previsões sobre condições de estrada e tempos de viagem. O Google Search e o sistema de gerenciamento de culturas baseado em IA da Adaviv também desfrutam de efeitos de rede habilitados por dados.

Assim como os efeitos de rede regulares, os habilitados por dados podem criar barreiras à entrada. Ambos os tipos de efeitos apresentam um enorme desafio inicial, ou problema do ovo e da galinha: empresas que visam construir efeitos de rede regulares precisam atrair um número mínimo de usuários para iniciar os efeitos, e aqueles que visam alcançar efeitos de rede habilitados por dados precisam de uma quantidade inicial de dados para iniciar o ciclo virtuoso de aprendizado.

Apesar dessas semelhanças, os efeitos de rede regulares e os habilitados por dados têm diferenças-chave, e tendem a tornar as vantagens baseadas nos regulares mais fortes. Primeiro, o problema do início frio geralmente é menos severo com os efeitos de rede habilitados por dados, porque comprar dados é mais fácil do que comprar clientes. Muitas vezes, fontes alternativas de dados, mesmo que não perfeitas, podem nivelar significativamente o campo de jogo ao remover a necessidade de uma grande base de clientes.

Em segundo lugar, para produzir efeitos de rede habilitados por dados duradouros, a empresa precisa trabalhar constantemente para aprender com os dados do cliente. Em contraste, como o cofundador da Intuit, Scott Cook, costuma dizer, “produtos que se beneficiam de [efeitos de rede regulares] melhoram enquanto eu durmo”.

Com efeitos de rede regulares, as interações entre os clientes (e possivelmente com fornecedores terceirizados de ofertas complementares) criam valor mesmo se a plataforma parar de inovar. Mesmo que uma nova rede social ofereça recursos objetivamente melhores do que o Facebook (por exemplo, melhor proteção de privacidade), ainda teria que lidar com os poderosos efeitos de rede do Facebook — os usuários querem estar na mesma plataforma social que a maioria dos outros usuários.

Em terceiro lugar, em muitos casos, quase todos os benefícios da aprendizagem a partir dos dados do cliente podem ser alcançados com números relativamente baixos de clientes. E em algumas aplicações (como reconhecimento de fala), melhorias dramáticas em IA reduzirão a necessidade de dados do cliente ao ponto em que o valor da aprendizagem habilitada por dados pode desaparecer completamente. Os efeitos de rede regulares, por outro lado, se estendem mais e são mais resilientes: um cliente adicional ainda tipicamente aumenta o valor para os clientes existentes (que podem interagir ou transacionar com ele), mesmo quando o número de clientes existentes já é muito grande.

À medida que produtos de consumo mesmo mundanos se tornam inteligentes e conectados — novos tipos de roupas, por exemplo, agora podem reagir às condições climáticas e rastrear quilometragem e sinais vitais —, a aprendizagem habilitada por dados será usada para aprimorar e personalizar cada vez mais ofertas.

No entanto, seus provedores não construirão posições competitivas fortes a menos que o valor adicionado pelos dados do cliente seja alto e duradouro, os dados sejam proprietários e levem a melhorias no produto que são difíceis de copiar, ou a aprendizagem habilitada por dados crie efeitos de rede. Nas décadas futuras, melhorar as ofertas com dados do cliente será um pré-requisito para permanecer no jogo, e pode dar aos incumbentes uma vantagem sobre os novos entrantes.

Mas na maioria dos casos, não gerará dinâmicas de vencedor leva tudo. Em vez disso, os negócios mais valiosos e poderosos para o futuro previsível serão aqueles que são construídos tanto em efeitos de rede regulares quanto aprimorados pela aprendizagem habilitada por dados, como os marketplaces da Alibaba e da Amazon, a App Store da Apple e as redes sociais do Facebook.

Fonte:

HBR, janeiro de 2020

Sobre os autores:

Andrei Hagiu é professor associado de sistemas de informação na Questrom School of Business da Boston University.

Julian Wright é professor de economia na National University of Singapore.