Hoje saíram os novos dados do DB-Engines com os números acumulados até o final de maio/2022. Eu estou sempre acompanhando a evolução do Ranking . Não são infalíveis, mas talvez seja hoje a fonte de informação mais confiável que temos sobre o uso de bancos de dados. Infelizmente não existem números confiáveis sobre market share, uma vez que estamos falando de um mercado liderado por soluções Open Source, ou seja, não dá para contar o número de licenças pagas neste cenário. Para resolver esse problema o DB-Engines trabalha com uma pontuação baseada em menções em sites na internet, Google Trends, discussões no Stack Overflow e DBA Stak Exchange, oferta de vagas de empregos, Perfis no LinkedIn e relevâncias em redes sociais como o Twitter. Acho bastante razoável. E mais, eles acumulam dados de uma série histórica de quase 10 anos!
O futuro é livre?
Então deixe-me começar pelo final. Quero mostrar um gráfico muito significativo para ilustrar a minha afirmação no parágrafo anterior, onde afirmo que o mercado de banco de dados é hoje “liderado por soluções Open Source”:
Você pode até dizer que no último ano há uma tendência de acomodação com os bancos de dados comerciais com 48,8% e os bancos Open Source com 51,2%. Mas é bem diferente de 10 anos atrás onde a relação era de 64,5% contra 35,5%. Não sei se a vantagem do Open Source vai aumentar pouco ou muito nos próximos anos, mas dificilmente vamos assistir uma reversão desse quadro num curto espaço de tempo. Por outro lado… crescem os bancos de dados como serviço na nuvem, que capturam softwares de código aberto, transformando em produtos fechados, como o Aurora da Amazon, fora os já tradicionais serviços como o PaaS ou DBaaS que se espalharam para praticamente todos provedores na nuvem, e agora temos novos Serveless Database na mesma linha. Então para aqueles que sonham com um mundo livre, as preocupações não são mais software de código fechado X código aberto….
Destaques para os últimos 12 meses
Olhando para os últimos 12 meses os destaques positivos continuam os mesmos que deram na virada do ano a medalha de ouro para o Snowflake e a medalha de prata para o PostgreSQL. Mas hoje a medalha de bronze não iria mais para o MongoDB que acumula uma baixa de 7,49 pontos nos últimos 12 meses, mas sim para o Microsoft Access! É isso mesmo, dá pra acreditar, ele cresceu 26.88 pontos no período. É claro que se você olhar para a evolução dele nos últimos 10 anos, temos uma tendência de queda, mas há uma recuperação realmente surpreendente recentemente. Alguém aí sabe me explicar? Eu esperava uma queda lenta e dolorosa para o Access, como vemos com o DB2, mas alguma coisa está empurrando o Access para cima.
Houve quem achasse que era pegadinha de 1o de abril esses dias:
De qualquer forma, impressionante é o crescimento do Snowflake que surgiu no final de 2016 e hoje figura na 13a posição do ranking com 96,42 pontos, devendo passar em breve competidores tradicionais como MariaDB, Cassandra e SQLite. Mas será que esse crescimento acelerado vai se sustentar por muito tempo? Não é novidade algum banco ter um rápido crescimento mais não sustentar por muito tempo, como por exemplo o MariaDB, o Elasticsearch, Redis, SAP Hana, Microsoft Azure Cosmos DB e mais recentemente o Microsoft Azure SQL Database.
Olhando o gráfico parece dizer que não… mas se eles continuarem a atrair investimentos, quem sabe? O fato é que romper a barreira dos 200 pontos e chegar no Top5 não é para qualquer um. Eu diria que a disputa até o 6o lugar permanece bem embolada:
Top5
Se a gente olhar apenas para o Top5, as coisas parecem bem mais estáveis. MongoDB e PostgreSQL ficaram embolados no 4o e 5o lugar por um tempo, mas há um bom tempo o PostgreSQL tem se consolidado na 4a posição. Vale notar que há 10 anos atrás o PostgreSQL estava com 195 pontos e hoje tem 620 pontos. Ou seja, triplicou de tamanho e mantem um crescimento bem sustentável. O MongoDB saiu de 101 pontos e está em 480 pontos, um crescimento maior ainda, mas não apresenta mais uma tendência de crescimento nos últimos meses.
Oracle, MySQL e Microsoft SQL Server lideram o topo do ranking com boa folga e com oscilações, mas mantém uma boa distâncias dos demais. Embora os 3 primeiros colocados tenham uma pontuação menor que há 10 anos atrás, apenas o SQL Server tem uma tendência clara de queda, saindo de 1249 pontos para 933 pontos.
Uma boa pergunta hoje é: Quando o PostgreSQL vai alcançar o Microsoft SQL Server? Se pensarmos que o PostgreSQL cresceu 425 pontos e Microsoft SQL Server caiu 316 pontos, a diferença atual de 313 pontos deve desaparecer nos próximos anos, com a diferença caindo mais de 100 pontos por ano. Será que em 2025 o PostgreSQL vai alcançar o 3o lugar?
E a nuvem?
Mas antes de dizer que a Microsoft está fora do jogo, é preciso tirar os pés do chão e ir para as nuvens… a Microsoft está investindo pesado numa série de novos produtos específicos para rodar na Azure:
- Microsoft Azure SQL Database em 15o lugar, com 86,01 pontos
- Microsoft Azure Cosmos DB em 27o lugar, com 40,98 pontos
- Microsoft Azure Synapse Analytics em 36o lugar, com 21,33 pontos
- Microsoft Azure Search em 58o lugar, com 7,61 pontos
- Microsoft Azure Data Explorer em 59o lugar, com 7,34 pontos
- Microsoft Azure Table Storage em 77o lugar, com 5,76 pontos
Me parece que a Microsoft está mudando de estratégia para investir mais na nuvem. E não está sozinha, claro, a AWS, líder no segmento tem seus brinquedinhos também:
- Amazon DynamoDB em 16o lugar com 83,88 pontos
- Amazon Redshift em 31o lugar com 26,19 pontos
- Amazon Aurora em 45o lugar com 13,14 pontos
- Amazon Neptune em 108o lugar com 2,82 pontos
- Amazon CloudSearch em 120o lugar com 2,21 pontos
- Amazon SimpleDB em 122o lugar com 2,10 pontos
- Amazon DocumentDB em 128o lugar com 1,87 pontos
- Amazon Timestream em 174o lugar com 1,02 pontos
- Amazon Keyspaces em 225o lugar com 0,58 pontos
Uma posição peculiar, o PostgreSQL
E a mesma estratégia pode ser verificada com o Google, Alibaba e Oracle. Notem que o PostgreSQL acaba aparecendo várias vezes no ranking com seus derivados, em diferentes situações além da 4a posição:
- PostGIS em 28o lugar, com 31,68 pontos
- Amazon Redshift em 31o lugar, com 26,19 pontos
- Netezza em 37o lugar, com 19,48 pontos
- Greenplum em 43o lugar, com 13,27 pontos
- Amazon Aurora em 44o lugar, com 13,14 pontos
- TimescaleDB em 83o lugar, com 4,56 pontos
- EDB Postgres em 123o lugar, com 2,10 pontos
- Citus em 133o lugar, com 1,74 pontos
- Postgres-XL em 208o lugar, com 0,71 pontos
- AgensGraph em 322o lugar, com 0,09 pontos
- ToroDB em 340o lugar, com 0,03 pontos
Isso torna o PostgreSQL realmente único no ranking, por ter derivações distantes como o Redshift, versões que são apenas extensões, como o PostGIS, Citus e TimescaleDB e adaptações para a nuvem, como o Aurora e agora o AlloyDB recém lançado pelo Google, que logo vai aparecer no ranking.
Sobre a Oracle
No meio disso tudo ainda me intriga o fato de outros produtos da Oracle não apareçam explicitamente no ranking, o que poderia até estar enviesando o resultado para cima e para baixo: se o Exadata e o Autonomous Database estiverem na conta da primeira posição, deixa a comparação com a Microsoft equivocada, se está faltando computar dados sobre eles, então a Oracle pode estar sendo subestimada no ranking, e eles terem uma influência maior do que parece. Novamente aqui, alguém tem algum palpite?
Conclusão
Seja como for, duas tendências parecem claras hoje em dia: Bancos de dados Open Source e baseados em OpenSource continuam ganhando tração… e sim, o futuro dos bancos de dados está na nuvem.