Review de tendências de tecnologia de 2022, parte um: código aberto, nuvem, blockchain
O código aberto veio para ficar, a nuvem está catalisando seu crescimento e o ecossistema de blockchain está crescendo e se diversificando.
No espírito dos últimos dois anos, revisamos os desenvolvimentos naquilo que identificamos como os principais impulsionadores de tecnologia para a década de 2020 no mundo dos bancos de dados, gerenciamento de dados e IA. Estamos olhando para 2021, tentando identificar padrões que darão forma a 2022.
Começamos hoje com um review do
software de código aberto, nuvem e blockchain . Em seguinda uma review de
IA e gráficos de conhecimento .
Código aberto e nuvem
O software de código aberto está em ascensão há algum tempo e não vemos nenhum sinal de desaceleração desse crescimento. De acordo com
o Hype Cycle de 2021 do Gartner para Software de Código Aberto (OSS) : "Até 2025, mais de 70% das empresas aumentarão seus gastos com TI em OSS, em comparação com seus gastos atuais com TI. Além disso, até 2025, software como serviço (SaaS) se tornará o modelo de consumo preferido para OSS devido à sua capacidade de oferecer melhor simplicidade operacional, segurança e escalabilidade".
As previsões do Gartner sobre o código aberto em geral são ainda mais ousadas e mais específicas quando se trata de código aberto no mundo do gerenciamento de banco de dados e dados. Já em 2019, o Gartner previu que
o futuro dos bancos de dados é a nuvem , e que o
futuro dos bancos de dados também é outra coisa: é o código aberto.
Em 2022, previu o Gartner, mais de 70% dos novos aplicativos internos serão desenvolvidos em um banco de dados de código aberto e 50% das instâncias de banco de dados relacional proprietário existentes terão sido convertidos ou estarão em processo de conversão. No amanhecer de 2022, é difícil verificar a precisão dessas previsões.
O que podemos fazer, entretanto, é oferecer uma explicação razoável, mesmo que um pouco clichê agora. O Gartner também oferece uma dica para isso, vinculando o OSS e a nuvem via SaaS. O OSS pode mobilizar pessoas além dos limites de uma única organização para contribuir com software de alta qualidade e pode pular a fila nas vendas corporativas e estabelecer uma presença conquistando os corações e mentes dos desenvolvedores. Esses são fatos amplamente reconhecidos agora.
No mundo do banco de dados e gerenciamento de dados, especialmente quando se trata de análises e IA, o ponto focal são os dados. A razão pela qual esses bancos de dados e sistemas de gerenciamento de dados operam em primeiro lugar é para coletar os dados que serão usados para construir aplicativos analíticos e de IA.
Para muitas organizações, bancos de dados e sistemas de gerenciamento de dados se tornam uma espécie de mercadoria que funciona melhor na nuvem, onde a resiliência e a elasticidade são tarefas de terceiros. Dessa forma, as organizações podem se concentrar em sua missão principal, que é usar os dados para entregar valor.
A nuvem e o código aberto são os grandes facilitadores para bancos de dados, sistemas de gerenciamento de dados e plataformas de aprendizado de máquina
Embora seja difícil verificar a precisão das previsões do Gartner sobre a prevalência de OSS no mundo dos dados, podemos olhar para algumas indicações como um substituto para isso. Primeiro, em janeiro de 2021, os
bancos de dados OSS ultrapassaram os rivais de código fechado em
db-engines.com, o site popular que mantém o controle das métricas dos bancos de dados.
Além disso, a pontuação dos bancos de dados e sistemas de gerenciamento de dados entre os projetos de software de fonte aberta de crescimento mais rápido oferece outra dica. O
Índice ROSS (Runa OSS) é um índice criado e mantido pela Runa Capital, uma Capital de Risco que apóia fundadores que estão construindo empresas inovadoras em SaaS B2B, tecnologia profunda e software para setores regulamentados. O pessoal da Runa procura empresas promissoras com um exército de fãs em rápido crescimento e as mantém no Github como parte de seus planos de investimento.
Ao longo de 2021, cerca de 35% dos projetos OSS incluídos no Índice ROSS foram bancos de dados e sistemas de gerenciamento de dados, incluindo
tecnologias como
Appwrite,
Prisma e
SeMI, que abordamos nesta coluna. Em um ecossistema OSS que inclui tudo, desde o desenvolvimento de front-end até aplicativos de blockchain, bancos de dados e sistemas de gerenciamento de dados estão sobre-representados. E todos esses projetos aplicam o que agora é o manual padrão para OSS: uma versão de linha de base gratuita para uso, mais uma versão corporativa oferecida por meio do modelo SaaS na nuvem.
Outra evidência relacionada à prevalência de OSS e da nuvem como modelos operacionais é a quantidade de financiamento recebido por empresas construídas nesta combinação em 2021. 2021 viu o gigante OSS Databricks levantar uma
rodada de $ 1B Série G em fevereiro, e um
$ 1,6B Série H em agosto , elevando sua avaliação para $ 38 bilhões. Além disso, o
Confluent, outro gigante do OSS, entrou com um pedido de IPO .
2021 também viu mais alguns unicórnios no mundo dos dados OSS.
O banco de dados gráfico Neo4j levantou uma rodada de financiamento da Série F de $ 325 milhões, a maior na história dos bancos de dados, elevando sua avaliação para mais de $ 2 bilhões.
Apollo GraphQL levantou uma rodada de US $ 130 milhões da Série D em uma avaliação de $ 1,5 bilhão,
Yugabyte levantou uma rodada de financiamento de $ 188 milhões da Série C em uma avaliação de $ 1,3 bilhões, e o
CockroachDB levantou algumas rodadas também, com a última sendo uma
Série F de $ 278 milhões em avaliação de US $ 5 bilhões.
E isso sem considerar todos os aspirantes a dados e unicórnios AI OSS por aí, de
OctoML e
Edge Impulse a
Superconductive e
Startree. Como Luis Ceze, CEO e fundador da OctoML,
disse à ZDNet recentemente, há muito capital circulando e sendo investido em empresas de OSS criando valor. Esperamos que essa tendência continue em 2022.
O que vimos muito pouca aceitação do mainstream em 2021 foi uma maneira mais refinada de contabilizar o valor gerado por meio do OSS. Este é um tópico que começamos a explorar em 2019, e em 2021
apresentamos o projeto CHAOSS - o esforço mais elaborado que vimos para capturar o valor que as comunidades de OSS geram. Equilibrar, ou mesmo definir,
fabricantes e compradores no mundo OSS permanece controverso, e 2021 viu mais dois fornecedores comerciais de OSS,
Elastic e
Grafana, mudando suas licenças.
Dois, três, muitos blockchains
As plataformas Blockchain também são de código aberto, mas, embora relacionadas a dados, a história delas é diferente. Vamos tirar isso do caminho: 2021 foi um ano de ruptura para o blockchain? Não, na verdade não. 2022 será um ano de ruptura para o blockchain? Provavelmente não. Mas esse não é o ponto. A repentina ascensão do Blockchain ao estrelato em 2017 foi bastante abrupta e prematura. Os conceitos e a tecnologia ainda estão em desenvolvimento, enquanto a adoção convencional ainda é provisória.
Para falar em termos de ciclo de hype, o blockchain está passando pelo vale da desilusão. Mas isso não significa que não tenha significado. Para reiterar: o potencial transformacional existe, mas ainda há um longo caminho a percorrer, tanto no lado técnico quanto no organizacional e operacional.
Em 2020, o
DeFi movido a blockchain ganhou destaque. Em 2021, o DeFi atingiu a parede da realidade.
DeFi significa Finanças Descentralizadas. Resumindo, a promessa do DeFi é ser capaz de eliminar os intermediários em todos os tipos de transações. Em 2020, DeFi viu
muito crescimento, parte dele justificado, notamos no ano passado.
Sem surpresa, no que está se tornando um padrão no mundo blockchain após ICOs, golpistas se reuniram. 'Rug pulls', um esquema de scam associado ao DeFi, foi responsável por 37% de toda a receita de scam em blockchain em 2021 em comparação com apenas 1% em 2020,
totalizando US $ 2,8 bilhões.
Além disso, como
observa o Gartner, os preços das criptomoedas despencaram nos últimos meses. No entanto, conforme a declaração continua, é importante não confundir o valor do blockchain com o preço mais recente de várias moedas. A volatilidade (e golpes e
falhas, poderíamos acrescentar) é esperada à medida que os mercados de criptografia se resolvem. Enquanto isso, a inovação do blockchain está avançando constantemente. Vamos ver o que está acontecendo nessa frente.
No Hype Cycle for Blockchain da Gartner, a interoperabilidade está ganhando força.
Bitcoin, a criptomoeda baseada em blockchain mais difundida, viu uma atualização com o codinome
Taproot. Taproot é visto como um capacitador para os desenvolvedores integrarem novos recursos que irão melhorar a privacidade, escalabilidade e segurança.
Ethereum, a segunda criptomoeda baseada em blockchain da ordem, continuou seu longo e tortuoso caminho para romper com a
prova de trabalho e fazer a transição para
prova de aposta. Depois de lançar a chamada
cadeia Beacon após anos de pesquisa e desenvolvimento em dezembro de 2020, em 5 de agosto de 2021,
a atualização "London" da Ethereum foi lançada com sucesso na mainnet como a última bifurcação antes da transição para Proof-of-Stake/ETH 2.0.
Talvez mais importante, no entanto, vimos a noção de vários blockchains decolar em várias alternativas Ethereum. Em março de 2021, cobrimos
o grande retorno da IOTA. Em outubro de 2021, a
IOTA lançou contratos inteligentes - a base para DeFi - ao mesmo tempo em que oferece suporte à interoperabilidade Ethereum e várias redes blockchain.
Polkadot, a prova do blockchain da estaca Gavin Wood, cofundador da Ethereum, começou a construir para corrigir falhas no Ethereum, lançou
parachains em 2021.
Polkadot utiliza uma rede de blockchain paralela chamada parachains que pode executar seus próprios ativos e ecossistemas, mantendo a interoperabilidade intercadeia. Essa também é a maneira de Polkadot de
apoiar contratos inteligentes.
Assim como seu co-fundador Gavin Wood,
Charles Hoskinson passou a fazer suas próprias coisas após desenvolver Ethereum.
Cardano é outro blockchain de prova de aposta, que em algum momento foi a
"terceira moeda" na criptografia. Cardano recentemente
adicionou recursos de contrato inteligente também.
Por último, mas não menos importante, o serviço de oráculo de blockchain,
Chainlink, também
mudou para um território de contrato inteligente, após a introdução
de relatórios fora da cadeia, uma nova estrutura de computação segura de propósito geral.
Open source is here to stay, the cloud is catalyzing its growth, and the blockchain ecosystem is growing and diversifying.
www.zdnet.com
Review de tendências de tecnologia de 2022, parte dois: IA e gráficos
IA e gráficos têm algumas coisas em comum: são multifacetados, onipresentes em seus aplicativos e apresentam um rápido crescimento na década de 2020.
A IA tem muitas manifestações, desde hardware a aplicativos em domínios como saúde e de modelos futuristas a ética
No espírito dos últimos dois anos, revisamos os desenvolvimentos que identificamos como os principais impulsionadores de tecnologia para a década de 2020 no mundo dos bancos de dados, gerenciamento de dados e
IA . Estamos olhando para 2021, tentando identificar padrões que darão forma a 2022.
As muitas faces da IA: Hardware, borda, MLOps, modelos de linguagem, arquiteturas futuras e ética
Em princípio, tentamos abordar a IA de forma holística. Para levar em conta pontos positivos e negativos, do brilhante ao mundano, e do hardware ao software. O hardware tem sido uma história contínua dentro da história mais ampla da IA nos últimos anos, e sentimos que é um bom lugar para começar nossa turnê.
Nos últimos anos, temos estado de olho na lista crescente de fornecedores de "chips de IA", ou seja, empresas que se propuseram a desenvolver novas arquiteturas de hardware do zero, voltadas especificamente para cargas de trabalho de IA. Todos eles procuram obter um pedaço de uma torta que parece sempre crescente: à medida que a IA continua se expandindo, essas cargas de trabalho continuam crescendo, e atendê-las o mais rápido e economicamente possível é uma meta óbvia.
A Nvidia continua a dominar este mercado.
A Nvidia já estava no mercado muito antes das cargas de trabalho de IA começarem a crescer e tinha a perspicácia e os reflexos para capitalizar sobre isso construindo um ecossistema de hardware e software. Seu movimento para 2020 para tornar a ARM uma parte deste ecossistema está sob escrutínio regulatório. No entanto, a Nvidia não permaneceu ociosa em 2021.
De uma série de
anúncios feitos no evento GTC da Nvidia em novembro de 2021, aqueles que trazem algo novo no nível do hardware têm a ver com o que poderíamos argumentar que caracteriza o foco da IA em 2021 em geral: inferência e o limite. A Nvidia introduziu uma série de melhorias para o
Triton Inference Server. Ela também introduziu a
GPU Nvidia A2 Tensor Core, um acelerador de baixo consumo de energia e pequeno espaço para inferência de IA que a Nvidia afirma oferecer até 20X mais desempenho de inferência do que CPUs.
E quanto aos novatos? SambaNova afirma ser agora "a startup de IA mais bem financiada do mundo", depois de um colossal
$ 676 milhões em financiamento da Série D , ultrapassando $ 5 bilhões em avaliação. A filosofia da SambaNova é oferecer "IA como serviço",
agora incluindo modelos de linguagem GPT, e parece que 2021 foi, de modo geral, um ano de entrada no mercado para eles.
A Xilinx, por sua vez,
afirma atingir uma aceleração dramática das redes neurais em comparação com as GPUs Nvidia. A Cerebras
afirma 'dominar absolutamente' a computação de ponta e também
obteve alguns fundos substanciais. A Graphcore está
competindo com a Nvidia (e o Google) nos resultados do MLPerf. Tenstorrent
contratou o lendário designer de chips Keller. Blaize
arrecadou US $ 71 milhões para trazer IA de ponta para aplicações industriais. A Flex Logix arrecadou
US $ 55 milhões em apoio a empreendimentos, elevando sua aquisição total para US $ 82 milhões. Por último, mas não menos importante, temos
um novo cavalo na corrida em NeuReality,
maneiras de misturar e combinar a implantação em ONNX e TVM, e o
promessa de usar IA para projetar chips de IA. Se isso não é inovação em expansão, não sabemos o que é.
De acordo com o
relatório State of the Edge da Linux Foundation, as empresas digitais de saúde, manufatura e varejo provavelmente expandirão seu uso de computação de ponta até 2028. Não é de se admirar que hardware, estruturas e aplicativos de IA voltados para a ponta também estejam proliferando.
TinyML, a arte e a ciência de produzir modelos de aprendizado de máquina frugais o suficiente para trabalhar no limite, está vendo um rápido crescimento e
construindo um ecossistema. A Edge Impulse, uma
startup que quer levar o aprendizado de máquina de ponta para todos, acaba de anunciar seu financiamento da Série B de US $ 34 milhões.
Aplicativos de ponta estão chegando, e a
IA e seu hardware serão uma grande parte disso.
Algo que
chamamos em 2020, teve destaque em 2021e estará conosco nos próximos anos é o chamado MLOps - trazendo o aprendizado de máquina para a produção. Em 2021, as pessoas tentaram
dar nomes a vários fenômenos pertencentes a MLOps,
dividir e dividir o domínio MLOps,
aplicar controle de versão de dados e aprendizado de máquina contínuo, bem como
o equivalente ao desenvolvimento orientado a testes para dados, entre outras coisas. A ênfase está mudando de modelos
totalmente novos para talvez mais mundanos, mas aspectos práticos como qualidade de dados e gerenciamento de pipeline de dados e
MLOps continuarão a crescer.
Outra coisa que provavelmente continuará a crescer, tanto em termos de tamanho quanto em número, são os modelos de linguagem grandes (LLMs). Algumas
pessoas pensam que os LLMs podem internalizar formas básicas de linguagem, seja biologia, química ou linguagem humana, e estamos prestes a ver o crescimento de aplicações incomuns de LLMs. Outros,
nem tanto. De qualquer forma, os LLMs estão proliferando.
Além dos "suspeitos usuais" - OpenAI com seu GPT3,
DeepMind com seu mais recente RETRO LLM, Google com sua
matriz cada vez maior de LLMs - a
Nvidia agora se uniu à Microsoft no Megatron LLM. Mas isso não é tudo.
Recentemente, EleutherAI, um coletivo de pesquisadores independentes de IA, abriu o código-fonte de seu modelo GPT-j de 6 bilhões de parâmetros. Além disso, se você estiver interessado em outros idiomas além do inglês, agora temos um grande modelo de idioma europeu fluente em inglês, alemão, francês, espanhol e italiano por Aleph Alpha. Wudao é um LLM chinês que também é o maior LLM com 1,75 trilhão de parâmetros, e HyperCLOVA é um LLM coreano com 204 bilhões de parâmetros. Além disso, sempre há outros LLMs de código aberto um pouco mais antigos/menores, como
GPT2 ou BERT e suas muitas variações.
Além de LLMs, DeepMind e Google sugeriram arquiteturas revolucionárias para modelos de IA, com
Perceiver e
Pathways, respectivamente. Os caminhos foram criticados por serem bastante vagos. No entanto, arriscaríamos especular que poderia ser baseado no Perceiver. Mas, uma vez que estamos em um território de tecnologia do futuro, seria uma omissão não mencionar o
Raciocínio Algorítmico Neural da DeepMind, uma direção de pesquisa que promete casar algoritmos clássicos da ciência da computação com aprendizado profundo.
Nenhum tour pela IA, por mais condensado que seja, estaria completo sem uma menção honorária à
ética da IA. A ética da IA permaneceu em alta em 2021, e vimos pessoas desde
comissários da
FTC a
profissionais da indústria, cada um tentando abordar a ética da IA à sua própria maneira. E não vamos nos esquecer do
boom contínuo
de aplicações de IA na área da
saúde, uma área em que a
ética deve ser uma prioridade com ou sem IA.
Gráficos de conhecimento, bancos de dados gráficos e IA gráfico
Há muito tempo somos proponentes ávidos de
gráficos de todas as formas e tamanhos - gráficos de conhecimento, bancos de dados gráficos, análise de gráficos, ciência de dados e IA. Portanto, é com sentimento confuso que relatamos desta frente. Por um lado, não vimos muitas inovações, exceto talvez em uma área -
redes neurais de gráficos. O
Raciocínio Algorítmico Neural da DeepMind também alavanca GNNs.
Por outro lado, isso não é necessariamente uma coisa ruim, por dois motivos. Primeiro, há uma grande aceitação da tecnologia no mainstream. Em 2025, as tecnologias de gráficos serão usadas em 80% das inovações de dados e análises, contra 10% em 2021, facilitando a tomada de decisão rápida,
prevê o Gartner. Relatar sobre
casos de uso de empresas como BMW, IKEA, Siemens Energy, Wells Fargo e UBS não é mais novidade, e isso é uma coisa boa. Sim, existem desafios associados à construção e manutenção de gráficos de conhecimento, mas esses desafios são, em sua maioria, bem compreendidos.
Como observamos, os
gráficos do conhecimento são praticamente uma tecnologia com
20 anos de idade, cujo tempo de destaque parece ter chegado. As formas de construir gráficos de conhecimento são conhecidas, bem como os desafios que aí se encontram. Não é por acaso que algumas das habilidades e áreas de desenvolvimento mais exigidas em gráficos de conhecimento usam o Processamento de Linguagem Natural e interfaces visuais para construir e manter gráficos de conhecimento, bem como maneiras de expandir de cenários de usuário único para multiusuário.
E para vincular essa conversa ao quadro mais amplo da IA a que pertence, os desafios comuns parecem estar em torno da operacionalização e da construção da especialização certa em equipes, já que essas habilidades têm uma demanda muito alta. Outro ponto de contato importante é a direção de IA híbrida, que trata de infundir conhecimento no aprendizado de máquina. Líderes como Gadi Singer da Intel, Mike Dillinger do LinkedIn e Frank van Harmelen do Hybrid Intelligence Centre
apontam para a importância da organização do conhecimento na forma de gráficos de conhecimento para o futuro da IA .
Gráficos de conhecimento, bancos de dados gráficos e Graph AI são convergentes
Há também outro ponto de contato importante entre o quadro mais amplo em IA e os gráficos de conhecimento: malhas de dados e fabrics de dados. Você seria desculpado por misturar esses 2 e a
abundância de termos relacionados a dados que circulam por aí hoje em dia. De forma simplista, vamos apenas dizer que uma
malha de dados se destina a servir como substrato técnico para a noção de
malha de dados de gerenciamento de dados descentralizado nas organizações. Na verdade, é uma combinação muito boa para a tecnologia de gráfico de conhecimento, e alguns fornecedores nesse espaço identificaram isso e se posicionaram de acordo. Até a
Informatica parece ter notado .
E quanto ao substrato para a construção de gráficos de conhecimento, ou seja, bancos de dados de gráficos? A palavra que parece caracterizar 2021 para bancos de dados de gráficos seria "ir ao mercado". Tem sido um bom ano para bancos de dados gráficos. Um banco de dados gráfico - Neo4j - ficou no
Top 20 em motores de banco de dados pela 1ª vez. A Neo4j também anunciou a
disponibilidade geral de seu serviço de nuvem gerenciado Aura e
levantou uma rodada de financiamento da Série F de $ 325 milhões, a maior na história do banco de dados, elevando sua avaliação para mais de $ 2 bilhões.
O espaço do banco de dados gráfico viu uma série de rodadas de financiamento e um IPO iminente. TigerGraph obteve
$ 105 milhões na Série C, Katana Graph
$ 28,5 milhões na Série A,
Memgraph $ 9,34 milhões de financiamento inicial e
TerminusDB € 3,6 milhões. Nesse ínterim, a Bitnine, fabricante do Agens Graph, começou a
trabalhar em seu IPO - o primeiro do mercado.
Na frente técnica, o
GraphQL ainda está crescendo em adoção, seja como
parte de um ecossistema mais amplo ou como o
componente central em uma arquitetura de dados. A ligação dos dois mundos de banco de dados de gráficos em termos de modelos, RDF e LPG, ainda é um trabalho em andamento, mas teve
alguns desenvolvimentos interessantes em 2021 .
Não esperamos que a lua-de-mel do mundo com gráficos e bancos de dados de gráficos dure para sempre e, depois do hype, a desilusão inevitavelmente virá em algum momento. Mas estamos confiantes de que
essa tecnologia é fundamental e encontrará seu lugar, apesar dos soluços.
AI and graphs have a few things in common: they are multi-faceted, ubiquitous in their applications, and seeing rapid growth in the 2020s.
www.zdnet.com