Professor na EXAME + Saint Paul
Publicado em 31 de janeiro de 2025 às 05h00.
Nos últimos dias, o mundo da tecnologia foi sacudido pela DeepSeek e seu modelo R1, uma startup chinesa que apresenta resultados similares aos líderes de mercado, mas com muito menos custo de treinamento e consumo de recursos muito menores.
Com custos até 95% menores, necessidade de até 98% menos GPUs para treinamento e código em open source, a reação do mercado foi imediata, resultando em uma desvalorização de quase um trilhão de dólares em um dia para toda a cadeia de valor, afetando desde fabricantes de GPUs até fornecedores de máquinas especializadas para suas linhas de montagem.
Só a NVIDIA, principal fabricante de GPUs do mundo, perdeu cerca de US$ 600 bilhões em valor de mercado no dia 27/01, sendo essa a maior queda da história já registrada em um único dia por uma empresa.
A eficiência energética da inteligência artificial tem sido um dos principais desafios de sustentabilidade para a indústria de tecnologia. Modelos cada vez mais robustos demandam uma infraestrutura computacional intensiva, tendo uma pegada de carbono e consumo hídrico significativos.
Isso pressiona cada vez mais as Big Techs, que parecem sofrer para viabilizar o crescimento ao mesmo tempo que cumprem com as promessas de redução de emissões e consumo de água em datacenters.
No entanto, o novo modelo apresentado pela DeepSeek pode redefinir esse paradigma com sua proposta que, além de desafiar o modelo tradicional de IA baseado no grande poder computacional, aponta para um futuro mais sustentável e acessível.
O modelo da DeepSeek demonstrou superioridade em vários pontos, rivalizando com o ChatGPT em desempenho enquanto reduz o consumo de energia.
Comparado ao GPT-4, por exemplo, os primeiros testes indicam que a DeepSeek pode operar com eficiência energética significativamente maior, utilizando menos recursos computacionais para realizar inferências complexas. Isso significa menor emissão de CO₂ e um custo operacional reduzido.
Vale ressaltar que, quando se trata do uso responsável da tecnologia, muito depende de quem "pilota a máquina". Várias decisões para redução dos impactos estão nas mãos dos desenvolvedores. O local e o horário de treinamento dos modelos, por exemplo, podem impactar significativamente as emissões associadas ao processo. A Green Software Foundation (GSF), que é uma coalizão de diversas empresas de tecnologia, tem buscado estabelecer melhores práticas de desenvolvimento para tornar o uso da tecnologia mais sustentável.
Modelos como o da DeepSeek, combinados com técnicas exploradas pela GSF como Temporal Shifting (executando processos intensivos em horários de menor demanda elétrica, como a madrugada) e Spatial Shifting (realocando cargas para regiões com maior disponibilidade de energia renovável, como o Brasil), reduzem ainda mais os impactos ambientais dos treinamentos e uso da IA.
Outras estratégias recomendadas incluem a quantização, que reduz a precisão numérica dos modelos para diminuir a carga computacional sem comprometer significativamente a precisão dos resultados, e o pruning, que elimina conexões neurais redundantes, tornando os modelos mais leves e eficientes.
Além disso, o reuso de infraestrutura já existente, o treinamento distribuído em múltiplas regiões e o processamento na borda (edge computing) podem contribuir ainda mais para diminuir as emissões associadas.
Um grande impacto potencial da DeepSeek está na possibilidade de descentralizar a execução de modelos de IA. Hoje, a maioria das inferências ocorre em data centers, exigindo altas cargas de processamento e transmissão de dados constantes, resultando em um alto consumo de energia tanto nos servidores quanto nas redes de comunicação.
Um estudo conduzido por pesquisadores da Qualcomm mostrou que a inferência na borda pode reduzir o consumo de energia em até 90% em comparação à execução em nuvem.
Além disso, dispositivos capazes de processar IA localmente aumentam a segurança dos dados e melhoram a privacidade, uma preocupação crescente para empresas e consumidores.
Com a redução da capacidade de processamento necessária, tudo indica que nos próximos anos equipamentos como notebooks e smartphones serão capazes de rodar os modelos localmente, resultando em uma significativa redução dos impactos atuais. Alguns suários do DeepSeek, por exemplo, já conseguiram fazer isso com modelos menos complexos.
Além disso, essa mudança pode reduzir a demanda da indústria de hardware, que atualmente precisa fabricar servidores cada vez mais potentes para apoiar o crescimento da IA.
Estudos sobre a pegada ambiental da era digital indicam que a produção de hardware é um fator relevante nas emissões de CO₂, devido à extração de minerais, manufatura e descarte de equipamentos. Concentrar mais funções na borda pode diminuir essa pressão sobre a produção de novos dispositivos, trazendo benefícios adicionais para a sustentabilidade.
A redução da pegada ambiental da IA é um objetivo estratégico para empresas que buscam desacoplar ao máximo seu desempenho financeiro de impactos negativos.
Soluções como a apresentada pela DeepSeek podem ser um divisor de águas para empresas que buscam incluir princípios sustentáveis no design de suas soluções, uma prática cada vez mais necessária para negócios que buscam maior resiliência no longo prazo. Quando a inferência local de modelos mais complexos em dispositivos móveis for realidade, teremos um salto ainda maior na eficiência computacional que impactará toda a cadeia tecnológica.
Com menos necessidade de data centers superdimensionados, a infraestrutura global de TI poderia reduzir sua demanda elétrica e por recursos em toda a cadeia de valor, contribuindo diretamente para a transição para uma economia de baixo carbono.
O desafio agora é transformar essa visão em realidade.Para isso, será fundamental o investimento contínuo em pesquisa e desenvolvimento (o que não parece um desafio para essa indústria), além da adoção ampla por empresas e governos de práticas sustentáveis no design das soluções. A colaboração entre indústrias e a padronização de práticas de eficiência energética também serão decisivas para garantir que a inteligência artificial evolua de forma sustentável e não apenas revolucione setores inteiros, mas também contribua para um futuro mais equilibrado e resiliente.
A EXAME, maior plataforma de negócios do Brasil, se une à Saint Paul, uma das melhores escolas de negócios do mundo, para apresentar o Pré-MBA em Inteligência Artificial para Negócios, um treinamento virtual e com certificado que revela o caminho para conquistar uma carreira nesse setor que só cresce.
Durante o treinamento, os alunos irão conhecer as ferramentas de IA mais importantes do mercado, vão descobrir os bastidores de casos de sucesso e poderão traçar um plano de carreira para conquistar o tão sonhado sucesso profissional.
Todo esse conteúdo, que soma três horas de duração, está distribuído em quatro aulas 100% online (sendo a última delas ao vivo), que misturam fundamentos teóricos e práticos. O investimento é de R$ 37,00.