Getty Images/iStockphoto

A computação de borda pode tornar a IA mais sustentável?

As demandas energéticas da IA e o impacto ambiental associado são significativos. A computação de ponta pode aliviar parte da carga, mas não é uma solução universal e não se adapta a todas as cargas de trabalho.

Os enormes centros de dados e as necessidades energéticas das cargas de trabalho modernas de inteligência artificial (IA) têm um impacto significativo sobre o meio ambiente e a sustentabilidade. Além disso, muitas organizações assumiram compromissos de sustentabilidade que não se alinham com o uso da IA.

Um estudo da Goldman Sachs projeta que a demanda de energia dos centros de dados dos EUA mais do que dobrará, passando de 31 gigawatts em 2025 para 66 gigawatts até 2027, impulsionada pela expansão da infraestrutura de IA. Atualmente, as cargas de trabalho de IA representam 14% da demanda global dos centros de dados e devem atingir 27% até 2027. Esses números dificultam o cumprimento das metas de emissões de carbono ou a construção de uma infraestrutura de IA sustentável sem alterar o local onde as cargas de trabalho de inferência são executadas.

Para mitigar o problema do consumo de energia, as organizações poderiam recorrer à computação na borda, que aproxima a inferência de IA do local onde os dados são gerados, em vez de enviar tudo para instalações centralizadas na nuvem.

Compreendendo a vantagem da IA na borda em termos de sustentabilidade

A IA na borda oferece uma série de vantagens potenciais em termos de sustentabilidade, entre as quais se incluem as seguintes:

Redução do consumo de energia na transmissão de dados

O envio de dados brutos para um data center centralizado na nuvem consome energia a cada salto de rede. As arquiteturas na borda reduzem essa carga, pois processam localmente e enviam apenas eventos, exceções ou resumos para o servidor central, em vez de fluxos contínuos de dados não processados.

Em aplicações como o monitoramento industrial ou a videovigilância, onde os dispositivos geram continuamente grandes volumes de dados, a redução do consumo de energia também pode diminuir os custos de energia da rede e os requisitos de computação na nuvem.

Eficiência do processamento local

A infraestrutura de GPU na nuvem costuma ser otimizada para treinamento em grande escala. Aplicá-la a tarefas de inferência repetitivas e específicas implica operá-la a uma fração de sua capacidade projetada, sem deixar de arcar com o custo total das despesas gerais. Por outro lado, o hardware de borda é projetado para inferência de baixo consumo de energia.

“Se for implementado hardware com excesso de potência em cada local, os modelos forem executados continuamente, o equipamento for subutilizado e o ciclo de vida do hardware não for levado em consideração, o panorama energético se deteriora rapidamente”, afirmou James Sheridan, diretor executivo da Sheridan Technologies, empresa que projeta e fabrica sistemas integrados e produtos com inteligência artificial.

Menores custos de refrigeração e infraestrutura

A refrigeração é um dos maiores consumos de energia nos data centers de IA. De acordo com a análise de abril de 2026 da Agência Internacional de Energia, a refrigeração representa até 30% do consumo energético dos data centers.

As maiores densidades de GPUs geram mais calor por rack, o que obriga as instalações a contar com uma infraestrutura de refrigeração mais intensiva. Os dispositivos de borda não requerem nem sistemas de refrigeração ativa nem infraestrutura de refrigeração a água.

Quando faz sentido a IA na borda?

A IA na borda não é uma solução universal para todas as implementações de IA, mas faz sentido em situações específicas.

“Eu começaria pela carga de trabalho, não pela preferência de arquitetura”, observou Sheridan.

Onde a computação na borda funciona melhor

A borda oferece bom desempenho para aplicações que dependem da latência e precisam estar sempre disponíveis, em ambientes com conectividade limitada ou sensíveis aos dados, onde a transmissão para a nuvem gera riscos de conformidade regulatória. O controle de qualidade na manufatura, os sistemas autônomos e os diagnósticos no local de atendimento são exemplos comuns. Para inferência contínua de grande volume, os custos iniciais de hardware costumam ser compensados por um menor gasto contínuo com a nuvem, transmissão e energia.

No entanto, nem todas as organizações têm a opção de utilizar a nuvem.

“A pergunta não deveria ser: ‘A borda é melhor do que a nuvem?’. A pergunta deveria ser: ‘Em que ambiente esse sistema realmente precisa sobreviver?’, afirmou Tyler Saltsman, diretor executivo da EdgeRunner AI, que atua em implementações de infraestrutura de defesa e de missão crítica.

Apesar dessas vantagens, as implementações na borda também apresentam desvantagens. A IA na borda é executada em unidades de processamento neural (NPUs), chips projetados especificamente para essa finalidade que carecem de um padrão dominante no mercado, o que muitas vezes exige que os modelos sejam reprojetados para cada variante de chip.

“O ecossistema das NPUs está bastante fragmentado no momento; os modelos precisam ser ajustados manualmente para cada variante de chip, o que anula o argumento do retorno sobre o investimento para a maioria dos departamentos de TI que não contam com equipes especializadas em engenharia de ML [aprendizado de máquina]”, observou David Viney, diretor de TI da Alchemy Consulting e consultor de governança de IA que trabalha com diversas organizações empresariais.

Empresas como a Rentokil e a divisão ferroviária da General Electric conseguiram fazer isso funcionar, observou Viney. Ambas construíram uma infraestrutura de IoT anos antes de a adoção da IA se acelerar e contam com a experiência em engenharia necessária para gerenciar atualizações de modelos, aplicação de patches, monitoramento de desvios e substituição de hardware em grande escala.

Onde a nuvem funciona melhor

A nuvem funciona melhor para o treinamento de modelos em grande escala e cargas de trabalho gerais de IA que exigem capacidade computacional significativa. Aplicações com atualizações frequentes de modelos e situações que exigem uma agregação centralizada de dados continuam sendo mais adequadas para a infraestrutura em nuvem.

Há também um contra-argumento de sustentabilidade em relação à computação de borda que os líderes de TI deveriam considerar.

“Os provedores de IA na nuvem já estão lidando com o consumo de energia, o resfriamento, a utilização e a eficiência da infraestrutura em grande escala”, observou Sheridan. “Se a infraestrutura deles estiver muito mais otimizada do que a sua própria, transferir a carga de trabalho para o ambiente local não melhora automaticamente o retorno sobre o investimento nem a sustentabilidade”.

A computação de ponta ocorre mais próxima do dispositivo do que a computação em nuvem.

Métricas de sustentabilidade para a IA na borda

Os líderes de TI que desenvolvem ou avaliam programas de IA na borda devem acompanhar as seguintes métricas como parte de qualquer estratégia de IA ecológica:

  • Eficiência no uso de energia. O PUE é a relação entre o consumo total de energia das instalações e o uso de energia dos equipamentos de TI. É útil para comparar o desempenho da infraestrutura centralizada, mas tem aplicabilidade direta limitada às implantações na borda, onde não há despesas gerais das instalações a serem medidas. A comparação relevante para a borda é a energia consumida por tarefa de inferência, não a eficiência no nível das instalações.
  • Consumo de energia por inferência. Essa é uma métrica mais eficaz para a borda do que o PUE. Ela mede os joules ou watts-hora por transação de IA, tanto em opções de borda quanto na nuvem, para a mesma carga de trabalho. Um local que execute inferência na borda em uma carga de trabalho que antes era gerenciada na nuvem pode oferecer uma comparação direta entre o antes e o depois.
  • Pegada de carbono por carga de trabalho de IA. Emissões totais de gases de efeito estufa atribuíveis a um fluxo de trabalho de IA definido, incluindo a fonte de eletricidade, a eficiência do hardware e a energia de transmissão da rede.
  • Custo total de propriedade, incluindo energia. Isso inclui a aquisição de hardware, despesas operacionais, custos de energia e gerenciamento de modelos ao longo de todo o ciclo de vida da implantação.
  • Conformidade regulatória e relatórios ESG, incluindo as emissões de Escopo 1, 2 e 3. O Escopo 1 abrange as emissões diretas de fontes próprias ou controladas. O Escopo 2 abrange a eletricidade adquirida. O Escopo 3 abrange as emissões da cadeia de suprimentos, incluindo a infraestrutura dos provedores de nuvem, a fabricação de hardware e os ciclos de substituição de dispositivos. Nos EUA, a norma de divulgação climática da Comissão de Valores Mobiliários (SEC) exige que as empresas de capital aberto informem sobre as emissões de Escopo 1 e 2. Na UE, a Diretiva sobre Relatórios de Sustentabilidade Corporativa (CSRD) e a Lei de IA estabelecem requisitos adicionais de relatório energético para os sistemas de IA.

O futuro da computação na borda, da IA e da sustentabilidade

Dois avanços estão transformando a infraestrutura de IA na borda.

O primeiro são os modelos de linguagem pequenos (SLM). Os SLM são modelos compactos de IA específicos para tarefas, projetados para serem executados em hardware de baixo consumo de energia e, como tal, são muito adequados para casos de uso de IA na borda.

A segunda tendência importante é a IA agentiva, que está gerando uma nova demanda por computação e inferência locais persistentes.

O modelo mais lógico é aquele que delega o trabalho rotineiro ao hardware local e reserva a capacidade da nuvem para as tarefas que realmente precisam dela, observou Sheridan. Os SLMs evoluíram o suficiente para que essa divisão seja viável.

“Mais sistemas utilizarão um padrão híbrido: modelos locais pequenos para tarefas rápidas, privadas, repetitivas ou acionadas por eventos, e modelos maiores na nuvem apenas quando for necessário um raciocínio mais profundo ou um contexto mais amplo”, observou Sheridan.

A IA agentica é onde o argumento da eficiência se torna mais complexo. Os agentes que são executados continuamente e invocam modelos a cada ciclo podem consumir tanta capacidade de computação no hardware local quanto consumiriam na nuvem.

“O benefício da sustentabilidade depende da disciplina: utilizar modelos menores, executá-los apenas quando necessário, armazenar os resultados em cache, escalar de forma seletiva e medir a carga de trabalho real”, observou Sheridan.

A mudança para a IA agentica direcionará o investimento em infraestrutura para ambientes de colocalização distribuídos, mais próximos dos sistemas empresariais existentes, em vez de ampliar a capacidade para hiperescala, afirmou Viney. Em sua opinião, esse modelo é intrinsecamente mais eficiente do que direcionar tudo para uma grande instalação centralizada.

Os requisitos de conformidade estão transformando o monitoramento do consumo de energia no nível da carga de trabalho em uma necessidade empresarial. A CSRD e a Lei de IA da UE exigem a divulgação de dados sobre energia e carbono para sistemas de IA. Nos EUA, as normas de divulgação climática da SEC exigem que as empresas de capital aberto informem sobre as emissões de Escopo 1 e 2.

Essas pressões podem alterar a pergunta que as organizações se fazem sobre a IA, observou Sheridan, passando de “Podemos usar a IA aqui?” para “Qual modelo, executado onde, a que custo, com qual perfil energético e qual valor comercial?”

Viney prevê que essa mesma mudança está por vir e é muito direto ao se referir à situação atual da maioria das organizações.

“As organizações que já estão monitorando as emissões de carbono por carga de trabalho terão uma vantagem inicial em termos de conformidade. A maioria não está fazendo isso”, observou Viney.

Sobre o autor: Sean Michael Kerner é consultor de TI, entusiasta da tecnologia e inventor. Ele já instalou redes Token Ring, configurou o NetWare e é conhecido por compilar seu próprio kernel do Linux. Ele assessora organizações do setor industrial e da mídia em questões tecnológicas.

Saiba mais sobre Aplicativos e serviços em nuvem