O software de Auto Scaling aloca ou desaloca dinamicamente recursos de computação com base na necessidade de uma aplicação. Este tipo de software pode aumentar automaticamente os recursos durante alto tráfego e reduzir quando há menos tráfego. Administradores de TI usam software de auto scaling para garantir a disponibilidade de sistemas em nuvem, adicionando mais recursos de computação quando necessário e otimizando custos ao descomissionar automaticamente instâncias quando a necessidade de capacidade diminui.
O auto scaling possui algumas características de software de monitoramento de infraestrutura em nuvem, pois monitora continuamente os sistemas para verificar o uso de recursos. No entanto, o software de auto scaling, além de monitorar, também pode aumentar ou diminuir a alocação de capacidade. Ele também possui características que se sobrepõem ao software de balanceamento de carga, uma ferramenta que distribui tráfego para instâncias de servidor saudáveis para garantir disponibilidade contínua. O balanceamento de carga e o software de auto scaling trabalhando em conjunto proporcionam uma gestão eficiente de recursos. O software de auto scaling fornece novas instâncias para as quais o software de balanceamento de carga pode fornecer conexões.
Para se qualificar para inclusão na categoria de Auto Scaling, um produto deve:
Monitorar continuamente o ambiente de nuvem para identificar necessidades de capacidade e liberar recursos
Alocar e desalocar novas instâncias se uma aplicação requerer mais ou menos recursos
Antecipar flutuações de demanda com base em padrões regulares de consumo de recursos
Fornecer visibilidade do consumo de recursos em todo o sistema através de um único painel ou portal