logo

GPU de várias instâncias (MIG)

Acessórios

ARMAZENAMENTO

08/07/2025

Acessórios

ARMAZENAMENTO

5,0

O que é GPU de várias instâncias

A GPU Multi-Instância (MIG) é uma tecnologia da NVIDIA introduzida pela primeira vez com a arquitetura Ampere e disponível nas gerações subsequentes de GPUs (incluindo Hopper e Blackwell). Ela permite que uma única GPU física seja particionada em até sete instâncias de GPU virtuais totalmente isoladas e independentes, cada uma com sua própria memória dedicada, núcleos de unidade de processamento e memória cache. Isso otimiza os custos e oferece qualidade e serviço previsível para diferentes usuários e tarefas em ambientes de computação dimensionáveis.

Principais recursos e benefícios do MIG:

  • Isolamento de recursos: Cada instância tem seus próprios recursos dedicados - núcleos de computação e memória de GPU. Isso proporciona desempenho previsível e proteção contra a influência de instâncias vizinhas, o que é especialmente importante para ambientes multilocatários, como nuvens.
  • Otimize a utilização da GPU: As cargas de trabalho que não usam todo o potencial de uma única GPU podem ser executadas em paralelo em instâncias diferentes, melhorando a utilização geral da GPU e reduzindo a latência para os usuários. Por exemplo, você pode criar instâncias com diferentes quantidades de memória alocada, variando de 10 GB ou mais, para diferentes cargas de trabalho.
  • Suporte à virtualização e à conteinerização: O MIG é compatível com Linux, Docker, Kubernetes e também é compatível com hipervisores (Red Hat Virtualization, VMware vSphere) para uso em máquinas virtuais e contêineres. Ele pode ser usado em configurações bare-metal, GPU pass-through e vGPU.
  • Garantia de qualidade de serviço (QoS): Cada instância tem largura de banda de memória e recursos de computação dedicados, o que ajuda a garantir tempos de resposta previsíveis para determinados aplicativos e evita que cargas pesadas afetem o desempenho de outros.
  • Limitações: O MIG não oferece suporte à comunicação entre processos (IPC) CUDA, o que limita o desempenho ideal em várias instâncias do mesmo aplicativo.
  • Não há suporte para o uso de APIs gráficas (OpenGL, Vulkan etc.), e as tarefas que exigem um número muito alto de núcleos de CPU podem exigir uma GPU completa sem particionamento.
  • Gerenciamento: As instâncias de MIG são gerenciadas por meio da NVIDIA Management Library (NVML) e da linha de comando (nvidia-smi). A ativação da MIG requer a reinicialização da GPU, e várias GPUs exigem a interrupção dos serviços de gerenciamento da GPU antes da ativação.

Exemplos de uso:

  • Execução de várias tarefas de inferência de IA simultaneamente em uma única GPU.
  • Suporte para sistemas de vários locatários e vários contêineres em data centers.
  • Implantação eficiente de tarefas de IA e HPC de pequeno e médio porte sem a necessidade de dedicar toda a GPU.

Avalie este artigo