Renderização CUDA em CPUs
O código da GPU pode ser difícil de depurar. Quando o código trava, como inevitavelmente, ele pode retornar apenas um dump do kernel, sem informações sobre qual parte do código realmente causou a falha. Para descobrir a causa, um desenvolvedor comentará cada seção do código até que o culpado seja encontrado. Esse processo pode ser tedioso e demorado.
Para tornar a depuração de GPU mais fácil, nosso principal desenvolvedor de GPU, Blago Taskov, teve a idéia de portar o código CUDA para a CPU, onde ele poderia usar ferramentas de depuração melhores. Depois que ele funcionou, Blago conseguiu identificar exatamente qual linha de código causou a falha. Mas isso também levou a uma descoberta maior. Agora que o V-Ray CUDA estava sendo renderizado em CPUs e GPUs e produzindo exatamente os mesmos resultados, a renderização híbrida no V-Ray nasceu oficialmente.
Benchmarks híbridos no V-Ray
Para descobrir o aumento de velocidade obtido adicionando CPUs ao mix de GPUs, comparamos duas cenas V-Ray CUDA de nossos amigos no Dabarti Studio.
Para essas cenas, a adição de CPUs ajudou a reduzir os tempos de renderização em 13% e 25%. É um aumento de velocidade bem-vindo, em vez de deixar essas CPUs poderosas ociosas.

HARDWARE
 CPUs: 2 x Intel Xeon CPU E5-2687W v3 3.10 GHz, total of 40 logical CPU cores
 RAM: 128 GB
 GPUs: 2 x NVIDIA Quadro GP100 with 16GB each, total of 7,168 GPU cores

CENA ROVER EM MARTE
 Engine: V-Ray 3.6 CUDA
 Resolution: 1920×1080
 Noise threshold: 0.01
GPUs + CPUs
 Time: 4:27 (267s)
GPUs only
 Time: 5:03 (303s)
 13% longer than GPU + CPU
CPUs only
 Time: 26:25 (1585s)
 520% longer than GPUs alone

CENA SAL E PIMENTA
 Mecanismo: V-Ray 3.6 CUDA
 Resolução: 1920 × 1080
 Limiar de ruído: 0,01
GPUs + CPUs
 Horário: 9:11 (551s)
Somente GPUs
 Horário: 11:33 (693 s)
 25% a mais que GPU + CPU.
Apenas CPUs
 Horário: 40:52 (2452s)
 354% mais do que a GPU sozinha.
Vamos considerar alguns casos de uso da renderização híbrida no V-Ray
Maximize seu poder de computação
Se você tem uma estação de trabalho poderosa, digamos 40 núcleos de CPU e 4 GPUs, você pode aproveitar todo o seu poder de computação. Nada é deixado ocioso.
Use todos os seus nós de renderização
Muitos artistas e estúdios têm estações de trabalho GPU e CPU e nós de renderização da CPU. Com a renderização híbrida no V-Ray, eles podem renderizar usando todo o hardware que possuem.

Fallback do CPU
Caso sua cena não caiba em seus limites de RAM da GPU, você ainda pode renderizar na CPU.
Atualize para GPUs conforme for
Como as máquinas de CPU estão prontas para serem substituídas, o V-Ray Hybrid pode ajudar a facilitar a transição para mais renderizações de GPU, enquanto continua a aproveitar os recursos de CPU existentes. Além disso, se houver um slot PCIe vazio em uma estação de trabalho ou no nó de renderização, a adição de uma GPU pode proporcionar um aumento de velocidade radical sem substituir a máquina inteira.
Algumas coisas a notar
Processador V-Ray Hybrid e V-Ray Production
É importante observar que o renderizador V-Ray Hybrid (GPU – CPU CUDA) não é o mesmo que o renderizador de produção de V-Ray (CPU), e os dois mecanismos continuarão separados.
Núcleos de GPU versus núcleos de CPU
Enquanto o V-Ray Hybrid pode renderizar em CPUs e GPUs simultaneamente, núcleos de CPU e núcleos de GPU não são os mesmos. Por exemplo, uma GPU com 2560 núcleos não é simplesmente 320 vezes mais rápida que uma CPU de 8 núcleos. Para determinar a diferença real de velocidade, são necessários testes de benchmark do mundo real.
 



