Kepler GPUのSIMD命令

KKeplerアーキテクチャ(Compute Capability 3.0)以降のNVIDIA GPUには、SIMD命令が新設されています。

ここでいうSIMDとは、(GPUの典型的な構造である)SMX内で各CUDA Coreが1つのデータに対し1つの処理を行う(広い意味での)SIMDではなく、1つのCUDA Coreが本当に複数のデータを一度に処理するSIMDです。x86におけるSSEのようなものですが、KeplerのSIMDはレジスタ長が32bitです。

続きを読む