GPU
GPU具有高并行结构,在处理图形数据和复杂算法方面拥有比CPU更高的效率;采用流式并行计算,可以对每个数据进行独立的计算,流内任何元素的计算不依赖于其他同类型的数据(也不一定,进行通用编程时通常需要一些同步)
GPU主要由显存(Device Memory)和流多处理器(SMs,Stream Multiprocessors)组成
cuda
在cuda的视角下,多个线程(thread)构成一个block,多个block构成一个grid。block内部提供了共享存储,blcok内部的通信会比block之间的通信快很多。block总在一个SM上执行,
openGL
着色器程序在GPU上执行,openGL主程序在CPU上执行,主程序向显存输入顶点数据,启动渲染过程并进行控制