8.4 本章总结
本章旨在表示OpenCL在具体架构上的映射关系。本章中,我们简单的比较了一下CPU和GPU架构的不同,不同的矢量宽度带来的巨大的性能差异(NVIDIA的GPU矢量宽度为32位,AMD的GPU矢量宽度是64位,CPU则小的多),还有不同的线程管理和指令调度。本书中我们不能覆盖所有市面上的架构,不过本章中我们给出了一些例子。所以,编程者在以某个OpenCL设备作为目标设备时,就需要仔细研究对应平台架构的相关文档,这样才能在对应平台上获得最优的性能。
当前内容版权归 xiaoweiChen 或其关联方所有,如需对内容或内容相关联开源项目进行关注与资助,请访问 xiaoweiChen .