8.4 本章总结

来源:xiaoweiChen 浏览 971 扫码分享 2021-05-12 20:27:58

8.4 本章总结

8.4 本章总结

本章旨在表示OpenCL在具体架构上的映射关系。本章中，我们简单的比较了一下CPU和GPU架构的不同，不同的矢量宽度带来的巨大的性能差异(NVIDIA的GPU矢量宽度为32位，AMD的GPU矢量宽度是64位，CPU则小的多)，还有不同的线程管理和指令调度。本书中我们不能覆盖所有市面上的架构，不过本章中我们给出了一些例子。所以，编程者在以某个OpenCL设备作为目标设备时，就需要仔细研究对应平台架构的相关文档，这样才能在对应平台上获得最优的性能。

当前内容版权归 xiaoweiChen 或其关联方所有，如需对内容或内容相关联开源项目进行关注与资助，请访问 xiaoweiChen .

本文档使用 BookStack 构建