系统性能优化
系统扩展性(Scale Out)
Numa Aware Qspinlock
对现有的qspinlock做增强,将锁的等待队列分成两个,本地NUMA节点等待队列和远程NUMA节点等待队列,本地NUMA节点等待队列的线程有限获取锁,减少跨NUMA节点的Cache/总线冲突,从而提升性能
MMU gather
减少TLB flush,从而提升性能
关键驱动如中断控制器 ITS 和 SMMU 的内存分配 NUMA Aware
IO 性能优化
- 通过优化 IOVA 页表查找和页表释放算法,提升 IO MMU 子系统性能
- 减少关键结构体的 cache false sharing,从而提升性能
指令加速
CRC32 和 checksum 加速
根据 ARM64 指令以及流水线特点,优化 CRC32 及 checksum 实现,大幅提升数据校验性能。