在某些场景下,需要把程序绑定到指定cpu核心提高执行效率。通过微软官方文档查询到windows提供了两个win32函数:setthreadaffinitymask和setprocessaffinitymask 为指定线程和进程设置处理器关联掩码。通俗的讲就是在指定的cpu核心上执行线程或者进程。
这里的cpu核心指的是逻辑核心,而非物理核心。
setthreadaffinitymask
setthreadaffinitymask用于设置指定线程的处理器关联掩码,从而实现线程对处理器的绑定。
setthreadaffinitymask函数定义
setthreadaffinitymask的定义如下:
dword_ptr setthreadaffinitymask( [in] handle hthread, [in] dword_ptr dwthreadaffinitymask );
从函数的定义看需要传递两个参数:
- hthread:指向要设置处理器关联的线程句柄。如果是想设置当前线程的关联掩码,可以使用 getcurrentthread() 函数获取句柄。
- dwthreadaffinitymask:处理器的关联掩码。是一个dword_ptr类型的值,长度共8个字节(64bit),每一bit代表一个cpu核。
如果需要支持超过64核的cpu时,则需要使用setthreadgroupaffinity函数
为了更清晰的表达dwthreadaffinitymask
的含义,下边用二进制数表示该值。比如,需要把线程绑定到
第0个核:则dwthreadaffinitymask=0b_0001;(0x01)
第1个核:则dwthreadaffinitymask=0b_0010;(0x02)
第2个核:则dwthreadaffinitymask=0b_0100;(0x04)
第3个核:则dwthreadaffinitymask=0b_1000;(0x08)
……
如果要绑定到多个cpu核心,比如绑定到第1和2个cpu核时,dwthreadaffinitymask=0b_0110,对应的十六进制数也就是0x06。
调用示例
首先引入win32api
[dllimport("kernel32.dll")] static extern uintptr setthreadaffinitymask(intptr hthread, uintptr dwthreadaffinitymask); [dllimport("kernel32.dll")] static extern intptr getcurrentthread();
由于dwthreadaffinitymask的值是按照2n的指数递增,与通常习惯指定第n个核心不符,并且不同的设备cpu核心数不一样,指定cpu核心时可能超出cpu核心数量,因此可以对指定cpu核心做个简单的处理:
static ulong setcpuid(int lpidx) { ulong cpulogicalprocessorid = 0; if (lpidx < 0 || lpidx >= system.environment.processorcount) { lpidx = 0; } //通过移位运算转换lgidx->dwthreadaffinitymask:0->1,1->2,2->4,3->8,…… cpulogicalprocessorid |= 1ul << lpidx; return cpulogicalprocessorid; }
接下来就可以进行测试了
ulong lpid = setcpuid((int)lpidx); setthreadaffinitymask(getcurrentthread(), new uintptr(lpid)); stopwatch stopwatch = new stopwatch(); stopwatch.start(); for (int i = 0; i < 1000000; i++) { for (int j = 0; j < 1000000; j++) { int _data = j; } } stopwatch.stop(); console.writeline("运行时间: " + stopwatch.elapsedmilliseconds.tostring());
效果如图如下:
setprocessaffinitymask
setprocessaffinitymask与setthreadaffinitymask非常相似,不同的是其作用于整个进程,可以决定进程内的所有线程共同运行在指定的处理器上。
函数定义如下:
bool setprocessaffinitymask( [in] handle hprocess, [in] dword_ptr dwprocessaffinitymask );
和setthreadaffinitymask一样,也是需要传递两个参数,只不过第一个参数传递的是进程的句柄。
小结
在某些场景可以通过setthreadaffinitymask和setprocessaffinitymask 提高程序执行效率,主要是基于以下几个原因:
- 提高性能:通过将线程绑定到特定的处理器,可以减少线程在不同处理器之间的切换开销,尤其是在多核系统中,有助于提升程序的执行效率。
- 避免缓存抖动:确保线程始终在同一个处理器上运行,可以减少缓存未命中,因为相关的数据更可能保留在该处理器的高速缓存中。
- 实时系统和并发控制:在需要严格控制线程执行位置的场景下,比如实时系统或者某些并发控制策略中,通过设定处理器关联可以满足特定的调度需求。
需要注意的是,setthreadaffinitymask和setprocessaffinitymask并不是独占cpu核心,如果关联的cpu核心本身负载就很高,这个时候程序执行效率反而会降低。
发表评论