计算电磁学中的超大规模并行矩量法
作者:张玉 著
出版时间:2016年版
内容简介
近年来,我国在与电磁密切相关的领域取得了一系列重大进展,比如空中预警指挥飞机成功服役等,这些复杂系统工程的实施都离不开对电磁场与电磁波的研究。认知复杂系统电磁特性的手段主要有实验测量和数值计算。对比而言,电磁场数值计算具有高效、灵活方便等显著优势,因此成为设备电磁特性分析与设计的现代化必要手段,也日益发挥着越来越重要的作用。作为电磁场数值分析方法中的经典算法,矩量法具有很高的理论精度,但在处理复杂电大系统电磁问题时,其所需付出的计算存储资源与计算时间代价非常高,这使得矩量法难以用于复杂系统的电磁计算。针对这个难题,本书研究如何利用大规模并行计算技术实现矩量法对复杂电大系统的精确、高效计算。
本书兼顾矩量法的理论基础、高性能计算技术与工程应用,围绕着矩量法处理电磁问题的算子方程、矩阵构建、矩阵方程并行求解、并行矩阵构建策略、核外算法、快速算法、混合方法、异构加速计算技术、工程应用实例等几个方面,系统地给出了超大规模并行矩量法的关键理论、技术以及工程应用。书中高阶矩量法结合波端口、单向通信CALU算法、CPU/GPU与CPU/MIC异构加速矩量法等方面的内容新颖。特别是在排名世界一的天河二号超级计算机中成功开展的20余万CPU核规模的矩量法计算,是当前国际上所达到的很大并行矩量法规模。这一工作使得采用矩量法精确分析复杂系统级电磁问题成为了一种可能,具有重要的战略意义。
本书可作为高等学校工科电子信息、通信、计算机类等相关专业的广大科技工程人员的参考指导书。目录
第1章 矩量法与场积分方程 1
1.1 矩量法简介 1
1.1.1 矩量法的数学原理 1
1.1.2 矩量法求解算子方程实例 3
1.2 电磁场基本理论 6
1.2.1 麦克斯韦方程组 6
1.2.2 时谐场的复数表示法 7
1.2.3 电流连续性方程 8
1.2.4 媒质本构方程 9
1.2.5 边界条件 10
1.2.6 矢量波动方程 11
1.2.7 位函数理论 12
1.2.8 玻印廷定理 23
1.2.9 对偶原理 25
1.2.10 唯一性定理 27
1.2.11 洛伦兹互易定理 29
1.2.12 等效原理 30
1.3 面积分方程 32
1.3.1 理想导体表面积分方程 32
1.3.2 两区域介质表面PMCHW积分方程 37
1.3.3 多区域任意复杂结构的积分方程 40
1.4 激励源 43
1.4.1 平面波 43
1.4.2 电压源 44
1.4.3 磁流源 44
1.4.4 导波场源 45
1.4.5 激励源的对称性 52
1.5 小结 55
参考文献 55
第2章 RWG基函数矩量法 57
2.1 几何建模 57
2.2 RWG基函数 58
2.3 电场积分方程的矩量法解 60
2.3.1 矩阵方程构建 60
2.3.2 矩阵元素的积分计算 62
2.3.3 低阶奇异积分的解析处理 62
2.4 磁场积分方程的矩量法解 68
2.4.1 矩阵方程构建 68
2.4.2 矩阵元素的积分计算 70
2.4.3 高阶奇异积分的解析处理 70
2.5 PMCHW积分方程的矩量法解 76
2.5.1 矩阵方程构建 77
2.5.2 矩阵元素的积分计算 78
2.6 EFIE+PMCHW方程的矩量法解 79
2.7 数值算例 80
2.7.1 EFIE与MFIE矩量法分析散射问题 80
2.7.2 PMCHW矩量法分析散射问题 81
2.7.3 微带结构的散射 82
2.7.4 EFIE矩量法分析波端口问题 82
2.8 小结 85
参考文献 86
第3章 高阶基函数矩量法 87
3.1 几何建模 87
3.1.1 线结构的截锥体建模 87
3.1.2 面结构的双线性曲面建模 88
3.2 高阶基函数 89
3.2.1 细导线上电流的展开 89
3.2.2 双线性曲面上电流的展开 90
3.3 矩阵方程构建 93
3.3.1 细导线的检验过程 93
3.3.2 双线性曲面的检验过程 95
3.4 数值算例 98
3.4.1 平面波激励 98
3.4.2 矩形波端口激励 99
3.4.3 圆形波端口激励 102
3.4.4 同轴激励 104
3.5 高阶基函数矩量法与RWG基函数矩量法的比较 107
3.5.1 微带贴片阵列 107
3.5.2 X波段波导缝隙天线阵 109
3.5.3 Ka波段波导缝隙天线 110
3.6 小结 111
参考文献 111
第4章 矩阵方程求解 112
4.1 直接解法 112
4.1.1 基于LU分解的矩阵方程求解方法 112
4.1.2 LU分解算法 113
4.1.3 分块LU分解算法 118
4.1.4 分块LU分解算法并行实现 124
4.2 线性数学库 140
4.2.1 线性代数库简介 140
4.2.2 OpenBLAS和矩阵乘法优化 143
4.3 并行分块LU分解算法的参数优化 144
4.3.1 分块大小 144
4.3.2 进程网格 146
4.4 并行分块LU分解算法性能测试 149
4.4.1 随机矩阵LU分解性能测试 149
4.4.2 矩量法矩阵LU分解性能测试 151
4.5 迭代解法 157
4.5.1 共轭梯度法 157
4.5.2 广义最小余量法 158
4.5.3 块对角预条件 159
4.5.4 基函数邻居预条件 160
4.5.5 并行迭代解法 161
4.6 迭代求解器性能分析 161
4.6.1 预条件加速RWG基函数MLFMA迭代求解 161
4.6.2 预条件加速正弦基函数矩量法矩阵方程求解 163
4.6.3 预条件加速屋顶基函数矩量法矩阵方程求解 167
4.7 小结 169
参考文献 169
第5章 超大规模并行矩量法 172
5.1 并行矩量法矩阵填充 172
5.1.1 RWG基函数矩量法的并行矩阵填充 172
5.1.2 高阶基函数矩量法的并行矩阵填充 182
5.2 并行矩量法性能评估 183
5.2.1 并行RWG基函数矩量法的性能评估 183
5.2.2 并行高阶基函数矩量法的性能评估 187
5.3 数值算例 204
5.3.1 波导缝隙天线阵列辐射特性 204
5.3.2 微带天线阵列辐射特性 205
5.3.3 机载八木天线阵列的辐射特性 207
5.3.4 机载微带天线阵列的辐射特性 210
5.4 小结 223
参考文献 223
第6章 并行核外高阶基函数矩量法 224
6.1 并行核外算法的矩阵分布 224
6.2 并行核外高阶基函数矩量法矩阵填充方案 225
6.3 核外LU分解算法 226
6.3.1 核外LU分解算法的I/O分析 226
6.3.2 核外Left-Looking LU分解算法设计 230
6.3.3 核外One-Slab Left-Looking LU分解算法设计 233
6.4 并行核外LU分解算法的程序实现 236
6.5 基于核外LU分解的矩阵方程求解方法 238
6.6 并行核外LU分解算法的参数优化 240
6.7 性能监测 242
6.8 数值算例 247
6.8.1 飞机的散射特性 247
6.8.2 波导缝隙阵天线的辐射特性 250
6.8.3 微带阵列天线的辐射特性 251
6.8.4 机载伞形印刷振子天线阵列的辐射特性 252
6.9 小结 255
参考文献 256
第7章 基于RWG基函数矩量法的并行多层快速多极子 257
7.1 自由空间多层快速多极子方法 257
7.1.1 自由空间格林函数的加法定理和平面波展开理论 258
7.1.2 自由空间快速多极子方法 259
7.1.3 自由空间多层快速多极子方法 261
7.2 半空间多层快速多极子方法 263
7.2.1 半空间混合场积分方程 264
7.2.2 半空间MLFMA近相互作用 266
7.2.3 半空间MLFMA远相互作用 267
7.2.4 半空间MLFMA的矩阵向量乘积 270
7.3 并行半空间多层快速多极子方法 272
7.3.1 矩阵向量乘积的数据分配方案 272
7.3.2 半空间MLFMA的自适应划分策略 272
7.4 并行性能测试 276
7.4.1 精度验证 277
7.4.2 并行效率测试 278
7.5 工程应用 282
7.5.1 波音737飞机RCS 282
7.5.2 某型飞机RCS 284
7.5.3 某大型飞机RCS 287
7.5.4 地面上坦克RCS 288
7.5.5 地面上汽车RCS 290
7.5.6 海面上舰载天线电磁辐射特性 292
7.6 小结 293
参考文献 293
第8章 基于矩量法的并行混合算法 295
8.1 并行矩量法的区域分解方法 295
8.1.1 区域分解算法的基本原理 295
8.1.2 算法精度验证 299
8.1.3 数值算例 304
8.2 并行高阶基函数矩量法与多层快速多极子混合算法 313
8.2.1 混合算法的基本原理 314
8.2.2 算法精度验证 315
8.2.3 数值算例 319
8.3 小结 333
参考文献 333
第9章 并行高阶基函数矩量法的工程应用 335
9.1 电磁辐射特性计算 335
9.1.1 机载微带天线阵列 335
9.1.2 波导缝隙天线阵列 338
9.1.3 民航客机周围近场 341
9.1.4 海事卫星天线 344
9.1.5 基站天线与室内电磁辐射评估 347
9.1.6 车厢内WiFi天线 355
9.2 电磁散射特性计算 356
9.2.1 箔条云 356
9.2.2 飞机发动机 357
9.2.3 无人机 358
9.3 旋转叶片调制效应计算 361
9.3.1 旋翼对散射场的调制 361
9.3.2 螺旋桨对辐射场的调制 362
9.4 小结 364
参考文献 364
第10章 异构平台中的并行矩量法 365
10.1 并行矩量法特征分析 365
10.1.1 并行框架分析 365
10.1.2 程序热点分析 367
10.1.3 异构协同计算的难点 369
10.2 CPU/GPU异构并行矩量法 369
10.2.1 国内外研究现状 369
10.2.2 基本并行框架设计 370
10.2.3 程序热点加速 373
10.2.4 性能测试与应用算例 376
10.3 CPU/GPU异构并行两级核外矩量法 386
10.3.1 算法基本原理 386
10.3.2 GPU与CPU任务分配比例优化 389
10.3.3 数值算例 390
10.4 CPU/MIC异构并行矩量法 392
10.4.1 基本并行框架设计 392
10.4.2 程序热点加速 394
10.4.3 MIC与CPU任务分配比例优化 399
10.4.4 数值算例 399
10.5 CPU/GPU与CPU/MIC的性能比较 405
10.6 大规模CPU/MIC异构并行矩量法 407
10.7 小结 411
参考文献 411
附录A 高斯数值积分 413
A.1 一维高斯积分 413
A.2 二维高斯积分 414
参考文献 416
附录B 并行计算基础 417
B.1 硬件平台 417
B.1.1 计算机集群 417
B.1.2 本书使用的计算平台 418
B.2 并行编程环境 421
B.3 并行算法 422
B.4 并行计算性能评测与优化 423
B.5 MPI编程示例 424
B.6 软件安装与设置 427
参考文献 430
附录C 细线天线的矩量法分析 432
C.1 积分方程的构建 432
C.2 积分方程的离散 433
C.3 选配过程 435
C.4 矩阵元素的计算 436
C.5 辐射远场的计算 438
C.6 矩阵填充算法 439
C.7 并行程序流程 440
C.8 并行程序实例 442
C.9 程序编译与运行 465
参考文献 467