脉冲压缩是这一抽象过程的开始。在时间域或者频域,脉冲压缩器一般通过自相关找到有可能含有发送啁啾的波形。然后,它采用脉冲目标来表示这些波形——含有到达时间、频率和相位以及其他相关数据的数据包。从这里开始,接收链会处理这一数据包而不是接收到的信号。
下一步一般是多普勒处理。首先,脉冲被送入方格阵列中(图3 )。在阵列中,每一列含有从某一发射器啁啾返回的脉冲。阵列中会有很多列,这取决于系统能够承受多大的延时。阵列中的行表示返回切换时间:距离阵列的x轴越远,发射器啁啾和接收脉冲到达时间之间的延时就越大。这样,延时方格也代表了与某一脉冲反射的目标的距离。
图3 .多普勒处理方格。
把一系列啁啾脉冲置入到正确的方格中后,多普勒处理程序水平移动数据——观察从一个目标返回的脉冲随时间的变化,提取出相对速度和目标头部信息。这一处理方法需要很大的环形缓冲,无论某一多普勒算法一次能够处理多少方格,缓冲都能够容纳所有的方格。
先进系统在阵列中增加了另一个维度。通过把天线划分成子阵列,系统可以同时发送多个波束,然后,使用相同的多旁瓣天线方向图设置接收器进行监听。或者,系统通过聚束或者使用合成孔径方法来扫描波束。现在,当装入压缩后的脉冲时,系统建立一个三维方格阵列:一个轴上是发送脉冲,第二个是返回延时,第三个是波束方位(图4 )。现在,对于每一路脉冲,我们有两维或者三维方格阵列,同时表示距离和方向——表示物理空间。这种存储器的排列是空时自适应处理(STAP)的起点。
图4 .多维方格为STAP建立矩阵。
这一术语可以解释为:“空时”,数据组在3D空间统一了目标的位置,含有与目标相关的啁啾时间。之所以是“自适应”,是因为算法从数据中获得自适应滤波。
概念上,实际情况也是如此,构成自适应滤波器是一个矩阵求逆过程:这一数据要与哪一矩阵相乘,得到噪声中隐藏的结果?据Altera资深技术营销经理Michael Parker,推测的隐藏方向图信息可能来自多普勒处理过程发现的种子,从其他传感器采集的数据,或者来自智能数据。运行在CPU下游的算法把假设的方向图插入到矩阵方程中,解出能够产生预期数据的滤波函数。
很显然,在这一点,计算负载非常大。反变换算法需要的动态范围要求进行浮点计算。对于战斗环境中一个实际的中等规模系统,必须实时进行处理,Parker估算了STAP负载会达到几个TFLOPS.在采用了低分辨率、窄动态范围的系统中,实时性要求并不高,例如,简单的汽车辅助驾驶系统或者合成孔径映射系统等,这一负载会显著减小。
从STAP,信息进入到通用CPU中,复杂但是数字计算量小,软件尝试对目标进行分类,构建环境模型,估算威胁所在,或者告诉操作员,或者直接采取紧急措施。在这一点,我们不但在信号处理域处理信号,而且还进入了人工智能领域。
两种体系结构从一名经验丰富的雷达系统设计师的角度看,我们还只是肤浅的了解了AESA战斗雷达。这一参考方法把网络看成是相对静态的DSP链,都连接至STA模块,其本身是软件受控的矩阵算术单元。除此之外,从DSP专家的角度看,是一组CPU内核。
作为对比,汽车或者机器人系统设计人员会从完全不同的角度看系统。从嵌入式设计人员的角度看,系统只是一大段软件,有一些非常专用的I/O器件,以及需要进行加速的某些任务。有经验的雷达信号工程师考虑到信号处理和通用硬件的相对规模,可能会对这一方法不屑一顾。很显然,机载多功能雷达的数据速率、灵活性和动态范围要求采用专用DSP流水线以及大量的本地缓冲才能完成实时处理。但是对于有几个天线单元的不同应用,简单的环境、更短的距离和较低的分辨率,以CPU为中心的观点带来了一些有意思的问题。
莱斯大学的Gene Frantz教授提出的第一个问题是,定义真实环境的I/O.第二个问题是选择CPU.Frantz注意到,“很少只有一个CPU.更常见的是异构多处理系统。”Frantz建议这一方法不从MATLAB中的DSP函数开始,而是从C语言中描述的完整系统开始。然后,以CPU为中心的设计人员不是定义设计中DSP和CPU域之间的硬件边界,而是“不断优化并加速C代码。”
实际结果可能与以DSP为中心的方法完全不同。例如,以CPU为中心的方法一开始假设在一片通用CPU上执行所有工作。如果速度不够快,这一方法转向多片CPU,共享一个分层的连续存储器。只有当多核不足以完成任务时,这一方法才转向优化的硬件加速器。
相似的,以CPU为中心的设计从假设一个统一的存储器开始。它为每一个处理器分配连续高速缓存,为加速器分配本地工作存储器。它开始时并不假设任何硬件流水线,也不把任务混合映射到硬件资源上。
在要求最严格的应用中,同一个系统设计可能会同时采用两种体系结构方法。几乎每一任务严格的带宽和计算需求都导致采用专用硬件流水线和存储器例化。要求大幅度降低功耗可能会迫使做出采用高精度数字方法的决定,这使得在任务之间共享硬件变得越来越复杂。
精度是Frantz强调的一点。他指出,“把有效位数减少一半使您能够将性能提高一个量级。”为降低功耗,您可以对以上这些做出牺牲或者部分牺牲。
Frantz指出了关于模拟/数字边界的问题。他说:“我们需要重新考虑模拟信号处理。三十年以前,我们开始告诉系统设计人员只要做好数据转换就行,我们采用数字方法完成其他所有工作。但是实际上,在8位分辨率,模拟和数字方法大概是相同的。模拟是不是更好一些?这取决于在您的系统中,‘更好'的含义是什么。”
地球物理测绘或者自动陆地车辆系统使用的合成孔径雷达等窄带系统会采用与战斗雷达完全不同的体系结构。它可以使用模拟滤波器、上变频器/下变频器以及聚束功能来完成一个宽带存储器系统的所有后续处理工作,还使用具有浮点加速器和动态负载均衡功能的多个异构处理器(图5 )。
图5.一个理想的低性能AESA系统。
对信号处理任务进行可视化处理,使其在软件中完成,系统设计人员获得了新的运行时选择,例如在任务之间移动处理资源,关断不需要的处理器,尽早修改算法,以便响应数据码型,或者运行多种算法,查看哪一种能够得出最佳结果。
AESA雷达系统不但为研究实现策略提供了丰富的环境,而且还提供了方法来研究有大量信号的系统。这些有源阵列分布在军事等多种设计应用中,所以,不应该局限在传统的嵌入式设计思路中。因此,对于完全不同的需要大量信号的领域要有新思路,这包括信号智能和网络安全等应用。这是值得注意的领域。