基于指标的多目标进化算法(IBEA)简介
参考文献:
[1]Zitzler, Eckart and Simon Künzli. “Indicator-Based Selection in Multiobjective Search.” PPSN (2004).
[2]Jesús Guillermo Falcón-Cardona and Carlos A. Coello Coello. 2020. Indicator-based Multi-objective Evolutionary Algorithms: A Comprehensive Survey. ACM Comput. Surv. 53, 2, Article 29 (March 2021), 35 pages. https://doi.org/10.1145/3376916
[3]E. Zitzler, L. Thiele, M. Laumanns, C. M. Fonseca and V. G. da Fonseca, “Performance assessment of multiobjective optimizers: an analysis and review,” in IEEE Transactions on Evolutionary Computation, vol. 7, no. 2, pp. 117-132, April 2003, doi: 10.1109/TEVC.2003.810758.
Abstract
1、比起基于支配或是分解的多目标进化算法,基于指标的好处在于根据所选取指标的不同,可以在优化过程中就将用户偏好信息(preference information)考虑进去。
2、不需要任何额外的多样性保持的机制
指标选择
也就是说其实什么指标都可以用进来,选一个合适的指标就能套用一个通用的方法,这里就以一种指标为例讲述一个通用的方法。下面以参考文献[2]为例进行描述。
ϵ指标
1、支配关系
我们是怎么定义最初的支配关系的呢?
有这样的一个问题,给定一个的决策向量x={x1,x2,...,xn},需要优化的问题为min{fi(x)fori=1,2,..,m}
现在有两个决策向量x1和x2,如果满足
∀i∈m,fi(x1)≤fi(x2)
∃j∈m,fi(x1)<fi(x2)
那么就说x1支配x2,记作x1≺x2(不失一般性,这里与min的目标一致,采用这种写法),在有些论文里也记作x1≻x2。此时x1称为非支配的,x2称为被支配的。
这样定义的支配关系在目标个数较少的情况下还是比较有用的,但是目标数一旦多起来,如此严格的支配关系将几乎无法满足,也就是两两个体之间几乎都是互不支配的关系,那这个定义显然就鸡肋了嘛。
所以我们尝试放宽这个支配关系的标准,就有弱支配(weakly dominant)定义出现。而ϵ指标的出现也是基于这样的想法。
2、ϵ指标
这个指标提出其实是比较两个pareto set的好坏的,每一个pareto set里包含了很多个决策向量
Iϵ(A,B)=minϵ{∀x2∈B,∃x1∈A:fi(x1)−ϵ≤fi(x2)fori∈{1,2,...,m}}
如果每个pareto set里只有一个决策向量,那么上式就变为如下定义
Iϵ(x1,x2)=max{fi(x1)−fi(x2)fori∈{1,2,...,m}}
在这个指标的定义下,我们定义两个个体的支配关系就有如下两种方式:
对于两个决策向量x1和x2,如果满足(i)或者(ii)任意一个,那么我就说x1≺x2
Iϵ(x1,x2)<Iϵ(x2,x1)(i)
∀x3,Iϵ(x3,x1)≥Iϵ(x3,x2)(ii)
公式说完了,现在来理解一下这个指标。
其实这就相当于是一个弱支配关系,按照严格的支配关系无法定义支配,那就尝试减掉一个松弛因子,这里我们记作ϵ,然后两个个体间,谁减掉的松弛因子比较小的,那谁就更趋向一个非支配的状态。所以我们可以理解Iϵ(xi,xj)代表xi要支配xj需要减掉的松弛因子。
3、其它指标
还有很多种指标,比如超体积(hypervolume)、反转世代距离(Inverted Generational Distance)等一般的二元指标基本都可作为IBEA算法的指标来使用
基于指标的选择
1、分配适应度
每个个体的适应度是由下式定义的,对于种群P,每个个体是一个决策向量
F(xi)=xj∈P\xi∑−e−I(xj,xi)/(c(xj)×k)
这里的k是一个定值,一般取k=0.05
c(xj)=xi∈Pmax∣I(xi,xj)∣
来理解一下这个适应度公式,对于一个个体xi来说,它的适应度就是这个种群中所有其他个体需要支配它需要的松弛因子进行一个比例缩放之后的和,这里取了正号和负指数运算,是考虑到min的目标和比较以及符号的方向一致性。
那么现在还可以使用
F(x1)>F(x2)(iii)
来表示x1≺x2
2、环境选择
- 父代种群P经过一些遗传方式产生子代之后得到一个中间种群P∗,对于P∗中的每一个个体分配一个适应度值,排序之后找到适应度值最小的个体,将其踢出种群
- 重新更新当前种群每个个体的适应度
- 重复上述步骤直到∣P∗∣=∣P∣
- 有些算法这里会有一步mating selection,也就是说种群P是不是所有个体都用来生成后代,而是通过一些选择策略选择N个个体生成子代
- 得到当前代种群,继续进行进化更新直到gens达到停止条件或其他停止条件