人工智能之遗传算法(GA)
今天我们重点探讨一下遗传算法(GA)。 ^_^
人们一提到遗传算法(GA),就会联想到达尔文的生物进化论。遗传算法(GA)是一类借鉴生物界的进化规律演化而来的随机化搜索方法。它是由美国的J.Holland教授1975年首先提出。目前,遗传算法(GA)已成为进化计算研究的一个重要分支。
概念和定义:
遗传算法(Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。
遗传算法(GA)是从代表问题可能潜在的解集的一个种群(population)开始,而一个种群则由经过基因(gene)编码的一定数目的个体(individual)组成。每个个体实际上是染色体(chromosome)带有特征的实体。染色体作为遗传物质的主要载体,即多个基因的集合,其内部表现(即基因型)是某种基因组合,它决定了个体的形状的外部表现。因此,在一开始需要实现从表现型到基因型的映射即编码工作。
由于仿照基因编码的工作很复杂,往往进行简化,初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代(generation)演化产生出越来越好的近似解,在每一代,根据问题域中个体的适应度(fitness)大小选择(selection)个体,并借助于自然遗传学的遗传算子(geneticoperators)进行组合交叉(crossover)和变异(mutation),产生出代表新的解集的种群。这个过程将导致种群像自然进化一样的后生代种群比前代更加适应于环境,末代种群中的最优个体经过解码(decoding),可以作为问题近似最优解。
遗传操作是模拟生物基因遗传的做法。在遗传算法中,通过编码组成初始群体后,遗传操作的任务就是对群体的个体按照它们对环境适应度(适应度评估)施加一定的操作,从而实现优胜劣汰的进化过程。从优化搜索的角度而言,遗传操作可使问题的解,一代又一代地优化,并逼近最优解。
框架与术语:
1)编码—把问题空间的参数转换成遗传空间的由基因按一定结构组成的染色体或个体的操作过程。目前的几种常用的编码技术有二进制编码,浮点数编码,字符编码,变成编码等,最常用的是二进制编码。评估编码策略有3个规范:a)完备性(completeness);b)健全性(soundness);c)非冗余性(nonredundancy)。
2)适应度函数—表示某一个体对环境的适应能力,也表示该个体繁殖后代的能力。遗传算法的适应度函数也叫评价函数,是用来判断群体中的个体的优劣程度的指标,它是根据所求问题的目标函数来进行评估的。遗传算法在搜索进化过程中一般不需要其他外部信息,仅用评估函数来评估个体或解的优劣,并作为以后遗传操作的依据。适应度函数设计直接影响到遗传算法的性能,因此适应度函数的设计需要满足以下条件:a)单值、连续、非负、最大化;b) 合理、一致性;c)计算量小;d)通用性强。
3)初始群体选取—初始群体中的个体是随机产生的。初始群体的设定可采取如下策略:a)根据问题固有知识,设法把握最优解所占空间在整个问题空间中的分布范围,然后,在此分布范围内设定初始群体。b)先随机生成一定数目的个体,然后从中挑出最好的个体加到初始群体中。这种过程不断迭代,直到初始群体中个体数达到了预先确定的规模。
4)染色体—又叫做基因型个体(individuals),一定数量的个体组成了群体(population),群体中个体的数量叫做群体大小。
5)基因—串中的元素,基因用于表示个体的特征。
6)基因位置—简称基因位,在算法中表示一个基因在串中的位置称为基因位置(Gene Position)。
7)特征值—在用串表示整数时,基因的特征值与二进制数的权一致。
8)选择—从群体中选择优胜的个体,淘汰劣质个体的操作。选择算子有时又称为再生算子(reproduction operator)。选择的目的是把优化的个体(或解)直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的。目前常用的选择算子有:适应度比例方法、随机遍历抽样法、局部选择法、锦标赛选择和轮盘赌选择法(最简单、最常用)等。
9)交叉—把两个父代个体的部分结构加以替换重组而生成新个体的操作。遗传算法中起核心作用的是遗传操作的交叉算子。交叉算子根据交叉率将种群中的两个个体随机地交换某些基因,能够产生新的基因组合,期望将有益基因组合在一起。通过交叉,遗传算法的搜索能力得以飞跃提高。最常用的交叉算子为单点交叉(one-point crossover)。
10)变异—变异算子是对群体中的个体串的某些基因座上的基因值作变动。利用变异算子的局部随机搜索能力可以加速向最优解收敛;利用变异算子可维持群体多样性,防止出现未成熟收敛现象。依据个体编码表示方法的不同,可以有:a)实值变异;b)二进制变异。变异率的选取一般受种群大小、染色体长度等因素的影响,通常选取很小的值。
11)终止条件—当最优个体的适应度达到给定的阈值,或者最优个体的适应度和群体适应度不再上升时,或者迭代次数达到预设的代数时,算法终止。
遗传操作进行的是高效有向的搜索。遗传操作包括3个基本遗传算子(genetic operator):选择(selection);交叉(crossover);变异(mutation)。遗传操作的效果和3个遗传算子所取的操作概率、编码方法、群体大小、初始群体以及适应度函数的设定密切相关。3个基本遗传算子的作用:a)选择的作用:优胜劣汰,适者生存;b)交叉的作用:保证种群的稳定性,朝着最优解的方向进化;c)变异的作用:保证种群的多样性,避免交叉可能产生的局部收敛。
最新活动更多
-
即日-1.24立即参与>>> 【限时免费】安森美:Treo 平台带来出色的精密模拟
-
2月28日火热报名中>> 【免费试用】东集技术年终福利——免费试用活动
-
即日-3.21立即报名 >> 【深圳 IEAE】2025 消费新场景创新与实践论坛
-
4日10日立即报名>> OFweek 2025(第十四届)中国机器人产业大会
-
7.30-8.1火热报名中>> 全数会2025(第六届)机器人及智能工厂展
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论