从育种到代码：用Python模拟遗传算法，理解近交衰退与杂种优势-开发者社区

从育种到代码：用Python模拟遗传算法，理解近交衰退与杂种优势

在生物育种领域，近交衰退和杂种优势是两个核心概念。前者描述了近亲繁殖导致的后代适应性下降现象，后者则解释了为什么杂交后代往往表现出超越双亲的性状。有趣的是，这些生物学原理与计算机科学中的遗传算法（Genetic Algorithm）有着惊人的相似性。本文将带领读者用Python构建一个种群遗传模拟器，通过代码直观展现这些遗传学现象，同时掌握遗传算法的核心思想。

1. 遗传算法与生物遗传的映射关系

遗传算法是一种受自然选择机制启发的优化算法，其核心要素与生物遗传过程存在直接对应：

种群（Population）：对应算法中的候选解集合
染色体（Chromosome）：问题的编码表示，通常为二进制串
基因（Gene）：编码串中的单个位
适应度（Fitness）：评价函数，衡量解的优劣
选择（Selection）：根据适应度筛选优秀个体
交叉（Crossover）：模拟有性繁殖的基因重组
变异（Mutation）：引入随机变化

# 基本遗传算法框架示例 def genetic_algorithm(population, fitness_func, selection, crossover, mutation, generations): for _ in range(generations): # 评估适应度 fitness = [fitness_func(ind) for ind in population] # 选择 selected = selection(population, fitness) # 交叉 offspring = crossover(selected) # 变异 population = mutation(offspring) return population

2. 构建种群遗传模拟器

我们将使用Python的DEAP库来创建一个完整的遗传模拟系统。DEAP是一个强大的进化计算框架，特别适合这类模拟实验。

2.1 环境配置与初始化

首先安装必要的库：

pip install deap numpy matplotlib

然后初始化遗传算法参数：

from deap import base, creator, tools import random # 定义适应度（越大越好） creator.create("FitnessMax", base.Fitness, weights=(1.0,)) creator.create("Individual", list, fitness=creator.FitnessMax) toolbox = base.Toolbox() # 基因定义为0或1 toolbox.register("attr_bool", random.randint, 0, 1) # 个体由100个基因组成 toolbox.register("individual", tools.initRepeat, creator.Individual, toolbox.attr_bool, 100) # 种群包含300个个体 toolbox.register("population", tools.initRepeat, list, toolbox.individual)

2.2 实现适应度共享机制

为了模拟近交衰退，我们需要实现适应度共享（Fitness Sharing），这能惩罚过于相似的个体：

def similarity(ind1, ind2): return sum(g1 == g2 for g1, g2 in zip(ind1, ind2))/len(ind1) def shared_fitness(individual, population, alpha=1.0, sigma=0.3): base_fitness = evaluate(individual) # 基础适应度函数 niche_count = sum(similarity(individual, ind) > sigma for ind in population) return base_fitness / (niche_count ** alpha)

3. 模拟近交衰退现象

近交衰退在遗传算法中表现为种群多样性下降导致的早熟收敛。我们可以通过以下参数控制：

参数	生物学对应	算法影响
高选择压力	严格人工选择	加速收敛但降低多样性
低交叉率	近亲繁殖	减少基因重组机会
小种群规模	隔离小群体	加速遗传漂变

# 模拟近交衰退的实验设置 def setup_inbreeding_experiment(): # 使用锦标赛选择（高选择压力） toolbox.register("select", tools.selTournament, tournsize=7) # 低交叉率（0.3） toolbox.register("mate", tools.cxTwoPoint) # 小变异率（0.01） toolbox.register("mutate", tools.mutFlipBit, indpb=0.01)

运行模拟后，我们会观察到：

种群基因多样性迅速下降
平均适应度初期上升但很快停滞
最终解质量低于预期

4. 利用杂交优势提升算法性能

杂种优势在遗传算法中对应着：

显性效应：优良基因组合掩盖不良基因
超显性效应：杂合基因型优于任何纯合基因型

实现策略：

# 增强杂交优势的改进措施 def enhance_heterosis(): # 多样化选择策略组合 toolbox.register("select_diverse", tools.selBest) # 保留精英 toolbox.register("select_random", tools.selRandom) # 保持多样性 # 自适应交叉率 def adaptive_crossover(ind1, ind2, min_cr=0.5, max_cr=0.9): similarity = sum(g1 == g2 for g1, g2 in zip(ind1, ind2))/len(ind1) cr = max_cr - (max_cr - min_cr) * similarity if random.random() < cr: tools.cxTwoPoint(ind1, ind2) return ind1, ind2 toolbox.register("mate", adaptive_crossover)

实验对比表明，采用这些策略后：

种群维持更高的基因多样性
算法收敛到更好的解
避免早熟收敛现象

5. 实践应用：函数优化案例

让我们用一个实际优化问题来验证这些概念。考虑Rastrigin函数的最小化：

import numpy as np def rastrigin(individual): x = np.array(individual) return sum(x**2 - 10*np.cos(2*np.pi*x)) + 10*len(x), toolbox.register("evaluate", rastrigin) # 运行两种模式的对比实验 def run_comparison(): # 标准模式（可能近交衰退） standard_stats = tools.Statistics(lambda ind: ind.fitness.values[0]) standard_stats.register("avg", np.mean) # 多样性增强模式（利用杂种优势） enhanced_stats = tools.Statistics(lambda ind: ind.fitness.values[0]) enhanced_stats.register("avg", np.mean) return standard_stats, enhanced_stats

实验结果通常显示，采用多样性保持策略的算法能找到更优的解，验证了杂交优势在优化问题中的价值。

6. 高级话题：多目标优化中的平衡

在实际应用中，我们经常需要平衡多个目标。这与育种中同时改良多个性状类似：

# 多目标优化设置 creator.create("FitnessMulti", base.Fitness, weights=(1.0, -1.0)) # 最大化第一个目标，最小化第二个 creator.create("Individual", list, fitness=creator.FitnessMulti) def multi_objective(individual): obj1 = sum(individual) # 例如：产量 obj2 = sum(abs(i-j) for i,j in zip(individual, ideal_trait)) # 例如：与理想性状的差距 return obj1, obj2 toolbox.register("evaluate", multi_objective) # 使用NSGA-II选择 toolbox.register("select", tools.selNSGA2)

这种设置允许我们探索解空间的Pareto前沿，找到不同目标之间的最佳平衡点。