一、研究背景与问题
现代混凝土配比设计面临多重挑战:需要同时满足力学性能、工作性、耐久性和低碳可持续性等多项目标。传统配比设计主要依赖经验试错,效率低且成本高。虽然已有研究利用机器学习预测混凝土强度,但存在两大瓶颈:1)缺乏公开、高质量的实验数据集(多数为专有工业数据);2)现有模型大多无法量化预测的不确定性,也未能有效捕捉强度随时间的非线性演化规律。
二、核心创新与贡献
本研究提出了一个名为BOxCrete的开源、概率建模与优化框架,核心创新包括:
开放获取的高质量数据集:
首次发布了一个来自单一实验室、系统化制备的公开数据集,包含123种配比(69种砂浆 + 54种混凝土),共533个强度测量值。
配比参数覆盖范围广:水胶比 0.20–0.50,总胶凝材料 240–2150 lb/yd³,SCM(粉煤灰、矿渣)替代率 0–100%。
养护龄期:1、3、5、14、28天;抗压强度范围:<1 ksi 至 16 ksi;隐含碳(GWP)范围:55–535 kg CO₂e/yd³。
高斯过程回归模型:
采用高斯过程(GP)回归,能够输出带95%置信区间的概率预测,量化认知不确定性。
通过对时间取对数变换,结合专门设计的复合核函数(时间核 + 组成-时间联合核),成功捕捉了混凝土强度随时间的S形演化规律,包括早期快速水化和后期SCM缓慢反应。
多目标贝叶斯优化:
将GP模型与贝叶斯优化(BO)结合,采用预期超体积改进(EHVI)采集函数,实现抗压强度与隐含碳(GWP)的双目标帕累托优化。
能够进行逆向配比设计:用户给定强度目标和碳预算,模型自动推荐满足要求的配比组成。
三、主要结果与性能
预测精度:
最终模型在独立测试集上达到R² = 0.94,RMSE = 0.69 ksi(约4.8 MPa),显著优于许多基于专有数据集的模型(如Pfeiffer等:R²≈0.88,RMSE≈0.91 ksi)。
跨五个随机测试集的结果高度一致(R² = 0.94 ± 0.01,RMSE = 0.69 ± 0.07 ksi),验证了模型的鲁棒性和泛化能力。
分阶段学习收敛性:
模型采用六阶段顺序学习策略,随着训练数据多样性的增加,预测不确定性从±2.4 ksi(早期)显著缩小至±0.2–1.3 ksi(最终阶段)。
尤其改善了14天和28天的预测精度,这归功于富含SCM的配比数据帮助模型学习到延迟的火山灰反应。
逆向设计能力:
BOxCrete成功生成了满足5000–8000 psi强度要求且GWP低至120–150 kg CO₂e/yd³的配比方案。
优化配比实现了 >50% 的水泥替代率,GWP比传统对照配比降低高达60%,同时28天强度超过10 ksi。
四、方法论亮点
物理一致性约束:在t=0时刻添加人工零强度观测值,确保模型预测符合混凝土浇筑时强度为零的物理事实。
不确定性量化:后验方差随数据增加而系统性减小,提供了模型置信度的统计解释。
数据效率:仅用约500个数据点即达到优于或媲美数万个数据点训练的专有模型的精度,凸显了数据多样性优先于数据量的策略。
五、局限性
作者明确指出现有工作的两个局限:
当前模型仅适用于训练集中所用特定来源/类型的材料(如特定粉煤灰、矿渣),若更换材料源或质量,模型可能需要重新校准或迁移学习。
目前优化目标仅包含抗压强度和隐含碳(GWP),尚未纳入工作性和耐久性等现场关键指标。
六、结论与意义
BOxCrete是首个面向混凝土配比设计的高性能、开源、概率性AI框架,提供了完整的实验数据集、训练代码和多目标优化工具。
该框架实现了可解释、带不确定性量化的强度预测,并支持逆向配比设计,可显著加速低碳高性能混凝土的开发。
作者以MIT许可证开源全部代码和数据集,旨在推动AI在混凝土行业的实际应用,并鼓励社区通过数据共享和迁移学习进一步提升模型的通用性。
BOxCrete是一个基于高斯过程回归和贝叶斯优化的开源AI框架,利用公开的高质量实验数据集,能够高精度预测混凝土强度随时间演化的概率分布,并在强度和低碳之间进行多目标逆向配比设计,为可持续混凝土材料开发提供了一个可重复、可扩展的智能平台。
这里是自己的论文阅读记录,感兴趣的话可以参考一下,如果需要阅读原文的话可以看这里,如下所示:
项目地址在这里,如下所示:
摘要
现代混凝土必须同时满足对力学性能、工作性、耐久性和可持续性日益增长的需求,这使得配比设计日趋复杂。近期利用人工智能和机器学习模型预测抗压强度并指导配比优化的研究显示出前景,但大多数现有工作基于专有工业数据集和闭源实现。本文介绍了BOxCrete——一个开源的概率建模与优化框架,该框架基于一个新的开放获取数据集进行训练,该数据集包含来自123种配比(69种砂浆和54种混凝土,在5个养护龄期(1、3、5、14和28天)测试)的500多个强度测量值(1-15 ksi)。BOxCrete利用高斯过程回归预测强度发展,实现了平均R² = 0.94和RMSE = 0.69 ksi,能够量化不确定性,并对抗压强度和隐含碳进行多目标优化。该数据集和模型为基于数据驱动的人工智能优化配比设计建立了一个可重复的开源基础。
1 引言
混凝土是地球上仅次于水的第二大消耗材料,年产量估计约为100亿立方米(约300亿吨)11。其成本最高且CO₂排放最密集的成分——水泥,目前年产量为40亿吨22。预计到2050年全球人口将增加25亿,社会对住房和公共基础设施的需求将进一步推动水泥和混凝土的生产33。考虑到混凝土成分的规模和复杂性,高效的配比设计是优化地球资源利用的关键策略。现代混凝土配比越来越需要同时实现多个目标,包括但不限于:a) 满足结构性能要求(早龄期和晚龄期强度),b) 满足特定的耐久性标准(低渗透性和体积稳定性),c) 满足工作性要求(可泵送和现场可浇筑),d) 成本效益高,以及e) 具有最小的碳足迹44。在过去十年中,对最小化碳足迹的日益关注使现代混凝土配比变得更加复杂。
具体而言,由于1吨波特兰水泥在生产过程中贡献约0.8吨CO₂,并占全球人为CO₂排放量的6-8%,人们对部分或完全替代这一关键成分产生了浓厚兴趣5−85−8。在这些方法中,使用辅助性胶凝材料(如粉煤灰和粒化高炉矿渣)部分替代水泥是最实用和可行的策略之一9,109,10。此外,随着传统辅助性胶凝材料供应变得有限,其他辅助性胶凝材料,如煅烧粘土、 harvested ashes 和天然火山灰,在全球范围内受到越来越多的关注11−1311−13。大多数这些辅助性胶凝材料不仅降低了混凝土的碳足迹和成本,还有助于长期性能优势,包括增强的后期强度、耐久性和更低的渗透性,从而延长混凝土基础设施的使用寿命14,1514,15。
然而,高辅助性胶凝材料用量存在两个核心问题。首先,早期强度和可工作性可能会根据所使用辅助性胶凝材料的质量和数量而受到影响1616。此外,含有混合水泥的现代混凝土配比往往加入更多种类的有机外加剂,以缓解新型成分带来的挑战17,1817,18。因此,这些现代混凝土配比的抗压强度轨迹成为多个配比参数的高度非线性函数19−2219−22。这种高维相互依赖性使得传统的混凝土配比设计在很大程度上是经验性的,依赖于耗时且资源密集的试错方法44。混凝土生产本质上是区域化的,因为它强烈依赖于当地可获得的胶凝材料、外加剂、骨料和水的可用性、变异性和成本。因此,通用的配比方案是不可行的,必须根据当地材料的变异性和项目特定的性能目标系统地调整配方。因此,越来越需要能够智能地导航这一复杂材料空间的数据驱动配比设计框架,并指导开发可持续、低成本的混凝土配比,以满足现场的结构、耐久性和工作性要求。
机器学习技术越来越多地被探索来解决这一挑战,提供了模拟复杂非线性相互作用并直接从配比组成预测性能指标的潜力23−2723−27。先前的研究已将机器学习模型应用于精心整理的实验室数据集和工业预拌记录,以预测抗压强度。根据现有文献,存在两个主要的研究空白。首先,Yeh(1998)2323的原始数据集包含约1000个测量值,已有近30年历史,此后在单个实验室中再也没有获得新的公开数据集。最近关于大型工业数据集的研究(Young等人1919约1万个测量值,Pfeiffer等人2828约4万个测量值)很有前景,但无法公开获取。其次,大多数现有方法忽略了强度发展的概率性和随时间演变的特性,并且未能量化不确定性,而这对于早期和后期强度同等重要的鲁棒性结构应用至关重要28,2928,29。为了填补这些空白,迫切需要公开的高保真数据集和能够随时间预测强度并量化相关不确定性的开源AI模型。
在本研究中,我们介绍了BOxCrete——一个新颖的、开源的建模与优化框架,该框架基于533个独特的强度测量值进行训练,我们将其作为开放获取的公共数据集发布。这533个测量值对应于在单个实验室(伊利诺伊大学)制备的123种实验浇筑的砂浆(69种)和混凝土(54种)配比,这些配比具有系统变化的水胶比、胶凝材料含量和辅助性胶凝材料替代水平(如图1所示)。BOxCrete AI模型利用高斯过程回归3030,将强度发展建模为时间和配比组成的函数概率模型,
图1:BOxCrete用于可持续混凝土配比优化的AI在环框架。原材料(IL型水泥、辅助性胶凝材料和骨料)按比例配制成砂浆和混凝土配比,浇筑成型,并在1、3、5、14和28天测试抗压强度。通过生命周期评估量化从摇篮到大门的总增温潜势。将得到的配比组成、强度和总增温潜势数据集用于训练高斯过程回归模型,以预测强度演变并量化不确定性。结合贝叶斯优化,训练好的模型生成针对用户定义的强度和可持续性目标的新配比设计。AI建议的配方经过实验验证并重新引入循环,实现自适应学习,加速发现用于基础设施应用的高性能、可持续混凝土。
从而实现跨多个养护龄期的带不确定性感知的预测2929。为了加速材料设计,我们将此框架与贝叶斯优化3131相结合,进行抗压强度和总增温潜势的多目标优化32,3332,33,从而能够快速识别最优的胶凝材料配方。该模型通过六个实验阶段(第一阶段至第六阶段)迭代优化,每个阶段都整合了日益多样化的数据,并针对从训练集中排除的12种独立混凝土配比进行了验证。最终模型在所有养护龄期实现了R²为0.94,RMSE < 0.70 ksi,显示出高预测精度和强泛化能力。最后,BOxCrete还使得开发28天抗压强度超过6 ksi、同时隐含碳水平低至120–150 kg CO₂e/yd³的混凝土配比成为可能,强调了其长期同时优化性能和可持续性的能力。完整的数据集和AI模型将作为开放获取资源发布,以促进社区驱动的改进和更广泛的适用性。这个结合了开源AI框架和精心整理的实验数据集,降低了AI采纳的门槛,同时加速了跨不同材料系统的高性能、低碳混凝土配方的发现。通过将实验精度与统计可解释的机器学习相结合,BOxCrete为混凝土配比设计中的多目标优化建立了一个可扩展的框架,推动了可持续、高性能建筑材料的发展。
结果与讨论
实验配比的强度与可持续性
理解力学性能与隐含碳(可持续性)之间的耦合关系对于推进可持续胶凝材料设计策略至关重要。先前的研究表明,优化利用辅助性胶凝材料(如粉煤灰和矿渣)可以通过互补的水化机制在强度发展和CO₂减排之间取得平衡5,345,34。因此,为了建立一个全面的预测框架,有必要表征抗压强度和总增温潜势如何在组成多样化的胶凝材料空间中演变。这构成了本研究的基础,为后续的模型开发提供了机理和统计基础。
图2展示了123种独特胶凝材料配比的抗压强度和相应的总增温潜势值,包括69种砂浆和54种混凝土配比。图2a中的每个子图对应一个离散的水化龄期(1、3、5、14和28天),展示了在广泛的设计空间中力学性能和隐含碳随时间的演变。图2b进一步展示了所有配比的抗压强度随养护龄期的演变,突出了数据集中捕获的高度异质、非线性的强度发展轨迹。
这个开放获取的数据集涵盖了广泛的配比组成变化,包括水胶比从0.20到0.50,总胶凝材料含量从240到2150 lb/yd³,以及不同比例的辅助性胶凝材料(如粉煤灰和矿渣)。这种多样性使得抗压强度范围从低于1 ksi到高达16 ksi(6.9-110 MPa),总增温潜势值范围从55到535 kg CO₂e/yd³。
在水化早期(1-5天;图2a),抗压强度的增加通常与较高的总增温潜势相关,特别是在普通硅酸盐水泥含量较高的配比中。这种相关性源于阿利特(C₃S)的快速水化动力学,它驱动了C-S-H和氢氧化钙的早期成核与生长3535。这一早期阶段的强度增益主要由初级水化产物主导,反应程度与水泥含量强相关3636。因此,高早期强度通常是以更高的熟料用量和相关的CO₂排放为代价实现的。相对于混凝土,砂浆系统倾向于聚集在较高的总增温潜势水平,因为缺少骨料的稀释作用,导致单位体积混合料中的胶凝材料体积更大。
到28天时(图2a),强度与总增温潜势的关系变得非单调。几个总增温潜势值在100到200 kg CO₂e/yd³之间的配比达到了10到16 ksi的抗压强度。这种转变反映了辅助性胶凝材料的活化,它们通过火山灰反应(粉煤灰)和潜在水硬反应(矿渣)驱动的二次C-S-H形成来贡献强度34,37,3834,37,38。这些反应比普通硅酸盐水泥水化进展更慢,但随着养护时间的增加变得日益显著。随着水化进行,混合体系表现出更高的反应程度、更致密的微观结构和更精细的孔径分布,通常产生的强度可与高水泥含量的对照配比相当或超过3939。此外,由于粗细骨料的稀释效应占据了体积空间而不贡献与胶凝材料相关的排放,混凝土混合料在所有龄期都表现出比砂浆更低的总增温潜势值。
总体而言,结果表明强度发展对配比组成高度敏感,但通过平衡的胶凝材料设计可以同时实现低隐含碳。这凸显了描绘潜在组成设计空间的必要性,强调了单个配比参数在控制力学性能和可持续性方面的关键作用。与以往通常报告28天强度为3-7 ksi、总增温潜势值为240-450 kg CO₂e/yd³的研究相比,本数据集涵盖了更广泛的领域——强度高达16 ksi,总增温潜势值范围约为55至535 kg CO₂e/yd³。
跨水化龄期,数据集揭示了在强度-总增温潜势空间的右上象限(此处定义为优化目标)内,高性能、低碳混合料的密度不断增加。这些混合料反映了降低熟料含量和增强辅助性胶凝材料反应性的有效平衡。强度-总增温潜势曲线随养护时间的动态演变强调了时间依赖性配比优化的重要性,以及机器学习框架在指导可持续、高性能混凝土混合料规定性设计中的潜在作用。
图2:砂浆和混凝土混合料跨养护龄期的抗压强度与隐含碳演变。对于69种砂浆(圆形)和54种混凝土(三角形)混合料在养护1、3、5、14和28天,绘制了总增温潜势与无侧限抗压强度的关系图。每个数据点代表一种独特的配比设计,具有变化的胶凝材料含量(240-2150 lb/yd³)、水胶比(0.20-0.50),以及使用C级和F级粉煤灰、粒化高炉矿渣对波特兰石灰石水泥的不同替代水平。垂直误差线表示基于三个平行试件的抗压强度测量值的标准误差。总增温潜势值使用标准材料排放因子在从摇篮到大门的基础上计算。优化性能区,由低隐含碳和高抗压强度定义,对应于每个图的右上象限。
预测抗压强度的时间演变
预测胶凝材料体系中抗压强度的时间演变需要能够准确表征水化动力学、胶凝材料化学和体积配比组成之间非线性耦合关系的模型。传统的经验和基于神经网络的方法已被证明可用于预测单龄期强度19,2319,23,但当扩展到连续的强度发展轨迹时,它们往往缺乏泛化能力和可解释性。为了解决这些限制,本研究采用高斯过程回归框架,该框架能够捕捉时间依赖的水化行为,同时量化预测不确定性。本节评估了模型的分阶段学习进展及其在跨多样化配比设计中再现实验强度曲线的能力。
在本研究中,AI模型通过跨六个混合料开发阶段(第一阶段至第六阶段)逐步增强数据集而进行训练和优化。最终的、完全训练好的模型(第六阶段)随后被用于预测一组留出的12种混凝土混合料的抗压强度发展曲线。该验证集是随机选择的,未包含在训练数据中。为了进一步评估模型的鲁棒性,在五次随机迭代中构建了五个不同的测试集(测试集1-5)。
这些测试集中12种混凝土混合料的组成变化在图S3中进行了图形化总结。图3显示了对于测试集1中的六种代表性混凝土混合料(图A),模型预测能力随训练阶段(第一阶段至第六阶段)的进展,比较了跨1-28天养护龄期的预测抗压强度值与实验测量值。这些阶段对应于逐渐增大的训练数据集,从小的初始子集(第一阶段)到完整的混凝土数据集(第六阶段),并用于逐步校准AI模型(见表2)。预测的强度曲线(蓝线)包括95%置信区间(阴影区域,±2个标准差),而实验测量值绘制为离散点,误差线表示±1个标准差(n=3)。测试集1中其余混合料以及测试集2-5的相应比较显示在补充信息的图S4中。
模型成功地再现了所有混合料表现出的特征性S形强度演变行为,可靠地捕捉了水泥水化的多相动力学。特别是,模型捕捉了在1-5天之间观察到的快速早期强度增长以及后期(14-28天)逐渐稳定的强度增加。由于实验测量是在强度发展的多个关键时间点(1、3、5、14和28天)收集的,高斯过程回归模型能够学习与早期初级水化和后期辅助性胶凝材料驱动反应相关的细微差别。这种跨多样化混合料组成在所有测试集中的一致性吻合,证明了模型能够直接从组成和时间数据中推断潜在的水化动力学,而无需依赖经验曲线拟合参数。
模型精度随着训练数据集的大小和组成多样性的增加而系统性地提高,这反映在图3中各阶段阴影不确定性边界的逐渐收缩。在早期学习阶段(第一阶段-第二阶段),预测区间相对较宽(28天时约为±0.8-2.4 ksi),特别是对于具有独特胶凝材料化学性质或较高水胶比的混合料。这种分散性表明由于模型对多样化水化途径的接触有限,导致预测不确定性较高。随着在第三至第五阶段纳入更多配方,阴影不确定性区域显著缩小至±0.4-1.9 ksi,并且预测平均值在所有养护龄期都显示出与实验观察结果更好的对齐。到第六阶段,对于大多数数据点,不确定性包络线收缩到约±0.2-1.3 ksi以内,预测强度和测量强度显示出近乎一致的关联性(R² ≈ 0.94,RMSE ≈ 0.73 ksi)。
值得注意的是,模型不仅捕捉了总体强度趋势,还捕捉了由于混合料参数变化引起的强度差异。例如,水胶比较低(0.25)的混合料C5,其1天和3天强度分别达到约2.2 ksi和6 ksi,而水胶比较高(0.35)的混合料C15,其早期强度较低,分别约为0.71 ksi和3.2 ksi。不断增加的数据密度和组成多样性使模型能够更好地学习非线性水化相互作用,减少了在中间龄期(3-14天)的偏差,而早期阶段在这些龄期表现出轻微低估。重要的是,这种单调的改进和收敛模式在所有五个独立的测试迭代(测试集1-5)中一致观察到,强调了顺序学习框架的可重复性和鲁棒性。
与先前基于AI的模型(通常报告的R²值在0.49到0.89之间,RMSE值接近0.75 ksi19,23,2819,23,28,见表S11)相比,本研究的GP回归框架在开放获取数据集上实现了显著更高的精度(R² ≈ 0.94,RMSE < 0.69 ksi),同时通过其概率公式和显式的不确定性量化保持了可解释性。分阶段学习策略能够有效表征非线性水化行为,使模型能够逐步区分以熟料为主导的早期反应和以辅助性胶凝材料驱动的火山灰贡献(这些贡献决定了后期的强度演变)。随着数据集的丰富,不确定性边界的适应性收缩定量地反映了跨养护龄期 epistemic 置信度和泛化能力的提高。总体而言,精炼后的模型为跨多样化的胶凝材料化学体系进行时间相关强度预测提供了统计上稳健且可解释的基础,构成了数据驱动优化可持续混凝土系统的关键基础。
图3:AI模型抗压强度预测随训练数据集大小的演变。对于六种代表性混凝土混合料,跨六个训练数据集阶段(第一阶段至第六阶段),显示了预测的(蓝线)和实验测量的(绿点)抗压强度。每个阶段对应于扩展的训练集大小,包含了具有不同胶凝材料组成和水胶比的越来越多的配比设计。阴影区域表示模型预测的95%置信区间(均值±2个标准差)。实验数据点表示三次平行测试的均值±1个标准差(n=3)。该图展示了随着训练集变得更加全面,模型精度和不确定性减少的逐步改进。
预测强度建模中精度与不确定性的分阶段收敛
BOxCrete模型的预测能力通过一个系统的分阶段学习框架进行了进一步评估,该框架旨在量化精度和不确定性如何随着数据的逐步丰富而演变。这种方法提供了模型收敛行为的统计解释,将组成多样性的整合与跨养护龄期预测精度的可测量改进联系起来。
图4展示了BOxCrete模型在六个顺序训练阶段(P-I到P-VI)预测精度的逐步演变,证明了性能如何随着纳入日益多样化的混合料组成而提高。主 parity 图(左)比较了最终训练阶段(P-VI)所有12种混凝土混合料的实验测量和预测的抗压强度,达到了R² = 0.94和RMSE = 0.73 ksi。标记形状对应于养护龄期(1、3、5、14和28天),而颜色梯度表示阶段进展。数据点沿着1:1线强聚类以及狭窄的分散包络线反映了在宽强度范围内出色的预测保真度和泛化能力。
分阶段 parity 图(右)捕捉了从P-I到P-VI预测性能的转变。在早期阶段(P-I和P-II),明显的更宽分散和系统性低估是明显的,特别是对于超过6 ksi的混合料,这是由于对富含辅助性胶凝材料或高强度组成的代表性有限。随着数据的逐步增加(阶段P-III到P-V),parity线周围的分散收缩,最佳拟合线的斜率趋近于1。到阶段VI,阴影不确定性带从早期阶段的约±2.4 ksi缩小到约±0.2 ksi,预测强度和测量强度沿着1:1参考线紧密对齐,表明系统性偏差几乎完全消除。累积面板(P-I到P-VI)进一步强化了这种收敛行为,证明了性能在再训练周期中持续改进。
下面面板中的定量指标加强了这些观察结果。决定系数R²和均方根误差被绘制为每个养护龄期阶段数的函数(见表S6-S10)。两个指标都随着阶段进展表现出系统性的增强——R²从第一阶段的约0增加到第六阶段的>0.94,RMSE从约5.5 ksi降低到<0.73 ksi。不确定性包络线的收缩反映了 epistemic 误差的一致减少,模型在吸收先前未见的组成领域时获得了统计置信度。最显著的改进发生在较晚的龄期(14和28天),其中富含辅助性胶凝材料的组成的纳入使得能够更好地模拟延迟的火山灰和潜在水硬反应。相比之下,早期预测(1-3天)主要受阿利特水化和外加剂效应控制,显示出较小的相对改进,这与早期水化过程的较低组成敏感性一致。在所有五个测试迭代(数据集2-5)中均观察到R²和RMSE的类似改进,如补充信息图S5所示。每个测试集跨阶段R²和RMSE改进的总结提供在图S6和S7中。所有五个测试数据集的RMSE一致收敛——从超过3000 psi的初始值到第六阶段低于1000 psi——证明了模型有效学习组成-强度关系并泛化到未见配方的能力。第六阶段后收敛的R²和RMSE值总结在表1中。
本研究实现的预测精度(R² = 0.94,RMSE = 0.69 ksi)与胶凝材料体系强度预测模型的既定基准相当,并且在某些方面超过了它们。Pfeiffer等人(2024)2828使用在9,296个工业混凝土混合料的私有数据集上训练的高斯过程回归模型,报告了R² ≈ 0.88,RMSE ≈ 0.91 ksi(见表S11)。值得注意的是,BOxCrete以少近两个数量级的数据点实现了相似或更好的精度,凸显了其数据效率。这种改进源于有意的组成多样化和分阶段训练策略,这些策略共同实现了对混合料参数与抗压强度之间高维非线性关系的鲁棒学习。类似地,Young等人(2019)1919分析了超过10,000个现场收集的混合料,报告了R² ≈ 0.60 ± 0.05和RMSE = 0.64-0.72 ksi,尽管他们的数据集和模型是专有的。在产生相似RMSE值的同时,BOxCrete提供了一个关键优势:其数据集和代码是完全开放获取的,实现了超越专有实现的可重复性、透明度和可扩展性。最后,Yeh(1998)2323早期的ANN框架对1,030个强度测量值实现了R² ≈ 0.88,但缺乏对现代混凝土混合料进行可泛化预测所需的组成多样性。
总的来说,这些结果表明,优先考虑数据多样性而非数据量的顺序学习显著增强了预测精度和可解释性。高斯过程回归框架不仅捕捉了时间依赖的强度演变,还量化了不确定性的减少,将统计收敛与物理水化机制联系起来。这种分阶段学习范式为开发用于可持续混凝土设计的高精度、物理可解释的AI模型建立了一条可重复且数据高效的路径。
表1:BOxCrete模型跨测试数据集和养护龄期的性能指标。展示了在五个独立测试集上,对于1、3、5、14和28天养护龄期,以决定系数(R²)和均方根误差(RMSE)衡量的统计性能。全局平均值为R² = 0.94 ± 0.01,RMSE = 0.69 ± 0.07 ksi。
| 指标 | 龄期 | 测试集1 | 测试集2 | 测试集3 | 测试集4 | 测试集5 | 所有测试集 |
|---|---|---|---|---|---|---|---|
| R² | 1天 | 0.67 | 0.94 | 0.86 | 0.86 | 0.67 | 0.80 ± 0.12 |
| 3天 | 0.69 | 0.82 | 0.82 | 0.86 | 0.69 | 0.78 ± 0.08 | |
| 5天 | 0.83 | 0.83 | 0.86 | 0.82 | 0.83 | 0.83 ± 0.02 | |
| 14天 | 0.92 | 0.85 | 0.87 | 0.93 | 0.92 | 0.90 ± 0.04 | |
| 28天 | 0.91 | 0.84 | 0.84 | 0.93 | 0.91 | 0.89 ± 0.04 | |
| 所有龄期 | 0.94 | 0.94 | 0.93 | 0.94 | 0.96 | 0.94 ± 0.01 | |
| RMSE (ksi) | 1天 | 0.59 | 0.35 | 0.55 | 0.64 | 0.59 | 0.54 ± 0.11 |
| 3天 | 0.77 | 0.66 | 0.74 | 0.76 | 0.77 | 0.74 ± 0.05 | |
| 5天 | 0.73 | 0.70 | 0.71 | 0.96 | 0.73 | 0.77 ± 0.11 | |
| 14天 | 0.70 | 0.70 | 0.71 | 0.65 | 0.70 | 0.69 ± 0.02 | |
| 28天 | 0.85 | 0.84 | 0.84 | 0.71 | 0.85 | 0.82 ± 0.06 | |
| 所有龄期 | 0.73 | 0.67 | 0.72 | 0.75 | 0.58 | 0.69 ± 0.07 |
图4:BOxCrete预测精度在测试集1上的分阶段改进。模型性能在六个训练阶段(P-I到P-VI)中展示,使用了来自123种砂浆和混凝土混合料在1、3、5、14和28天评估的抗压强度数据。左图:最终阶段(P-VI)的parity图,比较了n=60个独立测试样本的预测强度与实验强度(R² = 0.94,RMSE = 0.73 ksi)。标记形状表示养护龄期;误差线表示±1个标准差(总跨度=2σ)。与1:1线的强对齐表明跨水化阶段的高预测精度。右图:特定阶段的parity图(P-I到P-VI)和汇总面板(P-I到VI)显示了分散和偏差的逐步减少,早期阶段低估了高强度混合料,后期阶段紧密收敛到parity。底部:每个养护龄期的R²和RMSE随阶段迭代的演变显示出一致的改进,最大的增益出现在14天和28天,这是由于更好地表征了辅助性胶凝材料驱动的延迟水化反应。
BOxCrete用于混凝土的逆向配比设计
除了正向预测,BOxCrete框架还能够基于用户定义的抗压强度和总增温潜势约束对混凝土混合料进行逆向设计。这一能力对于旨在满足结构性能要求同时最小化早期配比设计中隐含碳的从业者尤其相关。为了演示此功能,BOxCrete被用于生成候选混合料,这些混合料在50 kg CO₂e/m³的总增温潜势区间内满足5000、6000、7000和8000 psi的最小抗压强度阈值。对于每个总增温潜势区间,模型返回一组50个可行的配比设计。
图S8展示了小提琴图,显示了关键混合料参数(包括水泥、粉煤灰、矿渣、水胶比和高范围减水剂用量)在不同总增温潜势区间和强度水平下的分布。随着强度要求的增加,模型逐步缩小了可行设计窗口,特别是在允许的水胶比和总胶凝材料含量方面,反映了与更高强度相关的更严格的力学约束。在较低的总增温潜势水平下,模型倾向于富含辅助性胶凝材料的配方,特别是那些含有更高矿渣含量和更高高范围减水剂用量的配方,这些在补偿降低的水泥用量的同时保持了足够的工作性和性能。
图S9显示了由此产生的组成设计空间,展示了胶凝材料含量、水胶比以及辅助性胶凝材料替代水平如何相互作用以满足指定的28天强度目标。这些混合料代表了模型为满足用户指定的强度和可持续性约束而探索的解空间。
除了点对点的强度-碳权衡,逆向设计框架还允许用户规定完整的强度发展曲线——包括随时间变化的目标S形曲线——并获得相应的混合料组成。通过将时间演变整合到设计过程中,BOxCrete实现了性能驱动的混凝土混合料定制,这些混合料在定义的可持续性标准下满足早期和长期强度要求。这扩展了该框架在現代低碳建筑中用于定制化、规范驱动的配比设计的适用性。
局限性与未来展望
尽管我们的开源AI模型在我们的开放获取公共数据集(包含500+个独特强度测量值)上表现出强大的预测性能(R² = 0.94,RMSE = 0.69 ksi),但这项工作存在两个关键局限性。
首先,当前数据集主要侧重于改变有限类型成分的体积比例。改变成分(如辅助性胶凝材料或化学外加剂)的性质、来源和质量将显著影响混凝土性能。因此,当前训练好的模型可能无法很好地适用于与训练集中使用的材料不同的其他材料。也就是说,这种开源方法标志着朝着开发更通用模型迈出的第一步,该模型可以通过考虑化学(例如反应性)和物理(例如粒径分布)性质来解释各种成分的质量。鉴于我们工作的开放获取性质,我们邀请混凝土研究界在这一初始数据集的基础上继续努力,争取开发出更通用的混凝土性能预测模型。
其次,当前模型主要考虑力学性能(抗压强度)和可持续性(总增温潜势)作为关键优化参数。然而,对于现场性能很重要的另外两个参数——工作性和耐久性——目前未被考虑。鉴于我们最初关注的是强度发展曲线,这些被认为超出范围。未来的研究应考虑优化和预测所有参数,以完全实现针对任何项目特定标准的鲁棒逆向配比设计。
尽管存在这些局限性,我们乐观地认为,这项研究为在开放获取数据集上开发和部署用于混凝土性能预测和配比设计的开源AI模型开辟了一条新途径。特别是,通过提供MIT许可证下的开源仓库,我们希望鼓励在商业软件中实施AI,这些软件可供混凝土供应商、材料供应商以及整个建筑行业使用,以加速使用标准和新型材料发现高性能、可持续的混凝土配比。
结论
现代混凝土是多种成分的复杂混合物——所有这些成分对最终混合料性能都有非线性影响。鉴于人们对优化和设计混凝土混合料以实现力学性能、可持续性、工作性和耐久性等多目标的兴趣日益增长,迫切需要开发基于人工智能/机器学习的方法。
本研究介绍了BOxCrete,一个开放获取的机器学习框架,旨在预测和优化具有高辅助性胶凝材料含量的混凝土混合料的抗压强度和环境性能。BOxCrete在一个系统化整理的数据集(包含123种独特混合料:69种砂浆和54种混凝土混合料)上进行训练,能够对平衡性能和可持续性的混合料设计进行多目标优化。我们从本研究中得出四个关键结论。
首先,基于高斯过程的模型在早期和晚期养护龄期均表现出高预测精度,28天时R²超过0.90并达到>0.94,RMSE为0.69 ksi。这种改进强调了模型捕捉粉煤灰和矿渣等辅助性胶凝材料延迟反应性的能力。
其次,将BOxCrete与贝叶斯优化相结合,可以识别出28天抗压强度超过10 ksi、同时保持总增温潜势在150-200 kg CO₂e/m³之间的配方。这些优化的混合料实现了>50%的水泥替代率,总增温潜势比等效对照混合料降低高达60%。
第三,模型的概率架构实现了可解释的、具有不确定性意识的预测,使决策者能够量化置信水平、优先安排数据收集,并有效地探索强度-可持续性之间的权衡。
最后,更广泛的数据多样性和标准化的报告对于在全球范围内扩展BOxCrete至关重要。整合区域数据集并采用迁移学习将增强跨可变辅助性胶凝材料化学性质和当地材料供应的适应性。
BOxCrete为人工智能辅助的可持续混凝土设计建立了一个可重复且可扩展的框架,加速了向低碳基础设施的进展。
实验方法
用于时间相关强度预测的机器学习框架
高斯过程:从数据中学习
高斯过程是一种基于复杂和噪声先验数据对函数进行建模的非参数化方法3030,并已在包括BoTorch4040和GPyTorch4141在内的框架中实现。与返回单一的确定性结果不同,GP提供了在给定观测输入-输出对的条件下,可能输出的后验预测分布。GP定义了函数上的分布,其特征是函数值的任何有限集合都遵循联合高斯分布3030。虽然多元高斯分布对有限维向量上的概率分布进行建模,但GP对函数上的分布进行建模。
形式上,GP由均值函数μ = m(X)和协方差(核)函数Σ = k(X, X')定义。给定一组输入点 X = [x₁, x₂, ..., xₙ],相关的函数值联合分布为:
f ~ N(μ, Σ) (1)
其中 f = f(X) = [f(x₁), f(x₂), ..., f(xₙ)],μ = m(X) = [m(x₁), ..., m(xₙ)],协方差矩阵定义为 Σ_ij = k(x_i, x'_j)。当 X = X' 时,该矩阵是半正定的。
GP回归的主要目标是根据观测到的训练输出 y 预测新输入 X* 处的未知函数值 f*。假设观测噪声 ε ~ N(0, σ_n² I),训练观测值建模为 y = f + ε。带噪训练观测值 y 和潜在测试输出 f* 的联合分布为:
[ y; f* ] ~ N( [μ; μ], [ Σ + σ_n² I, Σ_^T; Σ_*, Σ_** ] ) (2)
其中 Σ = k(X, X),Σ_* = k(X, X),Σ_** = k(X, X)。给定训练数据,f的条件分布(后验)为:
f* | y ~ N( μ* + Σ_*^T (Σ + σ_n² I)^{-1} (y - μ), Σ_** - Σ_*^T (Σ + σ_n² I)^{-1} Σ_* ) (3)
对于数据集 D = (X, y),后验GP可以写为 f|D ~ GP(m_D, k_D) (4),其后验均值为 m_D(x) = m(x) + k(X, x)^T (Σ + σ_n² I)^{-1} (y - m(X)) (5),后验协方差为 k_D(x, x') = k(x, x') - k(X, x)^T (Σ + σ_n² I)^{-1} k(X, x') (6)。后验方差相对于先验方差总是减少的,因为它纳入了观测数据,从而减少了认知不确定性。
多目标贝叶斯优化
在训练和验证了GP模型之后,就可以使用贝叶斯优化3131来识别能够实现所需输出属性的输入变量,其在航空航天工程4242、生物学与医学4343、土木工程2929、机器学习超参数优化44,4544,45和材料科学4646中都有应用。GP-BO框架提供了实现目标结果的概率估计,从而减少了所需的实验试验次数。在现实世界应用中,许多设计任务涉及多个竞争目标(m > 1),称为多目标优化。这些目标可以表示为 f(x) = [f₁(x), f₂(x), ..., f_m(x)] (7)。由于这些目标通常会相互权衡,因此通常不存在能够同时优化所有m个目标的单一解。相反,目标是表征最优权衡集,即帕累托前沿。为了评估候选帕累托集的质量,定义了一个参考点 r = [r₁, r₂, ..., r_m],其中 r_i 是第 i 个目标的最小可接受阈值。
一个广泛用于评估帕累托集质量的指标是超体积,它测量目标空间中由帕累托集 P = {y_i}{i=1}^k 支配且以参考点 r 为边界的 m 维体积。形式上,HV(P, r) = λ(∪{y_i∈P} [r, y_i]) (8),其中 λ 表示勒贝格测度,[r, y_i] 表示 r 和点 y_i 之间跨越的超矩形。为了在BO中优化超体积增益,常用的采集函数是预期超体积改进:
EHVI(x) = E[ (HV(P ∪ {f(x)}, r) - HV(P, r))+ ] (9),其中 (·)+ 表示截断为零。该量度量了评估新候选点 x 所导致的预期超体积增加。
当同时评估一批 q 个点时,目标向量变为 F(X) = [f(x₁), ..., f(x_q)] (10)。在这种情况下,由于在更高维度中计算超体积的计算复杂性,通常采用蒙特卡洛方法来估计EHVI3232。在这项工作中,我们使用 qLogEHVI 采集函数3333,它以数值稳定的方式计算对数变换后的EHVI目标,产生改进的数值性质,并实现了最先进的多目标优化性能,甚至优于基于熵搜索的方法。多目标贝叶斯优化——将高斯过程回归与EHVI相结合——有效地平衡了探索和利用,使得能够在高维设计空间中发现高性能的权衡方案。
模型架构
我们详细介绍了Ament等人(2023)2929最初提出的模型。鉴于传统机器学习模型的局限性,我们使用了一个概率模型 strength(x, t),该模型联合捕捉了抗压强度对混合料组成 x 和时间 t 的依赖性。为了强制执行混凝土在浇筑时刻强度为零的物理条件,对于观测到的和随机选择的未观测组成,添加了 t = 0 处的人工零强度观测值。
由于强度发展是高度非线性的——早期快速增长,后期趋于平稳——对时间输入应用对数变换 t → log t。这使得能够使用平稳核并提高预测性能2828。该模型的核结合了一个与组成无关、与时间相关的分量 k_time 和一个关于组成和时间的联合核 k_joint,得到复合核:
k((x,t), (x',t')) = α k_time(log t, log t') + β k_joint((x, log t), (x', log t')) (11)
其中 α, β > 0 是通过边际似然优化学习的方差参数3030。对于 k_time 使用指数二次核,而对于 k_joint 使用带有自动相关性确定的 Matern 5/2 核。这种结构允许模型学习一般的强度发展模式,同时保持对混合料间组成变化的敏感性。
模型性能评估
训练好的GP模型的预测性能使用两个指标进行评估:决定系数(R²)和均方根误差(RMSE)。R²值衡量自变量解释因变量方差的程度,值越接近1.0表示模型一致性越好(若为负则报告为0)。RMSE量化了预测值与观测值之间绝对误差的平均幅度。R²和RMSE的表达式为:
R² = 1 - Σ(y_i - ŷ_i)² / Σ(y_i - ȳ)²,RMSE = √(1/N Σ(y_i - ŷ_i)²) (12)
其中:y_i 表示观测输出,ŷ_i 表示预测输出,ȳ 是观测输出的均值,N 是观测总数。
材料与实验方法
材料
本研究中使用的材料采购自商业供应商。波特兰石灰石水泥用作主要胶凝材料。C级粉煤灰(包括C1和C2,7天R3放热量:316 J/g)、F级粉煤灰F1(7天R3放热量:209 J/g)以及Grade 100矿渣(包括S1、S2和S3,7天R3放热量:488 J/g)被用作辅助性胶凝材料以部分替代PLC。胶凝材料的化学成分使用X射线荧光根据ASTM D4326-134747进行量化,并报告在补充信息中。使用激光衍射仪获得胶凝材料的粒径分布,结果展示在补充材料中。
混合料开发
混合料开发遵循一个闭环实验设计框架(图1),结合了迭代实验室优化和基于GP的模型精炼。实验数据集包含123种独特配方:69种砂浆混合料和54种混凝土混合料,分六个顺序阶段开发。每个阶段系统地扩展了胶凝材料组成、水胶比、水泥替代水平、高范围减水剂用量和养护温度的参数空间——这些都是影响水化动力学、强度发展和环境影响的关键参数。
数据集1的混合料设计组成范围总结在表2中,数据集2-5的训练混合料总结在补充信息的表S2-S5中。图5图形化地总结了实验数据集的组成变异性及其对抗压强度的影响。上面面板中的散点图描绘了28天抗压强度如何随单个混合料参数(包括水泥、粉煤灰、矿渣、骨料级分、高范围减水剂用量、浆体含量、辅助性胶凝材料替代水平和水胶比)变化。每个子图呈现了不同的性能趋势:胶凝材料含量的增加和水胶比的降低通常产生更高的强度,而较高的辅助性胶凝材料含量或较高的高范围减水剂用量由于火山灰反应性和化学分散效率的差异而引入了变异性。
下面面板中的三元图代表了胶凝材料组成空间——水泥、粉煤灰和矿渣——并按1、5和28天的抗压强度着色。颜色梯度展示了强度随水化龄期的演变,突显了从熟料主导的早期强度(1天)到辅助性胶凝材料活化的后期性能(28天)的转变。这些可视化共同展示了水泥和辅助性胶凝材料比例如何共同决定跨养护阶段的强度发展轨迹。
数据集构建从第一阶段开始,该阶段侧重于砂浆规模实验以探索广泛的参数范围:
第一阶段专注于砂浆混合料(n=69),具有广泛的胶凝材料含量(240-2150 lb/yd³)、水胶比(0.20-0.50)、水泥替代水平(0-100%)、高范围减水剂用量(0-22.5 lb/yd³)和养护温度(4.5-22°C)。
第二阶段通过调整细骨料与粗骨料的比例(0.3-0.9)将有前景的砂浆配方按比例放大到混凝土。
第三阶段通过修改水泥替代水平(最高80%)、水胶比(0.30-0.40)和高范围减水剂用量(0-3 lb/yd³)来精炼按比例放大的混凝土混合料,然后将其重新引入数据集。
第四阶段通过改变胶凝材料含量(675-1125 lb/yd³)、水胶比(0.35-0.50)、辅助性胶凝材料用量(0-80%)和高范围减水剂用量(0-1.3 lb/yd³)来扩展设计空间。
第五阶段利用与多目标贝叶斯优化集成的GP模型生成新的混凝土配方,这些配方针对低总增温潜势和高强度进行了优化。这些AI推荐的混合料具有胶凝材料含量625-755 lb/yd³、水泥替代水平29-60%和高范围减水剂含量2.2-3.4 lb/yd³的特点。经过实验验证后,这些混合料被纳入训练集。
第六阶段通过进一步调整胶凝材料含量(440-760 lb/yd³)、水泥替代水平(29-52%)、水胶比(0.39-0.50)、高范围减水剂用量(0-3.4 lb/yd³)和养护温度(10-22°C)来微调最有前景的AI生成配方,以增强模型鲁棒性。
对于模型评估,数据集被分为80%的训练集和20%的测试集。通过比较GP模型在测试集上的预测值与实验测量的强度来评估预测性能。
表2:用于模型训练和验证的混合料组成摘要
| 阶段 | 混合料数量 | 类型 | 修改的参数 |
|---|---|---|---|
| I | 69 (M1-M69) | 砂浆 | 胶凝材料含量,水胶比,水泥替代率,高范围减水剂用量,养护温度 |
| II | 7 (C1-C4, C6-C8) | 混凝土 | 细骨料与粗骨料比例 |
| III | 5 (C10-C14) | 混凝土 | 辅助性胶凝材料用量,水胶比,高范围减水剂含量 |
| IV | 10 (C16-C20, C22-C25) | 混凝土 | 胶凝材料含量,水胶比,辅助性胶凝材料用量,高范围减水剂含量 |
| V | 4 (C28-C31) | 混凝土 | 胶凝材料含量,水泥替代率,高范围减水剂含量 |
| VI | 16 (C33-C53) | 混凝土 | 胶凝材料含量,水泥替代率,水胶比,高范围减水剂用量,养护温度 |
图5:组成多样性和胶凝材料协同作用控制强度发展。散点图显示了所有砂浆和混凝土混合料的分布,将28天抗压强度与关键混合料参数(包括水泥、粉煤灰、矿渣、骨料、高范围减水剂用量、浆体含量、辅助性胶凝材料替代率和水胶比)联系起来。宽广的、非单调的趋势反映了有意设计的高熟料和低熟料系统的多样化设计空间,构成了稳健模型训练的基础。三元图描绘了1、5和28天时的胶凝材料相分布(水泥-矿渣-粉煤灰),强度由连续颜色梯度表示。早期强度集中在富含水泥的组成中,而后期高强度区域转向平衡的三元混合料,突显了辅助性胶凝材料的逐步活化和协同水化效应。
抗压强度测试
抗压强度针对砂浆和混凝土试件进行测定。砂浆立方体(2×2英寸)按照ASTM C1094848进行测试,而混凝土圆柱体(4×8英寸)按照ASTM C394949制备和测试。砂浆样品在四个龄期(1、3、5和28天)进行测试,而混凝土样品在五个龄期(1、3、5、14和28天)进行测试。1天测试在脱模后立即进行,所有试件随后储存在维持98%相对湿度的养护室中,直到指定的测试龄期。
总增温潜势评估
开发的混凝土混合料的总增温潜势采用以下表达式在从摇篮到大门的基础上进行评估:
GWP(z_i) = g_mᵀ z_i + g_tᵀ z_i + g_pᵀ z_i (14)
其中 g_m、g_t 和 g_p 分别表示与原材料生产、运输和混凝土生产相关的温室气体排放。向量 z_i 表示混合料 i 中每种成分的用量28,5028,50。
GWP计算使用OpenConcrete进行,这是一种采用基于过程的LCA方法的在线生命周期评估工具。该工具模拟混凝土生产每个阶段的排放——包括原材料提取、研磨以及运输到搅拌站。补充图S1说明了主要混凝土成分的生命周期阶段。OpenConcrete允许用户指定自定义的混合料组成、运输距离和区域能源结构,从而实现上下文敏感的影响估算。
为了确保一致性和可比性,所有GWP值都归一化到每立方米混凝土49。