《Marine Pollution Bulletin》文章:基于主成分分析-随机森林模型的微塑料荧光光谱处理方法
微塑料污染监测面临的关键挑战在于不同种类微塑料的激光诱导荧光(LIF)光谱存在严重重叠,传统方法难以准确识别与定量。针对这一难题,大连海事大学宋永欣教授团队开发了基于主成分分析-随机森林(PCA-RF)的算法模型。该模型首先通过主成分分析提取荧光光谱的关键特征,将高维光谱数据转化为具有代表性的主成分得分,提取荧光光谱的前三个主成分特征,随后利用集成学习算法随机森林对重叠的主成分得分进行训练,通过构建多棵决策树并进行集成学习,有效解决了传统方法难以区分的重叠光谱问题。另外,研究团队还通过将袋外误差分析和主成分载荷分析联用的方法确定了最具特征识别的光谱波长范围,增加了PCA-RF模型的可解释性。
研究团队使用聚乙烯、聚苯乙烯和聚丙烯三种微塑料以及它们的混合样本作为测试样本验证PCA-RF模型的可靠性,验证结果表明PCA-RF模型对微塑料识别的准确率高达99.7%,PCA-RF模型对样本中三种微塑料的预测浓度与其实际浓度的相关系数超过0.99,且在真实海洋微塑料样本中同样表现出优异的识别性能。
PCA-RF模型为严重重叠荧光光谱的解析提供了高效解决方案,在微塑料定性和定量分析中展现出显著优势。尽管该方法受材料老化、生物膜形成等环境因素影响,但通过样本前处理可部分消除干扰。未来研究将着重提升算法抗干扰能力,并探索与其他机器学习算法的融合以进一步提高识别精度。该研究成果有望成为海洋微塑料大规模监测的有力工具,为环境污染防控提供重要技术支持。。

来源:Marine Pollution Bulletin