分析测试学报
《分析测试学报》2025 年 6 期 “化学计量学赋能现代分析仪器” 专辑全文上线!
在分析科学领域的发展进程中,现代分析仪器如同探索物质世界的“眼睛”,其性能的提升与功能的拓展始终是推动科学研究和产业升级的核心动力。随着人工智能、大数据与云计算技术的蓬勃发展,化学计量学迎来了前所未有的创新机遇。从便携式分析仪的现场快速检测,到在线过程分析仪的实时质量监控;从光谱成像技术的空间信息挖掘,到全二维色谱的复杂体系分离,化学计量学正以新算法、新策略革新仪器的数据分析模式,助力现代分析仪器实现了从“定性定量”到“精准溯源”的跨越,成为构建新一代智能分析仪器的理论基石与技术引擎。 为集中展示我国在化学计量学赋能现代分析仪器领域的最新研究成果,推动跨学科交叉融合与学术交流,《分析测试学报》特别策划“化学计量学赋能现代分析仪器”专辑。本专辑特邀天津工业大学卞希慧教授、中国农业科学院张良晓研究员、中国农业大学黄越副教授、湖南农业大学李跑副教授担任客座主编,精心组织数十位相关领域学者撰写的29篇高质量稿件,内容涵盖了化学计量学新算法在光谱、色谱、质谱等仪器中的创新应用,智能化分析仪器的集成系统研发,以及化学计量学在中医药、食品、环境、材料、化妆品等行业的实际问题解决方案。通过本专辑,我们期望为分析化学、仪器科学、计算机科学等领域的研究者提供一个思想碰撞与技术交流的平台,促进化学计量学理论创新与仪器技术升级的深度融合,激发更多前沿性、突破性的研究思路。 研究报告 01 基于UHPLC-QE-Orbitrap MS技术结合网络分析和化学计量学用于钴胺素C缺乏症的临床表型系统表征和预测 李泽宇,刘小荧,纪国富,周伟,姜盼盼,杨琴,吴本清,杨艳玲 DOI:10.12452/j.fxcsxb.240818321 摘要 采用UHPLC-QE-Orbitrap MS技术结合网络分析和化学计量学建立钴胺素C(cblC)缺乏症的临床表型系统表征和预测模型,利用尝试解开其复杂性。基于UHPLC-QE-Orbitrap MS技术在正、负模式下采集的血液非靶向代谢组学图谱,利用数据驱动网络算法Connect the Dots(CTD)快速搜索高连通的扰动代谢物,化学计量学算法学习其组别间复杂微小变化模式。通过对两种临床表型(癫痫和代谢综合征)的研究,结果表明CTD算法识别出的扰动代谢物子集展示出高度的临床表型特异性,且涉及的富集通路扰动均被报道与癫痫和代谢综合征的致病机制密切相关。进一步,CTD 算法能够量度高连通扰动代谢物间的协变信息,构建主要疾病模块系统地表征癫痫和代谢综合征的复杂致病机制。识别出的扰动代谢物作为特征变量集,采用5-折交叉验证,偏最小二乘判别分析、支持向量机和随机森林的受试者工作特征曲线下面积预测均值分别为0.849、0.897和0.909(癫痫),0.889、0.931和0.921(代谢综合征),马修斯相关系数预测均值分别为0.667、0.668和0.723(癫痫),0.686、0.696和0.787(代谢综合征)。上述结果表明了提出的计算方法在揭示cblC 缺乏症的临床表型复杂性和指导其个性化诊断策略方面的有效性。 02 淫羊藿与柔毛淫羊藿中朝藿定A、B、C和淫羊藿苷的近红外光谱定量分析及模型转移研究 冯佳豪,程泉翔,张智勇,章顺楠,陈景超,李文龙 DOI:10.12452/j.fxcsxb.250221110 摘要 淫羊藿和柔毛淫羊藿作为常用中药,其活性成分朝藿定A、朝藿定B、朝藿定C和淫羊藿苷对药理作用具有重要影响。该研究采集了淫羊藿与柔毛淫羊藿的台式与便携式近红外光谱数据,并结合HPLC测定其中的朝藿定A、朝藿定B、朝藿定C和淫羊藿苷含量,进而建立了偏最小二乘回归(PLSR) 模型与支持向量回归(SVR)模型。为实现台式近红外光谱数据与便携式近红外光谱数据之间的模型适配与转移,该研究探索了两种标样集选择方法:层次聚类法与SPXY算法,并应用两种模型转移方法:直接标准化法(DS)和分段直接标准法(PDS)。研究结果表明,标样集选择方法与模型转移方法对模型转移效果具有显著影响。通过配对t检验进一步验证,最佳转移模型的预测值与真实值之间无显著差异(P值均大于0.05),表明所建立的转移模型在不同仪器间具有较好的适应性。该研究为近红外光谱技术在淫羊藿与柔毛淫羊藿的定量分析与模型转移方面的研究提供了依据。 03 基于FT-NIR和ATR-FTIR光谱的铁皮石斛地理溯源 苏俊宇,杨绍兵,王元忠 DOI:10.12452/j.fxcsxb.250220105 摘要 为实现铁皮石斛地理来源的快速有效鉴别,基于衰减全反射傅里叶变换红外光谱(ATR-FTIR)和傅里叶变换近红外光谱(FT-NIR)技术,结合数据融合策略与化学计量学方法建立了铁皮石斛地理溯源模型。结果表明,FT-NIR和FT-NIR+ATR-FTIR融合数据集经二阶导数(2nd)预处理后构建的偏最小二乘判别分析(PLS-DA)和支持向量机(SVM)模型性能最好,测试集准确率均达到100.00%。基于二维相关光谱(2DCOS)构建的残差卷积神经网络(ResNet)模型在训练集、测试集和外部验证集上均实现了100.00%的准确率。该研究为铁皮石斛地理溯源和地理标志产品保护提供了科学依据。 04 血清HBsAg感染的Vis-NIR光谱模式识别研究 高乔基,吴振邦,徐茜,陈敏,刘文轩,曹诚诚,廖敬龙,欧超,潘涛 DOI:10.12452/j.fxcsxb.250227129 摘要 乙肝表面抗原(HBsAg)是乙肝病毒感染的重要标志物。该文建立了血清HBsAg感染的无试剂可见-近红外(Vis-NIR)光谱模式识别新方法。收集到临床血清样品1 243例(HBsAg阳性601、阴性642),采用训练-预测-检验实验设计,搭建了基于多尺度卷积、压缩-激励网络(SE Net)注意力机制和多尺度膨胀卷积的新型卷积神经网络(CNN)集成算法,连同经典的偏最小二乘-判别分析(PLS-DA)和普通浅层CNN算法,被用于建立HBsAg阳性和阴性血清的Vis-NIR光谱判别模型。该研究采用标准正态变量(SNV)变换进行光谱预处理。基于近红外区(780~1 118 nm)经SNV处理的光谱的PLS-DA模型和新型CNN模型取得更优的建模效果,新型CNN模型的灵敏度(SEN)达到99.3%,漏诊率(FNR)达到0.7%。结果表明,采用Vis-NIR光谱精准判别HBsAg阳性和阴性血清具有可行性,提出的新型深度学习算法可望应用于其他光谱分析领域。 05 图像预处理整合策略结合改进YOLOv8模型用于微藻种类识别 宁静,钟月妍,刘学英,谢丽霞,王童 DOI:10.12452/j.fxcsxb.250223113 摘要 为解决传统的微藻检测方法依赖于人工镜检、分析时间长且检测结果易受检测人员技术经验影响等问题,提出了一种图像预处理整合策略结合改进YOLOv8模型的深度学习方法用于微藻识别。采用高斯模糊、拉普拉斯算子和主成分分析多方法整合策略对微藻显微图像进行预处理。在改进模型中,引入SPD-Conv模块减少细粒度信息的丢失以提高低分辨率图像和小尺寸微藻的检测性能,采用Slim-neck结构减少参数数量和模型大小,同时加入SimSPPF加速模型收敛,提高运行效率。结果表明,多方法整合的预处理策略能够显著减少图像中的噪声,同时增强微藻轮廓清晰度。在相同条件下,改进YOLOv8模型的平均精度均值(mAP)达到92.2%,检测效率比原始YOLOv8模型提高了5.1%,且对于小尺寸微藻表现出更优的检测性能。相较于Faster-RCNN、SSD、RTDETR-l、YOLOv3、YOLOv5、YOLOv6和YOLOv7模型,改进YOLOv8模型的mAP分别提升了40.2%、6.8%、14.5%、1.2%、5.7%、4.7%和0.8%。该方法为开发微藻种类检测技术提供了有价值的参考。 06 基于近红外光谱与化学计量学的淫羊藿与柔毛淫羊藿基原鉴别及模型转移研究 冯佳豪,关志琪,张智勇,陈景超,章顺楠,李文龙 DOI:10.12452/j.fxcsxb.250221109 摘要 基于近红外光谱结合化学计量学方法,针对淫羊藿与柔毛淫羊藿的基原鉴别及模型转移进行了系统研究。首先,通过主成分分析(PCA)探讨两者的光谱差异,为后续分类建模提供参考。随后,建立支持向量机(SVM)和随机森林(RF)分类模型,并对比不同光谱预处理方法的影响,筛选出最佳预处理组合(SG+1st Der+SNV和SG+2nd Der+SNV),最终获得高准确率的基原鉴别模型(鉴别准确率为100%)。在此基础上,采用直接校正法(DS)和分段直接校正法(PDS)对模型进行校正,并通过层次聚类(HC)方法选择标准样品,成功提高了模型的适应性和迁移效果。研究结果表明,SVM模型在分类准确率和迁移稳定性方面均优于RF模型,为便携式近红外光谱仪在中药基原鉴别中的应用提供了科学依据。 07 基于FT-NIR和ATR-FTIR技术结合化学计量学方法快速、准确鉴别不同地理来源的草果 苏俊宇,杨绍兵,王元忠 DOI:10.12452/j.fxcsxb.241107514 摘要 该研究采用傅里叶变换近红外光谱(FT-NIR)、衰减全反射傅里叶变换红外光谱(ATR-FTIR)及二维相关光谱(2DCOS)技术,结合化学计量学与深度学习建立偏最小二乘判别分析(PLS-DA)和残差卷积神经网络(ResNet)判别模型,对7个主产区(221份)的草果样本进行快速、准确溯源。结果表明:ATR-FTIR光谱数据经二阶导数(2nd)+标准正态变换(SNV)预处理后建立的PLS-DA模型性能最好(95.31%),但FT-NIR光谱数据的最佳预处理为2nd。基于FT-NIR和ATR-FTIR的同步2DCOS图像建立的ResNet模型不需要筛选最佳预处理和复杂的数据转换,即可达到100%的准确率。其中,基于FT-NIR数据转化的同步2DCOS图像建立的ResNet模型的迭代次数最少、耗时最短、成本最低。该研究为鉴别不同地理来源的草果提供了一种快速、准确的新方法,为草果质量等级评价体系的进一步研究奠定了基础。 08 基于香气强度和活度值的贵州烟叶蜜甜香特征风味成分分析 罗俊华,龙勇,汪雪娇,蔡凯,林叶春,赵瑞娟,孙振春,曹建新 DOI:10.12452/j.fxcsxb.240912392 摘要 为了解贵州不同产区蜜甜香型烟叶的烟气特征香气成分,利用剑桥滤片捕集结合气相色谱-嗅闻仪-质谱仪(GC-O-MS)对9个烟气样品的挥发性化合物进行鉴定,通过多元统计手段结合相对香气活度值(ROAV)筛选烟叶烟气的蜜甜香韵特征香气成分,并探究凸显贵州烟叶蜜甜香特征风味的内在物质基础。结果表明:GC-MS共鉴定出144种挥发性成分,包括31种酮类、22种烃类、22种杂环类、22种酚类、15种酯类、13种酸类、11种醇类、6种醛类及2种其它组分。经GC-O-MS共嗅辨到69种香气化合物,香气特征主要呈现果香、奶香、焦甜香、花香、坚果香、蜜甜香等香韵,并筛选出1-戊烯-3-酮、乙酸苄酯、愈创木酚、乙位大马酮等25种香气活性化合物(ROAV≥1)。通过正交偏最小二乘法判别-分析(OPLS-DA),共筛选VIP>1的34种关键差异挥发性香气化合物。依据VIP>1(P<0.05)和ROAV≥1的条件,得到1-戊烯-3-酮、甲基环戊烯醇酮、乙基环戊烯醇酮、对异丙基苯酚、丁香酚、吲哚、反式橙花叔醇、乙位大马酮8种特征香气组分,偏最小二乘回归法(PLSR)结果进一步验证了上述8种香气物质对于整体香气轮廓的形成具有重要贡献,是贵州烟叶蜜甜香韵的关键香气化合物。研究结果可为阐明贵州地区烟叶烟气的香气特征提供参考。 09 基于机器学习的多种重金属离子同时检测 潘涛,赵永杰 DOI:10.12452/j.fxcsxb.240827346 摘要 该研究将机器学习技术与方波脉冲振荡伏安法(SWASV)相结合,来提高对Cd2+、Pb2+、Cu2+和Hg2+四种重金属离子的同时检测能力。传统的电化学方法在检测重金属离子时主要依赖于在一定浓度范围内寻找线性响应区间,并且在多离子环境下,SWASV曲线常出现干扰,导致准确性降低。该研究使用裸玻碳电极对不同浓度的金属离子溶液进行重复性的SWASV检测,对检测数据进行电流值、峰值电压和峰面积等重要参数进行特征提取,并结合极端梯度提升(XGBoost)和随机森林(RF)构建浓度预测模型,使用支持向量机(SVM)进行分类预测。分类算法中SVR的效果最佳(四种离子的ROC曲线下面积均大于0.95),相较RF模型XGBoost浓度预测模型预测值和真实值间的拟合度(R-Squared)均达到0.95以上。通过结合SWASV和机器学习,能够在复杂的离子混合体系中实现高精度的离子检测,并有效提高了检测结果的可靠性。本研究的成果为多重重金属离子的环境监测和污染控制提供了创新的解决方案,并在电化学分析领域展示了机器学习的应用潜力。 10 便携式拉曼光谱仪结合CGAN-Multi-CNN模型的矿物精确识别方法研究 向艳芳,石红,张家臣, 蔡耀仪 DOI:10.12452/j.fxcsxb.241205581 摘要 野外环境下天然未知矿物的快速识别受限于不同光谱设备分辨率差异、样本量不足导致的模型泛化能力弱以及高维复杂光谱特征的提取能力有限这三个难题。为了解决上述难题,该文设计并实现了一种多尺度卷积神经网络结合光谱样本生成的拉曼光谱分类模型,并联立便携式拉曼光谱仪实现了野外未知矿物的快速识别。首先,三次样条曲线拟合算法被用于实现不同设备所采集光谱的维数匹配,从而消除不同光谱设备之间采样分辨率的差异。其次,全球矿物光谱库包含1 648类矿物的5 668个光谱样本被送入生成对抗网络进行训练并产生15 000个扩增样本,从而缓解了数据稀缺性对模型分类性能的制约。此外,一种新的多尺度深度卷积网络被用于同步提取拉曼光谱的宽峰与窄峰特征,从而增强复杂光谱的表征能力。实验中将所提出的模型与k-近邻(k-NN)、支持向量机(SVM)和随机森林(RF)等几类经典机器学习模型对未知矿物的识别性能进行对比。结果表明,所提出的多尺度卷积神经网络结合光谱样本生成的分类模型对未知矿物拉曼光谱的判别准确率远超其他传统机器学习模型,其top-1和top-3的准确率值分别为93.26%和98.94%。使用所提出的模型结合便携式拉曼光谱系统对50类未知天然矿石样本进行了识别,其准确率达到100%,单个样本的识别时间仅为1~2 min,体现了该方法快速、精确和无需取样制样的优势。 11 基于FT-NIR技术结合化学计量学方法快速准确鉴别天麻不同栽培品种 苏俊宇,刘鸿高,王元忠 DOI:10.12452/j.fxcsxb.25012462 摘要 采用傅里叶变换近红外光谱(FT-NIR)与二维相关光谱(2DCOS)技术,结合化学计量学方法和深度学习算法,分别构建了偏最小二乘判别分析(PLS-DA)模型和残差卷积神经网络(ResNet)模型,快速准确鉴别了3种栽培品种天麻(Gastrodia elata Blum)样本(共计447份)。结果表明:FT-NIR数据经一阶导数(1st Der)和多元散射校正(MSC)组合预处理后建立的PLS-DA模型综合性能最好(准确率99.00%)。同时,基于FT-NIR同步2DCOS图像结合ResNet模型的鉴别方法,无需筛选最佳预处理和进行复杂的数据转换,即可实现对不同栽培品种天麻的快速精确鉴别(准确率100.00%)。该研究为鉴别不同栽培品种的天麻提供了一种快速、准确的新方法,可为天麻种质资源研究与新品种选育进一步奠定基础。 12 紫外光谱结合机器学习算法的祛痘类化妆品中4种禁用抗感染类药物快速筛查 向健华,芦丽,方方,石心红 DOI:10.12452/j.fxcsxb.24122328 摘要 基于紫外光谱结合机器学习算法,以甲硝唑、酮康唑、氯霉素和诺氟沙星4种常见禁用抗感染类药物为模型物质,建立了一种适用于祛痘类化妆品中非法添加禁用药物的快速筛查定性模型。该研究共采集167批祛痘类化妆品的紫外光谱,采用二维相关光谱(2D-COS)进行紫外光谱特征波段选择,通过对比22种光谱预处理方法、3种机器学习算法、3种数据集划分比例下各模型的效果,建立了分别含甲硝唑、酮康唑、氯霉素、诺氟沙星的阳性样品和阴性样品的五分类定性模型。结果表明,选择190~360 nm的紫外光谱,经标准正态变量变换(SNV)和Savitzky-Golay卷积平滑(SG)联合处理,选用训练集与预测集划分比例7∶3,采用误差逆传播(BP)神经网络算法建立定性分类模型时,模型训练集与预测集的准确率分别可达96.58%和98.00%,具有良好的预测与泛化能力。此方法能有效对化妆品中4种禁用抗感染药物进行快速准确筛查鉴别,不仅节省了检测成本与时间,提高了检测效率,为化妆品中非法添加禁用物质的检测提供了一种新型智能化的手段,也为未来不断更新迭代的非法添加禁用物质的快速筛查提供了新的思路和解决方案,且可助力现场快检。 实验技术与方法 13 紫外光谱结合化学计量学用于青稞酒的判别分析 张世芝,王茹,赵玉霞,张明锦 DOI:10.12452/j.fxcsxb.25012461 摘要 青稞酒是源自青藏高原、以青稞为原料的著名酒类饮品。然而,随着其市场不断扩大、品种不断增多,掺假问题已成为亟待关注的焦点。该研究聚焦于运用紫外光谱法快速鉴别地理标志保护产品互助青稞酒,提出主成分分析-支持向量机(PCA-SVM)和多模型偏最小二乘判别分析(MPLS-DA)两种方法。研究涉及中国互助青稞酒(CHQL)、其他品牌青稞酒(OBQL)和非青稞白酒(NQBL)3类样品。SVM采用两个主成分解决二元分类问题,而MPLS-DA对虚拟变量Y的每一列使用PLS1算法建模后,整合子模型的预测结果。PCA-SVM和MPLS-DA均成功构建了CHQL的判别模型。PCA-SVM能区分CHQL与OBQL、NQBL,但无法区分OBQL和NQBL。相比之下,MPLS-DA能正确识别所有3类样品,可以解决多分类问题。结果表明,所提方法可作为CHQL的一种简便快速鉴别手段,且MPLS-DA展现出更优的样品识别能力。 14 激光诱导击穿光谱结合机器学习的土壤沉积物重金属元素定量分析方法研究 杏艳,李茂刚,念娟妮,王婷,周奎,张天龙,李华 DOI:10.12452/j.fxcsxb.241118533 摘要 土壤沉积物中的重金属污染问题日益凸显,开发现场快速检测技术已成为确保污染监测有效性及推进环境治理不可或缺的手段。基于此,该研究提出了一种基于激光诱导击穿光谱技术(LIBS)结合机器学习算法的土壤沉积物重金属元素定量分析方法。首先,基于搭建的LIBS装置采集了土壤沉积物样本的光谱,探究了不同光谱预处理方法对光谱数据的预处理性能。紧接着基于变量重要性测量(VIM)对预处理后的光谱数据进行特征变量筛选。借助交叉验证对预处理方法、变量重要性阈值等参数进行了优化。基于优化的输入变量建立了土壤沉积物样本中3种重金属元素(Pb、Cu和Zn)的定量分析模型,并与其他校正模型的性能进行了比对。结果表明,该研究提出的VIM-RF校正模型表现出最佳的预测性能,对于Pb其R2p为0.993 0,RMSEP为0.029 8 mg/kg,对于Cu其R2p为0.981 0,RMSEP为0.112 7 mg/kg,对于Zn其R2p为0.992 0,RMSEP为0.166 2 mg/kg。由此可见,该文建立的方法有望为土壤沉积物环境重金属污染快速筛查及治理提供一定的理论参考依据。 15 基于便携式近红外光谱仪的鸡饲料中微塑料定性定量分析 刘一诺,霍正婷,杨仁杰,董桂梅,于亚萍,李留安 DOI:10.12452/j.fxcsxb.25021691 摘要 采用便携式近红外(NIR)光谱仪对被微塑料(MPs)污染的鸡饲料样品进行定性和定量分析。共制备了鸡饲料样品244份,包括未被MPs污染的鸡饲料样品61份和分别被聚丙烯(PP)、聚氯乙烯(PVC)和聚对苯二甲酸乙二醇酯(PET)污染的鸡饲料样品(质量分数均为0.01%~0.8%)183份。基于便携式近红外光谱仪(波长范围900~1 700 nm)采集所有样品的近红外光谱,随机选择1/3样品作为预测集,剩余2/3样品作为校正集,并采用偏最小二乘法建立定性定量分析鸡饲料中MPs的数学模型。对于定性模型:多元散射处理所建模型的性能最佳,对校正集和预测集样品的判别正确率分别为99.38%和100%;对于定量偏最小二乘回归(PLSR)模型:遗传算法(GA)在波长选择方面对提高鸡饲料中MPs定量模型的预测性能展现出显著优势,GA-PLSR模型对3种MPs的预测相关系数(Rp)均超过0.873 7,残余预测偏差比(RPD)均超过2.709 0。结果表明:基于便携式近红外光谱仪定性定量分析鸡饲料中MPs是可行的。该研究为饲料中MPs检测提供了一种低成本的快速检测方法。 16 基于虚拟样本生成的集成模型提升过期药物光谱识别精度 谭超,谭成,程斌,邹琴,陈慧,吴同,林瓒 DOI:10.12452/j.fxcsxb.25020465 摘要 基于近红外光谱定性识别假药需借助计算机和化学计量学从复杂、重叠、变动的光谱中提取特征信息和建立预测模型。在该类任务中,可能遇到某类样本相对不足的类别不平衡问题。基于生成虚拟样和集成建模,有望提升基于不平衡训练集上所得模型的识别精度。该文以阿奇霉素为研究对象,设计了一组实验样本集,采用基于虚拟样本技术的集成偏最小二乘判别分析模型构建了分类器,用于识别药物过期与否。在10个不同光谱区间上比较了单个模型和集成模型的性能,并讨论了不平衡比率、样本组成和集成规模的影响,集成分类器的灵敏度平均提高了约9%。通过实验确认了该集成策略的优势,在少数类样本过少时,所提出的集成算法更能显示出优势,该方法对其他类型体具有应用潜力。 17 基于挥发性有机物检验的血液种属鉴别方法与模型评估 张文骥,李昊洋,丁海媛,韩祺瑞,宋辉,罗颖超 DOI:10.12452/j.fxcsxb.241028489 摘要 为拓展挥发组学在血液种属鉴别(BSI)领域的应用,该研究测定了多种物种血液的挥发性有机物(VOCs),构建了机器学习分类模型并评估其性能。使用顶空固相微萃取/气相色谱-质谱(HS-SPME/GC-MS)检测8种常见物种血液中的VOCs,利用偏最小二乘判别分析(PLS-DA)和正交偏最小二乘判别分析(OPLS-DA)筛选潜在标志物,使用9种常见机器学习分类算法构建一对多分类模型,进行基准测试、超参数调优、算法性能评估,并评估重采样方法和标志物变量选择的影响。筛选出人类与7种不同动物血液种属特征相关的潜在标志物共17种,基准测试获得最优算法为K-最近邻(KNN)算法,分类模型最优超参数组合为:K值为5,距离加权核函数为三权函数,闵氏距离参数p为0.324 0;验证集下最优模型准确度、曲线下面积、布里尔分数分别为0.928 4、0.997 0、0.057 6。使用所有成分变量的模型与仅使用潜在标志物变量模型的结果无显著差异(t检验p > 0.05),不同重采样方法模型结果无显著差异(t检验p > 0.05)。该研究表明,挥发组学分析在血液种属鉴别方面极具潜力,潜在标志物可靠性强、模型准确度高、抗干扰能力强。 18 基质辅助激光解吸-飞行时间质谱结合随机森林融合模型用于白术的产地溯源分析 王颖琦,赵汉卿,方焕,王童 DOI:10.12452/j.fxcsxb.240929422 摘要 该研究利用基质辅助激光解吸-飞行时间质谱(MALDI-TOF MS)分析技术结合两种改进的随机森林融合算法对白术进行产地溯源分析。首先通过MALDI-TOF MS获取了来自3个省份白术样本的质谱数据,每个样本的数据大小为1×234 154。鉴于样本数据量庞大,故采用数据分箱策略进行初步简化(1×6 600)。然后通过设定的累计方差贡献率阈值进行主成分分析,对数据进行降维。利用降维后的数据构建自适应增强极端随机森林模型(AERF)和自适应增强平衡随机森林模型(ABRF),最终通过模型融合策略获得AERF-ABRF模型对白术进行产地溯源。结果表明,所提出的基于降维数据构建的AERF-ABRF能够准确区分来自3个省份的白术样本,其对测试集和预测集的分类准确率均达到100%。同时,与单一判别模型相比,模型融合策略具有更高的分类准确率。 19 结合近红外光谱和模型更新的苹果品质无损检测 吴琪,陈孝敬,石文,谢忠好,苏来金,黄光造 DOI:10.12452/j.fxcsxb.241118535 摘要 品种的差异会影响苹果的可溶性固形物含量(SSC)和近红外光谱(NIRS)特征,进而导致在实际应用中以一个品种苹果建立的SSC光谱校正模型难以较好地预测其他品种的苹果。该研究使用阿克苏红富士苹果(批次1)开发了偏最小二乘回归(PLSR)校正模型,利用模型更新方法对青岛绯红苹果(批次2)进行预测。结果显示,以一阶导数(1D)和竞争自适应重加权采样(CARS)相结合开发的PLSR校正模型可以有效预测批次1的SSC,预测相关系数(Rp)和预测均方根误差(RMSEP)分别为0.972 8和0.383 8 °Brix,但批次1的 PLSR 模型难以预测批次2的SSC。因此使用校准更新、斜率/偏差校正(SBC)、动态正交投影(DOP)3种方法更新模型,同时研究不同更新样本数对更新效果的影响。结果显示,3种方法更新后模型预测结果的RMSEP均明显下降。其中,SBC方法取得最好的结果,使用20个新样本进行更新后,模型对批次2样本测试集预测的RMSEP从1.075 6 °Brix下降至0.233 4 °Brix。从实验结果可以看出,模型更新方法能够有效解决模型在预测不同品种苹果时表现不佳的问题,提升模型稳健性,为实际应用中SSC检测模型的更新维护提供重要指导。 20 基于XRF的CARS-GAF-MobileNet铝合金牌号分类研究 吕树彬,万优,李福生,杨婉琪 DOI:10.12452/j.fxcsxb.241027487 摘要 铝合金以其卓越的特性在工业上得到广泛应用,对铝合金的牌号进行准确分类能够进一步推动制造业等领域的发展。该文提出了一种新的铝合金X射线荧光(XRF)光谱分类框架CARS-GAF-MobileNet(CGM)。首先,采用XRF光谱仪获取铝合金样本的XRF光谱数据;然后,提出一种基于多元素校正的竞争性自适应重加权采样(CARS)算法对数据进行变量筛选;随后,使用格拉姆角场(GAF)将一维光谱转换为二维光谱图像,并通过色彩映射将灰度图转为RGB图;最后,将转换后的二维光谱图作为Mobilenet-V3模型的输入,对铝合金样本进行分类。实验结果表明,所提出的CGM框架的最终分类准确率可以达到94.3%,能够对不同牌号的铝合金样品进行精确识别。CGM是一种具有潜力的铝合金牌号识别框架,对铝合金分类问题具有较好的理论指导和应用价值。 21 基于近红外光谱的流化床制粒过程流化态值反馈控制系统的构建与性能评估 闫豪洁,陈杭,邱林钧,卢立明,瞿海斌 DOI:10.12452/j.fxcsxb.250304140 摘要 流化床制粒在中药颗粒制剂的生产中应用广泛,但传统的制粒过程依赖操作人员对流化床内物料状态进行观察,并依据经验手动调节风量与喷液速度,存在耗时耗力、智能化水平不足等问题。为此,该文构建了一种基于近红外光谱的流化态值反馈控制系统,并对其控制性能进行了评估。该系统通过实时采集流化床制粒过程中的近红外光谱,分析物料运动状态并计算流化态值指标;随后,系统根据流化态值指标,按照预设的控制规则,自动调节喷雾系统中蠕动泵转速,从而实现喷液速度的动态控制,达成流化态值实时反馈控制。实验结果表明,该反馈控制系统能在流化状态恶化时有效预防流化床失稳现象的发生;在流化态值良好时加快喷液,节省制粒时间,提高生产效率。与手动控制方式相比,自动控制系统的喷液时间减少了20%以上;在流化态值控制方面,该系统与手动控制相当。其在喷液时间优化方面则展现出显著优势。此外,该控制系统在进风温度、进风量、雾化压力等工艺条件发生改变的干扰工况下,均表现出良好的适用性和稳定性。因此,所建立的基于近红外光谱的流化床制粒过程流化态值反馈控制系统,具有稳定性和可靠性,可为流化床制粒的智能制造提供有力的技术支持。 22 基于CNN框架的LSTM融合优化模型用于芒果干物质的近红外光谱分析 林雪梅,蔡肯,黄家立,蒙芳秀,林钦永,陈华舟 DOI:10.12452/j.fxcsxb.25021897 摘要 芒果中的干物质(DM)含量是评判芒果品质的重要指标之一。该文利用近红外光谱法(NIR)检验和预测芒果的干物质含量。主要基于卷积神经网络(CNN)框架,研究其结构参数网格数值化筛选方案,融入长短期记忆网络(LSTM)完成参数协同优化,构建CNN-LSTM融合优化模型。实验过程中,通过构建浅层CNN建模框架,针对CNN-LSTM模型的核心参数进行局部规模的超参数联合调试。模型训练和模型测试结果显示,CNN模型和CNN-LSTM模型的最优化预测结果均明显优于常规的线性或非线性模型。该研究除了确定最优模型以外,还提供了更多可选的模型优化参数组合,有望在芒果的生产和培育过程中得到应用。浅层CNN框架融合LSTM优化模型及其参数网格数值化筛选方案能够为快速检测芒果果实中的干物质含量提供化学计量学技术支持。 23 Vis-NIR光谱无约束MW-PLS方法及其在血清胆红素分析的应用 谭辉,潘涛 DOI:10.12452/j.fxcsxb.25021385 摘要 移动窗口-偏最小二乘(MW-PLS)采用有约束的双参数(起点波长、波长数)搜索,遍历所有子波段,是光谱分析的有效波段筛选方法。该文将MW-PLS扩展为无约束参数搜索,记为无约束MW-PLS(UMW-PLS),其兼顾前向和后向优化,可优选双波段组合。分别采用MW-PLS和UMW-PLS方法,建立了血清胆红素指标间接胆红素(IBil)、直接胆红素(DBil)和总胆红素(TBil)的可见-近红外(Vis-NIR)光谱模型。对于每个指标,最优2nd UMW-PLS和3rd UMW-PLS模型分别优选到双波段和三波段组合,严格优于最优MW-PLS模型,波长复杂性依次下降。经外部检验,三指标的最优3rd UMW-PLS模型的偏差性能比(RPD)分别为3.0、3.2和5.8,表明Vis-NIR光谱可用于胆红素指标IBil、DBil和TBil的无试剂同时定量分析。提出的UMW-PLS是一种简洁有效的多波段优选策略。 24 基于矿质元素含量结合机器学习的陈皮产地鉴别研究 周熙,刘倩宝,卢俏丽,张春华,康怀腾,刘畅,黄芳,吴惠勤,罗辉泰 DOI:10.12452/j.fxcsxb.241201565 摘要 采用电感耦合等离子体质谱法测定了新会与广西255批次陈皮样品中的矿质元素含量,利用正交偏最小二乘法判别分析研究不同产地陈皮中的差异元素。采用Z-score标准化、最大最小归一化、均值归一化和最大绝对值缩放4种数据预处理方法,结合随机森林、决策树、支持向量机与梯度提升法建立陈皮产地判别模型。结果显示,41种矿质元素中,Na、Sn、Y、Ba、Er、Ho、Yb、Dy、Ni、Li、Gd、Tb、Sm、Nd、Rb元素是新会陈皮与广西陈皮的主要差异元素。4种机器学习模型中,支持向量机模型预测结果最佳。支持向量机模型中,数据在Z-score标准化、最大最小归一化、均值归一化3种处理方式下的训练集与测试集具有相同的准确度,分别为100%与96%,F1值为0.96,模型准确度高。该研究基于矿质元素含量结合机器学习的方法,在陈皮产地鉴别方面具有高准确性与可靠性,为陈皮质量控制提供了技术支撑,也可为中药材产地溯源提供参考。 25 基于近红外光谱技术的电子烟油中多种添加剂含量的快速定量检测研究 黄若冰,刘易佳,郭亚勤 DOI:10.12452/j.fxcsxb.241023478 摘要 该研究选取160份市售及自配的电子烟油样本,采用傅里叶近红外光谱仪进行光谱扫描,并通过与化学真实值对比,实现了近红外光谱技术(NIRS)对电子烟油中苯甲酸、尼古丁、WS-23、WS-3、丙二醇、丙三醇6种成分含量的准确预测。利用TQ Analyst软件,采用偏最小二乘法(PLS),以一阶导数结合Savitzky-Golay平滑进行光谱预处理,基于多重相关光谱确定波段区间,建立了6种添加剂的近红外定量模型。结果显示,尼古丁、苯甲酸、WS-23、丙二醇、丙三醇5种模型的校正相关系数(R2C)与预测相关系数(R2P)均高于0.98,可以比较准确地预测电子烟油中5种添加剂的含量;WS-3模型的交叉验证相关系数(R2CV)为0.95,相对偏低,模型仍有优化空间。该研究建立的定量模型为电子烟油质量的快速评价提供了有效工具。 26 评价中药指纹图谱批次相似性的h多重相似性指数 朱浩宇,顾荣领,杜士杰,徐路 DOI:10.12452/j.fxcsxb.25011118 摘要 该研究提出一种新的h多重相似性指数(HMSI)用于中药指纹图谱的批次一致性评价。h多重相似性指数的定义如下:基于批次内所有样品的两两相似性(取值在[0,1]之间),如果有M%的两两相似性不低于M%,则该批次样品的h多重相似性指数为M%。基于麦冬和清胃黄连丸的高效液相色谱(HPLC)指纹图谱,采用h多重相似性指数方法进行了不同批次中药指纹图谱的一致性评价,并与平均相似性和中位数相似性进行了比较。结果表明,h多重相似性指数适用于HPLC指纹图谱的一致性评价,在批次一致性评价方面比平均相似性和中位数相似性更加合理。该指数不仅考虑了批次内样品的相似性强度,还考虑了高相似性覆盖的样品数目,是一种简单、稳健且更为全面的中药指纹图谱批次一致性评价指标。 综述 27 基于机器学习的质谱成像法庭科学应用进展 张硕,满瀚泽,郭冲,赵雅彬,李展平 DOI:10.12452/j.fxcsxb.240929423 摘要 鉴于犯罪手段的不断演变,法庭科学亟需一种能同时分析物证形态和成分的技术。质谱成像在法庭科学中提供了一种高灵敏度、高特异性、检测范围广泛且近无损的分析方法。结合机器学习后,质谱成像能够分析获取的丰富数据并提取关键化学信息,尤其是在指纹、文件、理化和生物物证检验方面展现了显著的实战潜力。该文综述了质谱成像数据分析的研究进展,包括个体溯源、遗留时间推断、图像增强等关键领域,为法庭科学解决实际问题提供了一种强大的工具。尽管面临操作复杂性和算法解释难度的挑战,但该技术将在未来的复杂物证分析中发挥关键作用。 28 化学计量学在水体微塑料识别中的应用 彭浩然,万希哲,郭乐霞,姜天琪,李梁,员东丹,童银栋,崔晓宇 DOI:10.12452/j.fxcsxb.24121109 摘要 塑料污染是人类当今面临的重大环境挑战,大量塑料废弃物可通过各种途径进入水体环境,老化裂解成尺寸小于5 mm的微塑料(MPs)。MPs广泛分布于水体中,对生态系统和人类健康构成潜在威胁,因此,开发有效的分析方法识别和检测MPs至关重要。现有的MPs识别方法主要包括目视法、光谱法和化学成像法,三者虽各有优势,但普遍存在耗时长、成本高、主观性强等局限性,限制了技术发展。新兴的化学计量学技术可以高效处理和自动化分析海量数据,为MPs的识别提供了新的工具。研究表明,传统MPs识别方法结合化学计量学技术可以使识别准确率从60%提升至98%,并实现自动化数据分析,极大提高了效率和准确性。此外,原位检测技术的发展有助于降低采样成本,使得频繁且长期的MPs监测成为可能。该文综述了现有的水体MPs识别方法及其局限性,介绍了化学计量学的工作流程,并讨论了其在MPs识别中的应用现状和最新进展,强调了其在数据处理、技术优化以及定性定量分析中的关键作用。最后,指出了化学计量学技术当前存在的局限,并为其未来发展提出了建议与展望。 29 光谱数据增强方法及其应用进展 唐磊,茅晔辉,蔡婧,刘恒钦,闵红,安雅睿,刘曙 DOI:10.12452/j.fxcsxb.25020569 摘要 随着机器学习在光谱分析中的深入应用,模型训练面临数据样本稀缺、类别分布失衡等挑战,制约模型的泛化性能并引发过拟合风险。该文综述了2017年以来国内外公开文献,将光谱数据增强方法归纳为非深度学习数据增强方法和深度学习数据增强方法两大类,揭示了其从浅层数据扩充向深度生成建模的演进趋势。非深度学习的数据增强方法通过光谱变换和光谱合成来实现数据扩展,凭借其计算效率优势,在工业过程监控、中药材溯源及药物与食品质量检测等小样本场景中展现出良好的适用性。深度生成模型主要为生成对抗网络(GAN)及其衍生方法和改进型自编码器(AE)。GAN通过对抗博弈机制生成与原始数据具有结构相似性和分布一致性的增强样本,在医疗影像诊断、精准农业和材料分类等高精度建模场景广泛应用;改进型AE通过潜在空间表征学习捕获数据本质特征,其生成数据既保持原始分布特性又具备特征鲁棒性,在化学物质鉴定和土壤成分检测等高维数据处理任务中优势显著。该综述指出了现有数据增强方法的局限性,并对未来发展方向进行了探讨。 https://qikan.chaoxing.com/mag/shelfmags=6b5c39b3dd84352b2e253c34273e3a1b