近红外光谱波长优化方法及其在高脂血症指标分

发布时间:2019-09-26 00:52

第一章 绪论


1.1 研究背景和意义
作为引起心脑血管病变的最重要因素之一高脂血症( hypelipidemia)近年来受到很大关注。高脂血症又称为血脂异常,它是指人体内的脂肪代谢出现异常, 促使血液中动脉粥样硬化的脂质总胆固醇(total cholesterol, TC)、低密度脂蛋白胆固醇(low density Lipoprotein-cholesterol, LDL-C)、甘油三酯(triglyceride, TG)、载脂蛋白 B(APO-B)和(或)脂蛋白(PLA)增高, 而抗动脉粥样硬化的脂质高密度脂蛋白胆固醇(high density Lipoprotein-cholesterol, HDL-C)、和(或)载脂蛋白 A(APO-A)降低[1]。高脂血症是脂质代谢出现紊乱的一种表现,它是冠心病、脑梗塞、缺血性心肌梗死等一些慢性疾病发生和发展的主要危险因素, 也是导致患上高血压、糖尿病等慢性疾病的一个重要而危险因素[2]。由本病所引起的心脑血管等疾病往往发病率高,病情发展凶险,危害后果大,其死亡率大约要占到人类总死亡率的一半左右。跟据现代医学疾病监控的大量数据表明,在全世界每天有近 4000 人的死亡原因是由高脂血症引发的心脑血管疾病所导致的。每年我国因为高脂血症引所引起的糖尿病、中风、偏瘫、致残、脑梗死、心肌梗死等的人数呈逐年上升趋势。据不完全统计,血脂异常的患者在我国已经达到 1.6 亿之多[3]。高脂血症形成的原因是由很多种因素导致的,其中由于极低密度脂蛋白产生的过多或者不能够及时被清理、过多极低密度蛋白转变成为低密度脂蛋白,是高脂血症产生发病的基本病机;高脂血症被分为原发性与继发性两种。原发性高脂血症产出的常见原因:
(1)遗传原因:因为某些遗传的原因,如基因的缺陷,导致细胞表面的脂蛋白受到体缺陷与细胞内部某些酶的缺陷,或者是脂蛋白或者是载脂蛋白的分子上受体或这酶的缺陷。
(2)饮食原因:已经证实,大部分的高脂血症都和饮食因素相关联的,饮食因素已经是高脂血症产生的一个重要危险因素。
……..


1.2 近红外光谱在临床检验的应用现状
近红外技术对生化指标检测分析的研究在上世纪九十年代中期就开始了,相关于应用近红外光谱技术,对高脂血症检测指标总胆固醇和甘油三酯的检测分析研究已经有报道。美国的阿诺德研究小组[36]利用近红外光谱技术,对人的 242 个血清样本中的胆固醇、葡萄糖、甘油三酯、乳酸、尿酸和总蛋白等成分进行了分析研究,研究结果表明,胆固醇 SEP 为 12.1 mg dL-1(0.31 mmol L-1),甘油三酯的 SEP 为 10.4mg dL-1(0.16 mmol L-1) ;德国的海泽研究小组[37~39]对 125 个包含有胆固醇、葡萄糖、甘油三酯、总蛋白及尿酸成分的血浆样本进行了分析研究,结果表明,在波段范围为6001-5508 cm-1(1666-1815 nm)和 4520-4212 cm-1(2212-2374 nm),胆固醇 RMSEP为 8.3 mg dL-1(0.22 mmol L-1);在波段范围为 6001-5508 cm-1(1666-1815 nm)和4520-4212 cm-1(2212-2374 nm),甘油三酯的 RMSEP 为 13.7 mg dL-1(0.22 mmolL-1);中国计量学院的陈华才等人[40]建立了43个包含有7种生化成分的人血清的定标预测模型,其中包含的成分有胆固醇、葡萄糖、甘油三酯、总蛋白、载脂蛋白 B、白蛋白和低密度脂蛋白胆固醇,预测模型对定标样本集中胆固醇与甘油三酯预测值和参考值的相关系数 R 分别是 0.90、0.96,相对应的预测校正标准误差RMSECV 分别是 15 mg dL-1(0.39 mmol L-1)、21.6 mg dL-1(0.34 mmol L-1);以上这些报道说明了血液、血清中的胆固醇和甘油三酯的含量与近红外光谱之间存在很大的相关性,但是所报道的实验结果预测精度都不太高,需要进一步提升。
………


第二章 相关准备知识


2.1 常用化学计量学方法
现代的近红外光谱分析技术是通过将计算机科学、光谱测量技术和化学计量学方法有机的结合在一起而发展起来的,近红外光谱所反应的样本基团、组成成分或者物态信息被运用标准或者公认的实验室普遍采用的方法测得的组成成分含量数据,通过运用化学计量学的技术方法确定校正模型,再利用对未知样本近红外光谱的测定与确定的校正模型,来快速预测未知样本的组成成分或者性质的一种技术分析方法。与通常的分析技术不相同的是,近红外光谱分析技术是必须要通过在确立定标模型的基础上来达到对未知样本的定性或定量分析目的。近红外光谱技术的分析过程主要有以下 3 个步骤组成:首先是要选出具有代表性的样本并对样本的近红外光谱进行测量;其次是利用标准或者公认的参考方法测量确定待测组成的成分或者性质的数据;再次是选用合适的化学计量方法将测量的光谱数据与基础数据之间建立校正模型;最后则是对待测未知样本的组成成分或性质的测定。通过以上的工作过程不难发现,化学计量学方法、光谱实验和应用模型是光谱分析的三个重要组成部分,只有将这三者有机的结合起来,才能够满足简便、直接和快速分析的技术要求,这其中优化的化学计量学与应用模型是光谱分析的最为关键之处,而数学建模的方法研究则是主要研究热点[44~46]。在通常的近红外光谱分析中,常用的定量分析的方法包括有:偏最小二乘法(PartialLeast Squares, PLS)、主成分回归法(Principal Component Regression, PCR)和多元线性回归法(Multivariable Linear Regression, MLR)等多种分析方法[47]。
………..


2.2 灵敏度、特异性和总判别率
为了考察检验样本 TC 和 TG 的光谱预测值的定量识别高脂血症样本的能力。参照临床检验的标准,TC 和 TG 的正常值参考范围分别为 3.38-5.20、0.55-1.70(mmol L-1),两个指标都处于正常值范围内的称为阴性,其余的情况属于阳性。TC 和 TG 的常规方法实测值作为判定阴性、阳性样本的标准。分别计算检验样本的 TC、TG 光谱预测值对应的真阴性、假阳性、真阳性、假阴性的样本个数,分别记为 a, b, c, d,临床特异性是衡量试验正确地判定无病者的能力,特异度是将实际无病的人正确地判定为真阴性的比例。临床灵敏度可用来衡量某种试验检测出有病者的能力,灵敏度是将实际有病的人正确地判定为真阳性的比例,总判别率为衡量某种试验检测正确性的能力,则光谱方法用于定量识别高脂血症样本的特异性、灵敏度。
………


第三章 近红外光谱分析的建模体系和波长优化方法研究....13
3.1 建模体系........13
3.2 波长优选方法 .....17
3.2.1 连续波长优选-改进的移动窗口 PLS 方法 ....17
3.2.2 准连续波长优选-等间隔组合 MLR 方法 ......21
3.2.3 离散波长优选-伙伴波长方法 ......27
3.3 应用:土壤锌的近红外光谱分析....28
第四章 近红外光谱应用于高脂血症临床指标的无试剂快速分析....52
4.1 实验材料、方法 .......52
4.1.1 样本........52
4.1.2 高脂血症临床指标的常规方法测定 ....52
4.1.3 血清样本光谱实验........55
4.2 结果与讨论........59
4.3 方法比较分析 .....87
第五章 总结与展望......90


第四章 近红外光谱应用于高脂血症临床指标的无试剂快速分析


4.1 实验材料、方法
从广东省某医院收集到 296 份人血清样本。样本的 TC、TG 分别采用常规临床生化检验的酶法(CHOD-PAP)、酶法(GPO-PAP)测定。测量仪器为 RocheModular PPI 全自动生化分析仪(瑞士 Roche 公司)如图 4-1 所示。其实测值作为光谱分析的建模集和检验集的参考值。血清中总胆固醇的分子式为 C27H46O,是由游离胆固醇(free cholesterol,FC)和胆固醇酯(cholesterol ester,CE)两部分组成。血清中胆固醇酯能够被胆固醇酯酶水解成为游离胆固醇与游离脂肪酸(FFA),通过胆固醇氧化酶的氧化作用,胆固醇会生成 Δ4-胆甾烯酮与过氧化氢,在 4-氨基安替比林和酚存在时,H2O2经过氧化物酶催化,通过反应产成苯醌亚胺非那腙的红色醌类化合物,该物质颜色的深浅和标本中 TC 含量成正比。

……..


结论


本文研究近红外光谱在上述生物医学分析中所涉及到的化学计量学方法,包括具有稳定性的新型建模体系的构建,连续型(改进的移动窗口偏最小二乘,MW-PLS)、准连续型(等间隔组合多元线性回归,EC-MLR)和离散型(伙伴波长组合)波长筛选方法的研究,并设计相关的计算机算法平台用于模型实验。以土壤锌的近红外光谱分析为例,检验了上述建立的方法体系的可行性;进一步应用于人血清的高脂血症指标(TC、TG)的近红外光谱分析。在下列几方面取得成果:
1. 基于随机性、相似性和稳定性,构建包括定标、预测和检验过程的新型建模体系,建立可靠的分析模型。基于定标集和预测集的多个划分,建立具有稳定性的改进 MW-PLS 方法、EC-MLR 方法和伙伴波长组合方法等。研究光谱波长选择的稳定性、等效性等新问题。成功应用于土壤中锌含量的近红外光谱分析。
2. 利用改进的 MW-PLS 方法进行人血清的高脂血症指标(TC、TG)的连续型近红外波长优选。通过模型实验,比较所有连续波段的平均预测效果(M_SEPAve)和预测稳定性(M_SEPStd),进一步确定最优波段和等效最优波段。TC 对应的最优波段是 1556~1852 nm,等效最优波段 53 个;TG 对应的最优波段是 1540~1858 nm,等效最优波段 390 个;并找到 TC、TG 公共的等效最优波段为 1556~1852 nm,作为两个指标的共同信息波段。在检验集中,采用公共等效最优波段 PLS 模型对 TC、TG 指标进行检验;光谱预测值与临床实测值的检验效果(V_SEP、V_RP)分别为 0.184 mmol L-1、0.988(TC)和 0.097 mmol L-1、0.997(TG);进一步得到光谱预测对于高脂血症诊断的灵敏度、特异性和总判别率分别为 94.8%、86.8%和 91.7%。
…………
参考文献(略)

如果您有论文代写需求,可以通过下面的方式联系我们
点击联系客服

提交代写需求

如果您有论文代写需求,可以通过下面的方式联系我们。