原文由 capezx 发表:
种子的重测工作结束的时候NIR建模才算是真正的开始了,我用了3天的时间整理这些繁杂的谱图,为他们改名字,重新建立文件夹。用OPUS系统NIR建模的选择因子功能从2000多份玉米图谱中遵照随机原则选择出了参与建模的校正样品集500份。这就算是万事俱备只欠东风了。而后我花了2天的时间等待玉米样本的真值,当一叠A4纸扑在我桌案上的时候我甚至都有些难以抑制的激动,就在这一时刻我都已经开始筹划有关于建模的论文该如何开头了,甚至我仿佛看到了《核农学报》上我的大名赫然纸上。我在之后的时间里都一直有一种成功的感觉。
玉米样本真值里我们需要的是粗蛋白、粗脂肪、粗总淀粉和赖氨酸的干重含量信息,于是我又花了一周的时间对这些数字进行比较细致的整理,发现之前的校正样品集里有很多的谱图找不到对应的信息,无奈又做了无用功。不过我还是带着很大的干劲把2000多份的谱图和现有的数据对应了一遍,最后的结果可能不尽如人意,对应上的谱图缩减到了1050份。不过对于构建一个全国19个省的玉米NIR定量模型应该还算是可以牵强一下的。在我们建模所需的4个含量信息里,由于粗蛋白、粗脂肪、粗总淀粉在玉米中所含的干重远远大于赖氨酸的干重所以为了避免背景信息过于复杂和影响因素增加我决定把赖氨酸的模型单独建立。
当一切就绪后没有想到的是后面的工作进行的极为不顺利,本着由简入繁的原则我先在OPUS系统里把校正样品集的谱图与其赖氨酸的含量信息对应了起来,发现在一阶导数预处理后的模型相关性差的离谱,多次尝试后预处理方法是一阶导数的时候相关性R值平均值是15.8与布鲁克的德国模型98.9的相关性比起来简直是垃圾。没有办法只能把原来的设计打破,粗蛋白、粗脂肪、粗总淀粉的定量模型都单独进行试验建模。结果仍然令我大失所望,同样预处理的方法是一阶导数,最好的相关性仅仅达到了30.65,对于一个定量模型这个仍然是垃圾。我的一切美好幻想瞬间破灭!
(持续未完)