近日,我院激光与智能光学感知研究所以“Multivariate Correlation Self-Distillation Transformer for Time Series Forecasting With Incomplete Data(多变量相关性自蒸馏Transformer用于不完整时间序列预测)”为题,在IEEE Transactions on Industrial Informatics (五年影响因子10.7、中科院一区TOP期刊)上发表SCI论文。李翔为该论文的第一作者,赵勇教授和挪威科技大学尹珅教授为共同通讯作者,东北大学为该论文第一作者单位,该项研究成果进一步促进了我校智能感知学科的发展。
时间序列预测作为机器学习和数据科学中的一个核心问题,在工业生产调度、能源消耗预测、交通流量监测以及医疗健康监控等场景中发挥着关键作用。在实际应用中,时间序列数据常常由于传感器故障、网络延迟、环境干扰等原因而出现缺失。这种数据缺失的情况使得传统的时间序列预测方法难以发挥作用。尤其是在多变量时间序列数据中,缺失的变量可能会导致数据整体结构的丧失,影响模型的训练和预测准确性。尽管有一些方法(如均值填补、插值法等)用于处理缺失数据,但这些方法往往过于简单,无法有效捕捉时间序列数据中的复杂动态关系。

该研究提出了一种创新性的多变量相关性自蒸馏Transformer框架。与以往仅关注预测精度、忽视缺失数据处理的模型不同,该方法将历史序列的重建与未来序列的预测有机结合,构建了一个鲁棒的两阶段推理体系。在第一阶段(内部推理)中,模型聚焦于历史时间序列特征的建模与缺失数据的重建。研究者设计了特征嵌入模块,并引入改进的多变量相关性Transformer(MVCT),该结构结合了余弦相似度注意力机制与单变量前馈网络,不仅能够捕捉变量之间的互补信息,还能提炼单变量内部的时间规律,有效缓解了因缺失数据带来的特征偏移问题。在第二阶段(外部推理)中,模型利用第一阶段重建后的历史特征作为输入,进一步完成未来时间序列的预测,从更完整的特征表示中学习到更接近真实情况的变量关系,从而显著提升预测的准确性与鲁棒性。此外,该研究提出了变量相关性自蒸馏机制,利用第二阶段所学习到的更全面的变量相关性,将其“反向蒸馏”至第一阶段,帮助历史序列建模网络在存在缺失的情况下依然能够捕捉到合理的变量依赖关系。
论文链接:https://xplorestaging.ieee.org/document/10926918
(编辑:周宣任 审核:陈茂庆)