复现环境:RTX3090,22312GB显存,torch=1.8.1+cu111;
没改网络结构和超参数,直接训练。结果如下:

classification_EthanolConcentration_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el3_dl1_df32_fc1_ebtimeF_dtTrue_Exp_0
accuracy:0.30038022813688214
classification_FaceDetection_TimesNet_UEA_ftM_sl96_ll48_pl96_dm64_nh8_el3_dl1_df256_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.677639046538025
classification_Handwriting_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el2_dl1_df64_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.33294117647058824
classification_Heartbeat_TimesNet_UEA_ftM_sl96_ll48_pl96_dm64_nh8_el2_dl1_df64_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.7365853658536585
classification_JapaneseVowels_TimesNet_UEA_ftM_sl96_ll48_pl96_dm64_nh8_el2_dl1_df64_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.9675675675675676
classification_PEMS-SF_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el3_dl1_df32_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.8728323699421965
classification_SelfRegulationSCP1_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el3_dl1_df32_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.9146757679180887
classification_SelfRegulationSCP2_TimesNet_UEA_ftM_sl96_ll48_pl96_dm64_nh8_el3_dl1_df64_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.5333333333333333
classification_SpokenArabicDigits_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el2_dl1_df32_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.9872669395179627
classification_UWaveGestureLibrary_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el2_dl1_df64_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.85

大约71.3%的准确率,比论文里贴出来的差很多(73.6)。
TimesNet复现结果
其中三个比较差的数据集:

一、EthanolConcentration 0.30038022813688214

TimesNet复现结果

EthanolConcentration 是 44 个不同的真实威士忌酒瓶中水和乙醇溶液的原始光谱数据集~\cite{large2018detecting}。乙醇的浓度分别为35%、38%、40%和45%。苏格兰威士忌的最低法定酒精含量为 40%,许多威士忌确实保持这一酒精浓度。生产商必须确保他们的烈酒中所含的酒精浓度与标签上所报告的内容紧密相关。分类问题是确定任意瓶子中包含的样本的酒精浓度。数据的安排使得每个实例都由同一瓶和同一批溶液的三个重复读数组成。每个浓度(批次)制备三种溶液,每瓶+批次组合测量三次。每个读数都包括被拾起的瓶子,放置在光源和分光镜之间,以及保存的光谱。光谱是在使用的单个 StellarNet BLACKComet-SR 光谱仪的最大波长范围内(226nm 至 1101.5nm,采样频率为 0.5nm)在一秒的积分时间内记录的。除了避免在瓶子上贴标签、压花和接缝外,没有做任何特别的尝试来为每个单独的瓶子获得最干净的读数,也没有为每次重复读数精确地复制通过瓶子的确切路径。这是为了复制对一批可疑烈酒进行大规模筛查的操作员的潜在未来条件。 @inproceedings{large2018detecting,标题={通过振动光谱学和机器学习无创检测伪造酒精},作者={Large,James 和 Kemsley,E Kate 和 Wellner,Nikolaus 和 Goodall,Ian 和 Bagnall,Anthony},书名={亚太知识发现和数据挖掘会议},页数={298–309},年份={2018},组织={Springer} }

原因分析:

二、Handwriting 0.33294117647058824

TimesNet复现结果
TimesNet复现结果

一组从智能手表中获取的运动数据集,同时受试者正在写 UCR 创建的 26 个字母表中的字母。有 150 个训练用例和 850 个测试用例。六个维度是三个加速度计值和三个陀螺仪读数。 [1] M. Shokoohi-Yekta、B. Hu、J. Wang 和 E Keogh (2017) 将 DTW 推广到多维情况需要一种自适应方法。数据挖掘和知识发现 (31) 1,第 1�31 页

原因分析:

三、SelfRegulationSCP2 0.5333333333333333

TimesNet复现结果

BCI II 比赛的数据集 1b:慢皮层电位的自我调节。图宾根大学提供的数据集。数据集取自人工呼吸的 ALS 患者。受试者被要求在电脑屏幕上上下移动光标,同时记录他的皮质电位。在录音过程中,受试者收到了他的慢皮层电位(Cz-Mastoids)的听觉和视觉反馈。皮质正性导致屏幕上的光标向下移动。皮质负性导致光标向上移动。每次试验持续 8 秒。在每次试验期间,从每次试验的第 0.5 秒到第 7.5 秒,屏幕顶部(对于消极性)或底部(对于积极性)的高亮目标会在视觉和听觉上呈现任务。此外,任务(向上或向下)在 0.5 秒时发出声音。视觉反馈从第 2 秒到第 6.5 秒呈现。每次试验仅提供这 4.5 秒的间隔用于训练和测试。 256 赫兹的采样率和 4.5 秒的记录长度导致每次试验每个通道有 1152 个样本。试验结构概述:持续时间:8 秒,无试验间间隔。任务呈现:从 0.5 秒到 7.5 秒。反馈周期:从 2.0 s 到 6.5 s EEG 数据取自以下位置:通道 1:A1-Cz(10/20 系统)(A1 = 左乳突);通道2:A2-Cz;通道 3:C3 正面 2 厘米;通道 4:C3 顶叶 2 厘米;通道 5:用于检测垂直眼球运动的 vEOG 伪影通道;通道 6:C4 前 2 厘米;通道 7:C4 顶叶 2 厘米。 EEG 值未经过 EOG 校正。火车数据包含 200 次试验,每类 100 次,在同一天记录并随机排列。有7个维度,系列长度为1152。测试数据包含180次试验的测试数据。该测试数据是在列车数据(同一天)之后记录的。 180 次试验属于 0 类或 1 类。请注意,尚不清楚此数据集中是否包含任何对分类任务有用的信息。对结果的看法表明事实并非如此。最好的有 45.5% 的误差。参考:Birbaumer, N., Flor, H., Ghanayim, N., Hinterberger, T., Iverson, I., Taub, E., Kotchoubey, B., Kubler, A., & Perelmouter, J, A Brain-完全瘫痪者的受控拼写装置,Nature,398、297-298。

相比于scp1,差的很多。
TimesNet复现结果

数据集 Ia:慢皮层电位的自我调节。图宾根大学提供的数据集。实验描述:数据集取自健康受试者。受试者被要求在电脑屏幕上上下移动光标,同时记录他的皮质电位。在录音过程中,受试者收到了他的慢皮层电位(Cz-Mastoids)的视觉反馈。皮质正性导致屏幕上的光标向下移动。皮质负性导致光标向上移动。每次试验持续 6 秒。在每次试验期间,任务都通过屏幕顶部或底部突出显示的目标直观地呈现,以指示从秒 0.5 到试验结束的消极或积极性。视觉反馈从秒 2 到秒 5.5 呈现。每次试验仅提供这 3.5 秒的间隔用于训练和测试。 256 赫兹的采样率和 3.5 秒的记录长度导致每次试验的每个通道有 896 个样本。试验结构概述:持续时间:6 秒,无试验间隔任务介绍:从 0.5 秒到 6.0 秒反馈周期:从 2.0 秒到 5.5 秒数据:放大器:PsyLab EEG8 A/D 转换器:计算机板 PCIM-DAS1602/16 bit 幅度范围:+/-1000 �V 采样率:256 S/s EEG 数据取自以下位置:通道 1:A1-Cz(10/20 系统)(A1 = 左乳突)通道 2:A2-Cz通道 3:C3 正面 2 厘米 通道 4:C3 顶面 2 厘米 通道 5:C4 正面 2 厘米 通道 6:C4 顶面 2 厘米 所有值均以微伏为单位。训练数据由在两个不同日期记录的 268 次试验组成,并随机混合。总共 268 次试验中有 168 次来自第 1 天,其余 100 次试验来自第 2 天。数据来自两个训练文件 Traindata_0.txt 和 Traindata_1.txt。每个实例都有六个长度为 896 的维度(上面的 EEG 通道)。类别标签是消极性或积极性。共有293个测试数据,赛后发布标签。结果 15 个条目,中位误差 17.8%,最好的测试数据的错误率为 11.3%(大概有 33 个不正确)。参考:Birbaumer, N., Flor, H., Ghanayim, N., Hinterberger, T., Iverson, I., Taub, E., Kotchoubey, B., Kubler, A., & Perelmouter, J, A Brain-完全瘫痪者的受控拼写装置,Nature,398、297-298。

原因分析:

发表回复