精华内容
下载资源
问答
  • 为了解决在快速序列视觉呈现任务下的脑电信号分类问题,提出了一种用于脑电信号分类的算法。通过约束有监督降维后样本与样本中心差值的趋近方向,使用训练集脑电数据训练得到映射矩阵;通过特征提取函数将训练集和...
  • SPSS(十九)SPSS之时间序列模型(图文+数据集)

    万次阅读 多人点赞 2019-06-17 22:32:38
    SPSS(十九)SPSS之时间序列模型(图文+数据集) 时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。正如人们常说,人生的出场顺序很重要,时间序列中隐藏着一些过去与未来的关系。时间序列...

    SPSS(十九)SPSS之时间序列模型(图文+数据集)

    时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。正如人们常说,人生的出场顺序很重要,时间序列中隐藏着一些过去与未来的关系。时间序列分析试图通过研究过去来预测未来。

    时间序列分析在工程、金融、科技等众多领域有着广泛的应用。在大数据时代,时间序列分析已经成为 AI 技术的一个分支,通过将时间序列分析与分类模型相结合,更好的应用于数据检测、预测等场景。

    时间序列模型简介

    • 依时间顺序排列起来的一系列观测值(观测值之间不独立)
    • 它考虑的不是变量间的因果关系,而是重点考察变量在时间方面的发展变化规律,并为之建立数学模型
    • 使用时间序列模型的前提:有足够长的数据序列;数据序列的变动是稳定而规律的

    另外一种理解方式:假如我们对一件事情研究其背后规律很久的话,可以收集到很多的自变量/影响因素去研究与因变量之间的关系,但是由于各种原因我们做不到,我们只能用一个t(时间)来替代所有的影响因素来研究自变量是如何变化的

     

    时间序列分析面临的问题

    时序应该在现实生活中应用的很广,但是为什么不常用这个模型呢?

    • 基础统计数据原因(数据收集)

    报表系统——质量问题
    统计口径——不统一
    范围变化、区域划分——变化

    • 理论和技术培训原因 

    之前没有好的工具来实现时间序列模型

     

    时间序列的方法分类

    • Time domain(最为常见的方法):将时间序列看成是过去一些点的函数,或者认为序列具有随时间系统变化的趋势,它可以用不多的参数来加以描述,或者说可以通过差分、周期等还原成随机序列。
    • Frequency domain:认为时间序列是由数个正弦波成份叠加而成,当序列的确来自一些周期函数集合时,该方法特别有用。 比如心电图
       

    时间序列的构成

    并不是每个序列都包含所有4种成分。比如以年为时间单位的序列就不会有季节变化;
    一些较短的序列也看不出循环变化。所以在分析的时候得具体情况具体分析。 

    • 长期趋势

    指一种长期的变化趋势。它采取一种全局的视角,不考虑序列局部的波动

    下图,整体呈下降趋势

    • 季节变化(Season)

    反映一种周期性的变化一般在一年中完成
    虽然称作“季节”,但是周期并不一定是季度,也可以是月、周等其它能在一年内完成的周期。因为,大多数的周期都以季节的形式出现,所以称作季节变化

    比较典型的季节变化例子:圣诞节效应;冷饮的销售情况

    • 循环变化(Cyclic)

    循环跨度超年

    指一种较长时间的周期变化。一般来说循环时间为2-15年。循环变化一般会出现波峰和波谷,呈现一种循环往复的现象。 
    比如:经济危机 

    • 不规则变化(error) 

    指时间序列中无法预计的部分,也可以理解为误差
    序列的随机波动 
    突发事件引起的 
    它是无法预测的 
    在分析中往往又将其称为白噪声

    它是时间序列中除去趋势、季节变化和自相关性之后的剩余随机扰动。由于时间序列存在不确定性,随机噪声总是夹杂在时间序列中,致使时间序列表现出某种震荡式的无规律运动。
    比如:911事件

     

    时间序列分析对长度的要求

    • 不同的序列分析方法对时间序列分析对长度不一样,建模过程一般都会做差分,差分会损失信息,差分得越多,相应要求的时间序列越长
    • 如果是稳定序列的话,历史数据越多,对预测的帮助越大
    • 如果存在周期,一般需要4个周期以上数理上认为应当在20个周期以上

           假如只有两三个周期,那周期性的分析就没有太大作用了

     

    对于时间序列问题有哪些基本分析思路

    看到数据其实不一定要上最复杂的方法

    • 平滑与季节分解(遇到比较简单的序列)

    用移动平均的方式消除波动,反映出主要的趋势

    • 回归模型

    如果在序列分析中我们考虑到自变量的话,根据历史数据建立相应的回归模型用于预测。甚至来说可以直接把时间当做自变量用于预测,当然我们知道回归时候要求残差是独立的,假如检验出来是非独立的话,我们可以去建一个自回归模型

    • ARIMA

    如果时间序列变化太复杂,我们可以采用ARIMA建模,现在最强大的时序建模方法。真正的时间序列模型建模分析方法
     

    平滑与季节分解

    • 是利用时间序列资料进行短期预测的一种方法。它的基本思想是:除去一些不规则变化后,时间序列将剩下一些基本的变化模式,而这种变化模式将延续到将来。
    • 描述时间序列数据的变化规律和行为,不去试图解释和理解这种变化的原因。例如:您可能发现在过去的一年里,三月和九月都会出现销售的高峰,您可能希望继续保持这样,尽管您不知道为什么。
    • 平滑的主要目的就是除去时间序列的不规则变化,把时间序列的基本变化模式突现出来,作为短期预测的基础。因此也有人把平滑称作“修匀”。
    • 平滑的方法很多。广义上说,可以认为回归也是一种平滑。因为拟合回归曲线可以把杂乱的观测数据修匀得到连续而光滑的曲线。
    • 移动平均和移动中位数等这些不同的平滑技术又被称为平滑器。平滑处理后,可以得到一些新的序列。不同的平滑器得到的新序列是不同的。选择合适的平滑器,寻求最佳的预测效果是平滑处理的关键。

     

    案例:NRC数据的建模预测

    美国1947年1月到1969年12月住宅建筑的数据,分析目的是希望能过通过历史数据来预测1970年全年的情况。

    数据集

    nrc是我们准备用于分析的变量

    nrc2又新增了12个月的数据,可以用来评价我们的预测效果

    556	556
    528	528
    545	545
    607	607
    701	701
    785	785
    874	874
    950	950
    1006	1006
    1093	1093
    1135	1135
    1070	1070
    891	891
    757	757
    874	874
    1028	1028
    1168	1168
    1257	1257
    1294	1294
    1305	1305
    1273	1273
    1203	1203
    1100	1100
    978	978
    846	846
    731	731
    763	763
    844	844
    981	981
    1086	1086
    1147	1147
    1171	1171
    1207	1207
    1238	1238
    1241	1241
    1171	1171
    1077	1077
    1031	1031
    1089	1089
    1276	1276
    1499	1499
    1703	1703
    1827	1827
    1898	1898
    1900	1900
    1785	1785
    1614	1614
    1427	1427
    1289	1289
    1188	1188
    1229	1229
    1288	1288
    1324	1324
    1399	1399
    1428	1428
    1409	1409
    1400	1400
    1397	1397
    1330	1330
    1200	1200
    1015	1015
    963	963
    1149	1149
    1234	1234
    1346	1346
    1437	1437
    1472	1472
    1486	1486
    1473	1473
    1481	1481
    1438	1438
    1309	1309
    1131	1131
    1057	1057
    1206	1206
    1363	1363
    1431	1431
    1570	1570
    1577	1577
    1550	1550
    1514	1514
    1481	1481
    1420	1420
    1294	1294
    1104	1104
    1029	1029
    1167	1167
    1347	1347
    1517	1517
    1627	1627
    1717	1717
    1770	1770
    1783	1783
    1759	1759
    1717	1717
    1650	1650
    1473	1473
    1379	1379
    1562	1562
    1753	1753
    1925	1925
    2064	2064
    2098	2098
    2082	2082
    2051	2051
    1983	1983
    1851	1851
    1656	1656
    1392	1392
    1305	1305
    1457	1457
    1618	1618
    1753	1753
    1884	1884
    1908	1908
    1895	1895
    1860	1860
    1798	1798
    1741	1741
    1567	1567
    1324	1324
    1206	1206
    1350	1350
    1486	1486
    1604	1604
    1718	1718
    1767	1767
    1796	1796
    1787	1787
    1761	1761
    1694	1694
    1513	1513
    1292	1292
    1192	1192
    1302	1302
    1421	1421
    1550	1550
    1702	1702
    1804	1804
    1876	1876
    1907	1907
    1954	1954
    1957	1957
    1832	1832
    1606	1606
    1493	1493
    1676	1676
    1907	1907
    2091	2091
    2253	2253
    2350	2350
    2358	2358
    2310	2310
    2232	2232
    2092	2092
    1883	1883
    1588	1588
    1408	1408
    1613	1613
    1804	1804
    1935	1935
    2112	2112
    2039	2039
    1982	1982
    1931	1931
    1860	1860
    1790	1790
    1644	1644
    1378	1378
    1221	1221
    1459	1459
    1720	1720
    1860	1860
    2059	2059
    2053	2053
    2053	2053
    2055	2055
    2041	2041
    1974	1974
    1807	1807
    1543	1543
    1368	1368
    1605	1605
    1906	1906
    2141	2141
    2377	2377
    2357	2357
    2377	2377
    2330	2330
    2210	2210
    2113	2113
    1965	1965
    1686	1686
    1492	1492
    1666	1666
    1950	1950
    2206	2206
    2421	2421
    2517	2517
    2553	2553
    2516	2516
    2500	2500
    2450	2450
    2230	2230
    1867	1867
    1678	1678
    1866	1866
    2068	2068
    2191	2191
    2385	2385
    2518	2518
    2541	2541
    2439	2439
    2327	2327
    2260	2260
    2118	2118
    1834	1834
    1639	1639
    1782	1782
    2000	2000
    2203	2203
    2429	2429
    2550	2550
    2561	2561
    2473	2473
    2377	2377
    2284	2284
    2136	2136
    1848	1848
    1644	1644
    1781	1781
    1979	1979
    2124	2124
    2287	2287
    2387	2387
    2351	2351
    2202	2202
    1978	1978
    1785	1785
    1614	1614
    1368	1368
    1248	1248
    1405	1405
    1613	1613
    1836	1836
    2107	2107
    2336	2336
    2471	2471
    2446	2446
    2375	2375
    2310	2310
    2191	2191
    1859	1859
    1655	1655
    1885	1885
    2262	2262
    2518	2518
    2628	2628
    2721	2721
    2790	2790
    2780	2780
    2678	2678
    2593	2593
    2454	2454
    2133	2133
    1940	1940
    2195	2195
    2540	2540
    2810	2810
    2962	2962
    2974	2974
    2880	2880
    2763	2763
    2648	2648
    2482	2482
    2288	2288
    	1961
    	1765
    	1986
    	2297
    	2485
    	2592
    	2650
    	2707
    	2721
    	2747
    	2735
    	2627


    时间序列操作的基本步骤

    • 预处理过程

    缺失值的填补 

    一般这两种方法我们比较常用


    时间变量的定义(spss对数据集进行了特殊标记,让spss知道其为序列数据,并非新增三个变量那么简单,必须是刚才进行下面的操作)


    时间序列的平稳化

    观测原始序列是什么分布,时间刻度这一块随便选一个时间自变量

    发现其有长期趋势及季节变化(大概一年)


    一次差分(假如序列匀速上升的话,一次差分序列后应该是平的)

    继续查看其变化(一次差分作为变量)

    确实序列变平了,但是随着时间增加季节变换还是存在的


    季节差分(把周期性也干掉),一阶:相邻的两个季节做相减

    看季节差分分布分布状况

    看到下面的序列,无长期趋势、无季节变换,可认为是一个比较平稳的序列了

    但是刚才上面在做一次差分后的序列,可以看出其序列随着时间增长离散程度会慢慢变大,后续分析可以考虑这一点,可以做变量变换。

    其实刚才上面的步骤不用那么麻烦,在序列图中即可观察

    当前周期:12在哪里设置呢?(在我们刚才定义日期选取的)

     

    关于数据平稳化问题:(非常详细的理论基础)

    大家可以参考

    https://zhuanlan.zhihu.com/p/60023855

    https://zhuanlan.zhihu.com/p/60648709

     

    时间序列趋势的图形化观察

    • Sequence Chart:序列图

    实际上就是一种特殊的线图

    • Autocorrelation Chart:做单个序列,任意滞后(包括负的滞后,也就是超前)的自相关和偏相关图

    对序列图的初步观察结果作进一步确认(检验其是不是白噪声序列)
    重点关心主要的相关趋势,然后再对模型进一步修正

    刚才我们认为做了一次差分和季节差分真的为平稳序列了吗?

    滞后n阶:隔了n个数据的自相关性

    Sig.<0.05,证明存在自相关的,不都是白噪声

    为了方便查看,给出了图,1到5阶都是存在统计学意义的

    自相关系数是有传递性的问题在里面的,spss就会计算偏自相关系数,屏蔽传递的效应后,看剩余的关联是否还存在

    自相关拖尾,偏自相关也拖尾,这两个是为了知道我们进行建模的

    自相关图:自回归系数的变化
    偏相关图:偏回归系数的变化

    假如他是以下模型,应满足下面的特征

    实际用起来,spss会提供一个自动分析的方法

    模型拟合
    几乎均可包含在ARIMA模型族中
    寻找适当的参数是一个反复尝试的过程

    生成 ARIMA 模型的基本步骤:

    1. 对序列绘图,进行 ADF 检验,观察序列是否平稳;对于非平稳时间序列要先进行 d 阶差分,转化为平稳时间序列;
    2. 经过第一步处理,已经得到平稳时间序列。要对平稳时间序列分别求得其自相关系数(ACF)和偏自相关系数(PACF),通过对自相关图和偏自相关图的分析,得到最佳的阶数p、q;
    3. 由以上得到的d、q、p ,得到 ARIMA 模型。然后开始对得到的模型进行模型检验。

    专家建模器:会在指数平滑模型和ARIMA模型里面选取

     

    R方相对于平稳的R方来说,是比较过于乐观的,假如数据是有波动趋势的,我们将趋势解释掉之后,占相当大的变异解释度进去了,平稳的R方比较客观

    RMSE(残差均方)

    MAPE(相对误差)

    MAXAPE(最大值相对误差)

    MAE(绝对误差)

    MAXAE(最大值绝对误差)

    正态化BIC(比较专业化的指标)

     

    当前模型剩下来的这块能否当成白噪声?

    H0:白噪声序列

    Sig.>0.05,剩下来的确实是白噪声序列

     

     

    如何让其做预测?怎么用时间序列?

    由于SPSS的一个小BUG,变量名前缀要修改一下,不能是中文

    对比一下原始序列和预测值效果

    我们想预测到久一点呢?

    假如我们有1970年的真实数据了,对比一下模型预测及真实数据差别

    展开全文
  • 【转】时间序列分类算法简介及其在能耗数据分类上的应用 原文链接:时间序列分类算法简介及其在能耗数据分类上的应用–李元龙   本文首先简要介绍最近几年来时间序列分类算法的最新研究成果,包括dynamic time ...

    时间序列分类算法简介及其在能耗数据分类上的应用

    原文链接:时间序列分类算法简介及其在能耗数据分类上的应用–李元龙

      本文首先简要介绍最近几年来时间序列分类算法的最新研究成果,包括dynamic time warping的各种改进技术和相关研究,以及最新的聚合式算法(ensemble algorithm)。其次以根据能耗数据来监测服务器运行程序的研究为实例,介绍如何对实际应用中的时间序列数据进行更准确的分类。

    一、时间序列分类算法综述

      时间序列分类问题(Time Series Classification, TSC)是数据挖掘中的一个经典问题。其核心问题定义如下:

    给定时间序列集合S,对任意时间序列x属于S, 其所属类别(label)为lx。给出任意测试数据x‘,求预测其可能所属的类别。

      比如有一些人参与不同的运动项目。 假定我们采集了不同项目的运动轨迹数据集,那么给定一个未知的人的运动轨迹,判断其参与的运动项目就是个典型的时间序列分类问题。

      上述问题与基于欧式距离的经典分类问题并无差别。然而在实际中,经典分类算法在时间序列分类上的表现一般较差,其根本原因在于时间序列数据与传统的空间点数据存在关键不同:对于一个时间序列x,其每一个时刻的测量值对应于传统欧式空间的一个维度。在传统的欧氏空间中,维度之间的关联关系是有限的,不同维度的数值大小可以千差万别。然而对于一个时间序列,其所有的信息都包含在不同时刻的变化中。时间序列通常会按照某一些模式变化,因此其数据在不同维度的上的关联性非常重要。基于此差异,时间序列数据无法很好地被传统基于欧式距离的分类算法所求解。

      由于欧式距离不能很好地针对时间序列的波动模式进行分类,研发更适合时间序列分类的距离度量就成为关键,这其中最经典的时间序列距离度量就是Dynamic Time Warping (DTW)。 DTW的原理如下:

    Alt text

    1 图 1

      针对序列x和y,DTW计算在卷曲时间轴的情况下两个序列最好的匹配结果,并以这个匹配结果来计算他们之间的距离。如上图所示,x和y两个序列有相同的模式但是y序列在时间上移后了。如用欧式距离,x与y因距离较大很可能会被归为不同类别; 而DTW可以准确判别出x和y模式上的类似并得出一个较小的距离度量。实际上,DTW不仅可以考虑到上述简单的平移情形,还能考虑到时间轴上局部的缩放变形等。 DTW通过对时间序列波动模式的分析可得到更好的时间序列分类结果。研究表明,在时间序列分类问题上,DTW距离度量配合简单的最小距离分类法(nearest neighbor)就可以取得较传统欧式距离算法(如SVM、经典多层神经网络、决策树、Adaboost)压倒性的优势。

      DTW更进一步衍生出多种不同的变种,例如由Keogh和 Pazzani 提出的基于序列一阶导数的改进便取得了良好的效果;其中一种简单的方法叫Complexity Invariant distance (CID),其利用一阶导数信息对DTW距离做计算,在某些问题上具有突出效果。

      除了DTW,还有其他考量时间序列的波动模式算法。例如Ye 和Keogh提出的Shapelet方法:考察序列中具有代表意义的子序列来作为Shapelet特征而进行分类。Lin等人提出了基于字典的方法,将序列根据特定的字典转化为词序列,从而进行分类。Deng提出了基于区间的方法,从区间中提取波动的特征。

      除了上述方法外,聚合算法(将多种不同算法聚合在一起)的研究也有了长足的进步。最近提出的COTE算法几乎将上述所有不同分类算法聚合在一起,得到了优异的分类效果。想要进一步了解上述主要算法的细节以及更全面的时间序列分类算法综述,请参考“The Great Time Series Classification Bake Off: An Experimental Evaluation of Recently Proposed Algorithms. Extended Version

    二、基于能耗数据来监测服务器运行程序

      时间序列分类算法具有广泛的应用。下面介绍一个在不干扰server运行状态下,基于服务器的能耗数据来判断正在运行的程序的应用。

      该应用的核心技术路线如下:

    首先在一个server上运行各种不同的程序,采集运行程序时server的能耗时间序列;运用这些数据(程序名作为label)训练一个分类模型;然后给定任意检测到的能耗数据,判断正在运行的程序。

      我们收集了13类数据进行实验。这些数据一共有3000条,每条长度为200个时间节点。这些数据记录了不同程序运行时server的能耗(W)数据。

      为了显示时间序列分类算法的优势,我们首先采用传统的分类算法分析这些数据。结果显示,在所测试的算法中,即便是表现最好random forest其分类准确率仅达63%左右, 而标准的多层神经网、SVM及基于欧式距离的算法只有50%左右的准确率。之所以准确率较低,是因为当我们把时间序列看作欧式空间中的点数据集时,其可分性非常差。

    Alt text
    2 图 2

      将基于八种不同方法(从经典PCA到效果领先的基于流形学习的降维方法)所采集的数据投射到一个二维空间,可以得到如图2所示的效果图。可以看到,并没有一种方法可以呈现出非常好的类别分布。

      鉴于此,我们提出基于DTW的时间序列分类方法对能耗数据进行分类与判断:

      首先,虽然采用DTW距离可将分类准确度提高至84%,但分类速度慢,因此我们提出一种考察局部模式信息、对DTW距离函数加以改进的方案,即Local Time Warping (LTW)。 LTW被设计为非交换率,也就是LTW(x, y)可能不等于LTW(y, x):将LTW与最近临分类算法相配合来判断一个序列x’属于哪一类时,我们只需要找哪个训练数据y离x’最近,而不需要x‘也离y很近。这么做可使距离衡量的定义更为宽松,从而可对复杂分布的数据进行更好地分类。采用LTW这一DTW距离函数改进方案,算法的时间效率可提升近10倍(相对于经典DTW实现),分类准确率可达到88%。

      同时,我们引入基于LSTM(Long Short Term Memory Neural Network)的分类算法。LSTM是一个具有序列数据建模能力的神经网络。随着深度学习的蓬勃发展,它的突出效果也日益显现。我们采用了一个经典的LSTM层来对数据进行分类,结构如下:

    Alt text

    3 图 3

      经测试,LSTM算法的分类准确率也达到88%左右。

      传统聚合算法并没有考虑到LSTM。LSTM在上述问题上的优异表现证明可以聚合LSTM与传统基于DTW的方法。虽然两种算法的分类效果类似(88%),但由于两者在原理上截然不同,可以预见他们准确预测的样本会有明显差别。我们将LTW和LSTM合二为一:将两者的分类概率向量简单相加,便可取得93%左右的实际分类效果。

      综上,这种聚合LTW和LSTM的时间分类算法,对server能耗序列进行分类的准确率可达93%。这说明仅仅利用server的能耗数据,我们就有很大概率准确检测server内部正在运行何种程序。这样的检测机制可以推广到所有的电器。

    三、结语

      本文简单总结了现有基于DTW的分类方法,并针对服务器能耗数据提出了一种聚合改进的距离衡量方法LTW和LSTM神经网络的方法,实现了93%的分类准确率。

      时间序列分类问题是一个非常有意思的问题,尤其是当对比DTW和LSTM的不同作用机制时。运用DTW计算距离,针对不同的序列对,计算中的序列index warping是不同的。DTW实际采用动态规划来计算距离。这是一个严格意义的程序而不是一个简单的计算公式。而LSTM是一个固定的训练好的神经网络。针对不同的序列,其网络权重在训练好之后都不会变化,却可以达到类似DTW的效果。这是否在某种程度上证明LSTM可以类比动态规划呢?

    展开全文
  • 时间序列论文常用数据

    千次阅读 2020-05-20 21:30:52
    下载地址:laiguokun/multivariate-time-series-data. ...太阳能自然是以天为周期算,晚上几乎为零,故呈现如下形状 traffic (行,列) = (17544, 862) 不同地点的交通流量,主要以日为单位,白天多晚上少

    下载地址:laiguokun/multivariate-time-series-data.

    electricity

    (行,列) = (26304, 321)

    每日的用电量有一定的季节性,图中只画出 10 列
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    exchange_rate

    (行,列) = (7588, 8)
    在这里插入图片描述

    solar-energy

    (行,列) = (52560, 137)

    太阳能自然是以天为周期算,晚上几乎为零,故呈现如下形状
    在这里插入图片描述

    traffic

    (行,列) = (17544, 862)

    不同地点的交通流量,主要以日为单位,白天多晚上少,还受到周末、节假日、天气等影响。
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 时间序列分析是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计变化规律,以用于解决实际问题。通常影响时间序列变化的4个要素如下: 长期趋势(T):是时间...
  • 数据挖掘——序列

    千次阅读 2016-11-28 13:53:11
    数据挖掘技术一般用于检测数据中的序列或模式。本章中,我们将试图使数据遵循一种模式,在此模式中,一个或一系列事件可以通过一致的方式预测另一个数据点。本文描述了在数据集中查找模式的不同方法: 查找模式 在...
  • 为了兼顾模型的可解释性,很多工作将非线性的数据进行各种变换(幂函数变换、倒数变换、指数变换、对数变换、Box-Cax等)将一个非线性问题转换成一个呈现线性关系的问题,再利用相应的模型进行解决。 常见的可以进行...
  • 在此类时间序列数据预测中,最近有很多工作尝试采用不同的深度学习模型进行交通预测,例如 R. Soua、Filipe Rodrigues等人利用时间序列数据并结合外部特征来实现诸如交通流量、出租车的需求、交通速度等的预测。同时...
  • 探索式数据分析,时间序列分析
  • 1. 我们将BERT的结果作为编码器呈现在MLTC数据集的序列序列框架中,具有或不具有类上的给定层次树结构。 2. 介绍并实验验证了一种新的MLTC混合模型。 3.我们微调vanilla BERT模型来执行多标签文本分类。据我们所...
  • 数据挖掘的发展过程中,由于数据挖掘不断地将诸多学科领域知识与技术融入当中,因此,目前数据挖掘方法与算法已呈现出极为丰富的多种形式。从使用的广义角度上看,数据挖掘常用分析方法主要有分类、聚类、估值、...
  • 随着近年来物联网(IoT)的快速发展,时间序列数据出现了爆炸式增长。根据过去两年DB-Engines数据库类型的增长趋势,时间序列数据库的增长是巨大的。这些大型开源时间序列数据库的实现是不同的,并且它们都不是完美...
  • 数据挖掘——时间序列分析

    千次阅读 2018-11-06 23:58:00
    时间序列分析 一、 概念 时间序列(Time Series) 时间序列是指同一统计指标的数值按其发生的时间先后顺序排列而成的数列(是均匀时间间隔上的观测值序列)。 ...时间序列按照季节性来分类,...
  • 1、引言 2、流时间序列中基于预测的异常检测 3、异常形状的时间序列 4、多维流的异常检测
  • 在监督学习中,给定一组数据,我们知道正确的输出结果应该是什么样子,并且知道在输入和输出之间有着一个特定的关系。 监督学习分类 回归(regression)和分类(classification)。 在回归问题中,我们会预测一个...
  • Spss用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务。 SPSS是一个傻瓜操作软件,只要认识了软件基本界面和功能,然后把你的数据准备好,输进去,点击需要进行分析的功能,软件会自动给...
  • 时间序列回归

    千次阅读 2020-12-29 23:31:34
    为了兼顾模型的可解释性,很多工作将非线性的数据进行各种变换(幂函数变换、倒数变换、指数变换、对数变换、Box-Cax等)将一个非线性问题转换成一个呈现线性关系的问题,再利用相应的模型进行解决。 常见的可以进行...
  • 数据挖掘建模–时间序列分析 时间序列分析可以处理按照时间序列排序数据并预估出未来数据。要对时间序列进行分析需要首先确定时间序列分布函数,但取得困难,退而求用计算时间序列的特征统计量(低阶距)来研究时间...
  • TensorFlow入门

    千次阅读 多人点赞 2019-04-23 10:09:29
    正如程序的报错所示:m1是int32的数据类型,而m2是float32的数据类型,两者的数据类型不匹配,所以发生了错误。所以我们在实际编程时,一定注意参与运算的张量数据类型要相同。 变量 变量Variables维护图执行...
  • R语言实现金融数据的时间序列分析及建模
  • 时间序列数据(上)

    2018-01-07 12:39:35
    总第92篇01|时间序列定义:时间序列是按照一定的时间间隔排列的一组数据,其时间间隔可以是任意的时间单位,如小时、日、周月等。比如,不同时间段某产品的用户数量,以及某个在网站的用户行为,...
  • 摘要:异常检测是目前时序数据分析最成熟的应用之一,有效的异常检测被广泛用于现实世界的很多领域,例如量化交易,网络安全检测、自动驾驶汽车和大型工业设备的日常维护。本文主要对目前主流的异常检测算法进行汇总...
  • 基于SSM的校园二手交易平台的设计与实现

    万次阅读 多人点赞 2018-05-06 14:24:44
    本次设计的主要难度在于数据的详细分类,对于数据的过滤必须要严谨,应当考虑敏感字体和敏感图片的过滤。 可能遇到的问题有,在数据交互过程中,出现由于属性名的差距导致的数据交互失败。由于Css属性设置的问题,...
  • ERP

    千次阅读 2018-11-14 22:16:03
    用例图呈现了一些参与者,一些用例,以及它们之间的关系,主要用于对系统、子系统或类的功能行为进行建模。 1.3.1.2 类图(Class Diagram) 类图是用于显示模型的静态结构,特别是模型中存在的类、类的内部结构...
  • 时间序列分析

    千次阅读 2018-10-29 21:15:51
    时间序列 时间序列(简称为时序)是指同一现象在不同时间上的相继观测值排列而成的...该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计变化规律,以用于解决实际问题。通常影响时间序列变化的...
  • C#基础教程-c#实例教程,适合初学者

    万次阅读 多人点赞 2016-08-22 11:13:24
    大家注意,这里我们实际定义了一个新的数据类型,为用户自己定义的数据类型,是对个人的特性和行为的描述,他的类型名为Person,和int,char等一样为一种数据类型。用定义新数据类型Person类的方法把数据和处理数据...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 19,598
精华内容 7,839
关键字:

呈现分类序列数据