您好,登錄后才能下訂單哦!
這篇文章主要介紹“機器學習中測試時間序列的問題有哪些”,在日常操作中,相信很多人在機器學習中測試時間序列的問題有哪些問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”機器學習中測試時間序列的問題有哪些”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
下面是分布得分,它們將幫助你評估你的表現。
300多人參加了技能測試,獲得的最高分數為38分。以下是一些關于分布的統計數據。
平均分:17.13
中位數:19
眾數:19
估計未來6個月酒店客房預訂數量。
估計保險公司未來三年的總銷售額。
估計下一周的通話次數。
A) 只有 3 B) 1 和 2 C) 2 和 3 D) 1 和 3 E) 1,2 和 3
解決方案:(E)
以上所有選項都與時間序列有關。
A) 樸素法
B) 指數平滑
C) 移動平均
D) 以上都不是
解決方案:(D)
樸素法:一種估計技術,在這種技術中,最后一個時期的實際情況被用作這一時期的預測,而不加以調整或試圖確定因果因素,適用于比較穩定的序列。它僅用于與更復雜的技術生成的預測進行比較。
在指數平滑中,舊數據的相對重要性逐漸降低,而新數據的相對重要性逐漸提高。
在時間序列分析中,移動平均(MA)模型是一種常用的單變量時間序列建模方法。移動平均模型指定輸出變量線性依賴于隨機項(不完全可預測)的當前值和各種過去值。
A) 季節性
B) 趨勢
C) 周期性
D) 噪聲
E) 以上都不是
解決方案:(E)
當一系列因素受到季節因素(例如,一年中的一個季度、一個月或一周中的一天)的影響時,就存在一種季節模式。季節性總是一個固定且已知的時期。因此,季節性時間序列有時被稱為周期性時間序列
季節總是一個固定且已知的時期。當數據呈現非固定周期的漲跌時,它就存在一種循環模式。
趨勢被定義為時間序列中跟日歷無關且無規律影響的“長期”運動,是底層的反映。它是人口增長、物價上漲和一般經濟變化等影響的結果。下圖描繪了一個隨時間有明顯上升趨勢的系列。
噪聲:在離散時間內,白噪聲是一種離散信號,其樣本被視為一系列均值為零、方差有限的不相關隨機變量。
因此,上述所有內容都是時間序列的組成部分。
A) 季節性
B) 周期性
C) 季節性和周期性沒有區別
解決方案:(A)
正如我們在前面的解中所看到的,由于季節性呈現平穩的結構,所以更容易估計。
A)真 B)假
解決方案: (B)
上面的圖中以固定的時間間隔重復出現差不多的趨勢,因此實際上只是季節性的。
A)真 B)假
解決方案:(B)
隨著觀測值之間的時間間隔變短,它們往往與時間強相關。因為時間序列預測是基于以前的觀察數據而不是當前的觀察數據,不像分類或回歸那樣數據與數據之間關聯性不高。
A) 真
B) 假
解決方案:(A)
將較大的權重應用于較新的觀測結果中,比應用到歷史數據的觀測結果中更為明智。這正是簡單指數平滑背后的概念。預測是使用加權平均值計算的,加權平均值隨著過去觀測值的增加呈指數遞減——最小的權重將與最早的觀測值相關。
A)<1 B)1 C)> 1 D)以上都不是
解決方案: (B)
表7.1顯示了使用簡單指數平滑法進行預測時,對四個不同α值的觀測值的權重。請注意,對于任何合理的樣本量,即使對于較小的α,權重的總和也將約為1。
A) 63.8 B) 65 C) 62 D) 66
解決方案:(D) Yt-1 = 70 St-1 = 60 Alpha = 0.4
代入,得:
0.4 * 60 + 0.6 * 70 = 24 + 42 = 66
A) 不同時間觀測到的不同序列上多個點之間的線性相關性
B) 不同時間觀測到的同一序列上兩點之間的二次相關性
C) 同時觀測到的不同序列兩點之間的線性關系
D) 在不同時間觀測到的同一序列上兩點之間的線性關系
解決方案:(D)
選項D是自協方差的定義。
A) 平均值是恒定的,不依賴于時間
B) 自協方差函數僅通過其差|s-t|依賴于s和t(其中t和s為時刻)
C) 所考慮的時間序列是一個有限方差過程
D) 時間序列是高斯的
解決方案:(D)
高斯時間序列意味著平穩性是嚴平穩性。
A) 最近鄰回歸
B) 局部加權散點圖平滑
C) 基于樹的模型,如(CART)
D) 平滑樣條曲線
解決方案:(C)
時間序列平滑和濾波可以用局部回歸模型來表示。多項式和回歸樣條也提供了平滑的重要技術。基于CART的模型不提供要疊加在時間序列上的方程,因此不能用于平滑。所有其他技術都是有據可查的平滑技術。
A)300
B) 350
C) 400
D)需要更多的信息
解決方案:(A)
X' = (xt-3 + xt-2 + xt-1) /3
(200+300+400)/ 3 = 900/3 =300
A)AR B)MA C)不能判斷
解決方案:(A)
在以下情況下考慮使用MA模型:如果差分序列的自相關函數(ACF)表現出明顯的截尾或偏相關系數表現出拖尾,則考慮添加一個模型的MA項。ACF截止的滯后時間就是MA項數。
但是,由于沒有表現出明顯的截尾,因此必須采用AR模型。
以上陳述是否代表數據具有季節性?
A)真 B)假 C)不能判斷
解決方案:(A)
是的,這是一個明確的季節性趨勢,因為在特定時間視圖會發生變化。
請記住,“季節性”是指在特定的周期性時間間隔內出現的變化。
1.多個盒圖 2.自相關
A)僅1 B)僅2 C)1和2 D)這些都不是
解決方案:(C)
季節性是在特定的周期間隔內變化的存在。
分布的變化可以在多個盒圖中觀察到。因此,可以很容易地發現季節性。自相關圖應在等于周期的滯后處顯示峰值。
A)是 B)假
解決方案:(A)
當滿足以下條件時,時間序列是平穩的。
平均值是恒定的,不依賴于時間
自協方差函數僅取決于s和t的差| s-t |。(其中t和s是時間點)
考慮的時間序列是一個有限方差過程
這些條件是數學上表示要用于分析和預測的時間序列的必要先決條件。因此,平穩性是理想的屬性。
如果給定窗口大小2,特征X的滑動平均值是多少?
注意:X欄代表滑動平均值。
A)
B)
C)
D)以上都不是
解決方案: (B)
X` = Xt-2 + Xt-1 / 2
根據以上公式:(100 +200)/ 2 = 150; (200 + 300)/ 2 = 250,依此類推。
模型1:決策樹模型
模型2:時間序列回歸模型
在對這兩個模型進行評估的最后,你發現模型2比模型1更好。
A)模型1不能像模型2那樣映射線性關系 B)模型1總是比模型2更好 C)你不能將決策樹與時間序列回歸進行比較 D)這些都不是
解決方案: (A)
時間序列模型類似于回歸模型。因此,它擅于找到簡單的線性關系。基于樹的模型雖然有效,但在發現和利用線性關系方面卻并不那么擅長。
A)時間序列分析 B)分類 C)聚類 D)以上都不是
解決方案:(A)
本題獲取了連續幾天的數據,因此最有效的分析類型是時間序列分析。
A)15,12.2,-43.2,-23.2,14.3,-7 B)38.17,-46.11,-4.98,14.29,-22.61 C)35,38.17,-46.11,-4.98,14.29,-22.61 D)36.21, -43.23,-5.43,17.44,-22.61
解決方案:(B)
73.17-35 = 38.17 27.05-73.17 = – 46.11,依此類推。 13.75 – 36.36 = -22.61
{23.32 32.33 32.88 28.98 33.16 26.33 29.88 32.69 18.98 21.23 26.66 29.89} 時間序列滯后一個樣本的自相關是什么?
A) 0.26 B) 0.52 C) 0.13 D) 0.07
解決方案:(C)
ρ?1 = PT <sub>t = 2</sub>(x <sub>t-1</sub>- xˉ)(x <sub>t</sub>- xˉ)PT<sub>t = 1</sub>(x<sub>t</sub>-xˉ)^2
=(23.32-x′)(32.33-x′)+(32.33-x′)(32.88-x′)+···PT <sub>t = 1</sub>(x<sub>t</sub> -x′)^2
= 0.130394786
其中x是級數的平均值,為28.0275
A)真 B)假
解決方案:(A)
弱平穩時間序列 x<sub>t</sub> 是有限方差過程,因此
平均值函數 μt 是常數,并且不依賴于時間t;并且(ii)定義的自協方差函數γ(s,t)僅依賴于s和t的差| s-t |。
在各種頻率下振蕩的正弦和余弦的隨機疊加是白噪聲。白噪聲是微弱的或平穩的。如果白噪聲變量也呈正態分布或高斯分布,則該序列也是嚴平穩的。
A)xs和xt的間隔 B)h = | s – t | C)在特定時間點的位置
解決方案:(C)
通過定義上一個問題中描述的弱平穩時間序列。
A)它們都是平穩的 B)交叉方差函數僅是滯后h的函數 C)僅A D)A和B
解決方案:(D)
聯合平穩性是根據上述兩個條件定義的。
A)因變量的當前值受自變量的當前值影響 B)因變量的當前值受自變量的當前值和過去值影響 C)因變量的當前值受因變量和自變量的過去值影響 D)以上都不是
解決方案:(C)
自回歸模型基于這樣的思想,即序列的當前值xt可以解釋為p個過去值xt-1,xt-2,…,xt-p的函數,其中p決定了預測當前值所需的過去步進數。例如 xt = xt-1 -.90xt-2 + wt,
其中xt-1和xt-2是因變量和wt的過去值,白噪聲可以表示獨立值。
該示例可以擴展為包括類似于多元線性回歸的多序列。
A)真 B)假
解決方案:(A)
正確,因為MA模型的自協方差是可逆的
請注意,對于MA(1)模型,對于θ和1 /θ,ρ(h)相同。
A)AR(1)MA(0) B)AR(0)MA(1) C)AR(2)MA(1) D)AR(1)MA(2) E)不能判斷
解決方案:(B)
滯后1的強負相關表明MA只有1個顯著滯后。閱讀本文以獲得更好的理解。
https://www.analyticsvidhya.com/blog/2015/12/complete-tutorial-time-series-modeling/
A)均值= 0 B)自協方差為0 C)自協方差為0(零滯后除外 D)二次方差
解決方案:(C)
白噪聲過程必須具有恒定的均值,恒定的方差和無自協方差結構(滯后零(方差)除外)。
A)在滯后3時ACF = 0 B)在滯后5中ACF = 0 C)在滯后1中ACF = 1 D)在滯后2中ACF = 0 E)在滯后3和滯后5中ACF = 0
解決方案:(B)
回想一下,MA(q)過程僅具有長度為q的記憶。這意味著,所有自相關系數在滯后q以后的值為零。這可以通過檢查MA方程并看到只有過去的q個擾動項進入方程來看出。
因此,如果我們向前迭代此方程超過q個周期,則擾動項的當前值將不再影響y。由于滯后零的自相關函數是時間t處的y與時間t處的y的相關性(即y_t與自身的相關性),因此根據定義,滯后0處的自相關函數必須為1。
A)1.5 B)1.04 C)0.5 D)2
解決方案:(B)
擾動的方差除以(1減去自回歸系數的平方)
在這種情況下為:1 /(1-(0.2 ^ 2))= 1 / 0.96 = 1.041
A)AR和MA模型:錯誤 B)AR和ARMA模型:正確 C)MA和ARMA模型:錯誤 D)ARMA系列中的不同模型
解決方案:(B)
A)二次趨勢 B)線性趨勢 C)A和B都是 D)以上都不是
解決方案:(A)
第一個差分表示為 xt = xt ?xt?1. (1)
如我們所見,第一個差分消除了線性趨勢。第二個差分(即(1)的差分)可以消除二次趨勢,依此類推。
A)k-折交叉驗證 B)留一法交叉驗證 C)Stratified Shuffle Split交叉驗證 D)前向鏈交叉驗證
解決方案:(D)
時間序列是有序數據。因此,必須對驗證數據進行排序。前向鏈可確保這一點。其工作方式如下:
fold 1:訓練[1],測試[2]
fold 2:訓練[1 2],測試[3]
fold 3:訓練[1 2 3],測試[4]
fold 4:訓練[1 2 3 4],測試[5]
fold 5:訓練[1 2 3 4 5],測試[6]
A)真 B)假
解決方案:(A)
AIC = -2 * ln(likelihood)+ 2 * k,
BIC = -2 * ln(likelihood)+ ln(N)* k,
當:
k = 模型自由度
N = 觀察數
在N相對較低時(7及以下),BIC比AIC更能容忍自由參數,但在N相對較高時則容忍度較低(因為N的自然對數大于2)。
A)通過獲取日志來轉換數據 B)對序列求差分以獲取平穩數據 C)將MA(1)模型擬合到時間序列
解決方案:(B)
自相關顯示出確定的趨勢,而部分自相關顯示出波動的趨勢,在這種情況下,采用對數是沒有用的。對序列求差分以獲得平穩序列是唯一的選擇。
這些結果總結了簡單指數平滑與時間序列的擬合。
A)0.2,0.32,0.6 B)0.33,0.33,0.33 C)0.27,0.27,0.27 D)0.4,0.3,0.37
解決方案:(B)
指數平滑的預測值在3年中都是相同的,因此我們所需要的只是明年的值。平滑的表達式是
smooth<sub>t</sub> = α y<sub>t</sub> + (1 – α) smooth <sub>t-1</sub>
因此,對于下一個點,平滑的下一個值(下一個觀察的預測)為
smooth<sub>n</sub> = α y<sub>n</sub> + (1 – α) smooth <sub>n-1</sub>
= 0.39680.43 + (1 – 0.3968) 0.3968
= 0.3297
這些結果總結了簡單指數平滑對時間序列的擬合。
A)0.3297 2 * 0.1125 B)0.3297 2 * 0.121 C)0.3297 2 * 0.129 D)0.3297 2 * 0.22
解決方案:(B)
預測誤差的標準偏差為
1個周期為 0.1125
2個周期為 0.1125 sqrt(1+α2) = 0.1125 * sqrt(1+ 0.39682) ≈ 0.121
如果ARIMA模型中的自回歸參數(p)為1,則表示序列中不存在自相關。
如果ARIMA模型中的移動平均成分(q)為1,則表示序列中具有滯后1的自相關
如果ARIMA模型中的積分成分(d)為0,則意味著系列不是平穩的。
A)僅1 B)1和2均 C)僅2 D)所有陳述
解決方案:(C)
自回歸分量:AR代表自回歸。自回歸參數由p表示。當p = 0時,表示序列中不存在自相關。當p = 1時,表示序列自相關到一個滯后。
積分:在ARIMA時間序列分析中,積分用d表示。積分是微分的倒數。
當d = 0時,這意味著級數是平穩的,我們不需要取其差。
當d = 1時,這意味著該序列不是平穩的,并且要使其平穩,我們需要求第一差分。
當d = 2時,表示序列需要二次差分。
通常情況下,兩個以上的差分是不可靠的。
移動平均分量:MA表示移動平均,用q表示。在ARIMA中,移動平均q = 1表示它是一個誤差項,并且存在一個滯后的自相關。
A)小于1 B)大于1 C)等于1 D)季節性不存在 E)數據不足
解決方案:(B)
由于有四個季度,所以季節指數必須總計為4。0.80 + 0.90 + 0.95 = 2.65,因此對于4的季節指數個季度必須是4-2.65 = 1.35,所以B是正確的答案。
到此,關于“機器學習中測試時間序列的問題有哪些”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。