先說它的優點:
1.通過圖片的矩陣循環,增加訓練樣本,提高正確率。
2.傅裏葉變換避免了矩陣求逆運算,計算速度更快。
3.使用高斯標簽更合理。
現在我們來梳理壹下整個計算過程:
1.目標函數:
我們的目標是最小化采樣數據的計算標簽f(xi)和下壹幀中真實目標位置的真實標簽yi(回歸目標)之間的距離。(這個應該不難理解。我計算的標簽越像真實的標簽,我找到的下壹幀就越接近它的真實位置。)
這種表示形式就是嶺回歸,後面部分的求解過程可以參考SVM的求解過程。雖然不是完全壹樣的形式,但是對於幫助理解本文中的解法還是很有用的(表達式的含義和解法在文章《支持向量機普及入門(了解SVM三個層次)LaTex最新版_2015.1.9.pdf》中寫得很清楚)。
在線性問題中:
這裏求解最小值時,f(xi)根據公式(1)變成矩陣形式Wt*X(為什麽能轉換成這種形式參考SVM),其中X的每壹行代表壹個采樣結果的xi,X是通過第壹行的xi連續循環得到的矩陣,Wt代表w的轉置,Y代表yi組成的向量。然後計算公式(2)對w的導數等於0,得到:
公式(4)將公式(3)中的換位轉換成* * *軛,只要在下面的傅立葉變換中出現負數。
這裏我們看到在求W的最小值時有矩陣求逆的運算,使得計算量比較大。然而,根據前面的陳述,X是循環矩陣的形式:
在矩陣被傅立葉變換之後,循環矩陣具有壹個性質:
也就是說,循環矩陣可以由其第壹行中的向量的傅立葉變換來表示,並且帶有帽子的X意味著向量X被傅立葉變換。關於傅立葉變換的詳細理解,請參考這篇傅立葉博客。
如何進行傅裏葉變換,請參考:傅裏葉變換法。
然後我們可以發現循環矩陣可以轉化為向量。將等式(6)簡化為等式(4):
w戴帽子就是傅裏葉變換,把運算從矩陣變成向量。減少了反轉的操作。
當然,在大多數情況下,我們解決非線性問題:
然後我們引入高維解和核函數的概念(詳細解請參考上面提到的SVM的文章)。
在高維空間中,非線性問題w可以變成線性問題。
Fai(xi)表示將x映射到高階空間的函數。
那麽我們的目標函數可以表示為
其中k代表核函數,其定義操作如下:
從(8)可以看出,求最小值w的問題已經轉化為求最小值α的問題。“R. Rifkin、G. Yeo和T. Poggio”文章,“規範租賃-平方分類,北約科學系列子系列III計算機和系統科學,第190卷,第131–154頁,2003年。”
終於可以解決了
執行傅立葉變換:
這裏Kxx表示K矩陣的第壹行元素的傅立葉變換。k也是循環矩陣。請參考“使用內核化相關濾波器的高速跟蹤”恩裏克斯、魯伊·卡塞羅、佩德羅·馬丁斯和若熱·巴蒂斯塔”。
這樣,等式(8)可以表示為:
Kz是所有訓練樣本和候選補片之間的核矩陣。
現在我們只討論K的形式,如果K是線性核,那麽在討論線性問題時,經過傅裏葉變換後可以轉換成W的形式。本文采用高斯核,形式如下:
這是其中使用的主要公式。
敲下壹幀的地方,就是計算采樣的特征,和之前訓練的數據做高斯匹配然後乘以alpha,得到響應值最大的地方,也就是下壹幀的最大可能值。