70 likes | 322 Views
動態時間 校正 ( Dynamic Time Warping ). 動態時間校正. 兩個 N 維空間的向量,它們之間的距離可以定義為 兩點之間的直線 距離, 稱為歐基里得距離( Euclidean Distance ) 假設有兩個 3 維 空間的向量,分別為 x (4 , 7) 與 y (7 , 11) ,則此兩向量之間的距離為 :. 動態時間校正. 若兩個向量 的長度不同,那它們之間的距離 ,可利用動態時間校正來解決
E N D
動態時間校正 • 兩個N維空間的向量,它們之間的距離可以定義為兩點之間的直線距離,稱為歐基里得距離(Euclidean Distance) • 假設有兩個3維空間的向量,分別為x(4 , 7)與y(7 , 11),則此兩向量之間的距離為:
動態時間校正 • 若兩個向量的長度不同,那它們之間的距離,可利用動態時間校正來解決 • 假設有兩個向量t(t1,t2,…,tN)與r(r1,r2,…,rM),它們各別的長度為N與M,則DTW 的目標是要找出一條最短路徑,使得兩向量的距離最小 r4 r3 r2 r1 t1 t2 t3 t4 t5 t6
動態時間校正 • 路徑必須滿足下列條件: • 端點關係:頭對頭、尾對尾 • 局部關係:假設某一點D(i, j)為最佳路徑上的點,其前一點路徑只有三種可能:D(i-1 , j)、D(i-1 , j-1)和D(i , j-1)
DTW 步驟 • 定義D(i , j)為ti與rj之間的距離值 • 利用遞迴找出向量t與r之間的最小累積距離值A(N,M),其遞迴關係如下所示: 其中D(i,j)為ti與rj之間(i , j)的距離值 A(i,j)為原點(1 , 1)到(i , j)的最小累積距離值
動態時間校正 4 6 1 3 8 4 0 10 2 2 3 5 2 3 5 7 5 0 5 1 0 7 3 2 各點的距離值 5 9 14 10 13 17 12 -1 18 9 6 6 11 16 4 11 16 4 8 8 16 2 1 13 6 6 16 18 1 -3 2 9 -1 4 從原點到各點之最小累積距離值
動態時間校正 • 延伸到聲紋辨識上 • 假設每個音框有N維的特徵向量,則樣本音框SF1與測試音框TF1之間的距離D(1 , 1)為: 樣本音框(SF) SF4 SF3 SF2 SF1 測試音框(TF) TF1 TF2 TF3 TF4 TF5 TF6