1 / 17

Karol Kuryło karol@kurylo

Slowly changing dimension w SSIS. Karol Kuryło karol@kurylo.net. Agenda. Co to jest wymiar ? Co to jest wymiar SCD ? Typy wymiarów SCD Metody implementacji w SSIS Demo. Co to jest wymiar. Wymiar pozwala grupować, filtrować i nazywać fakty, np.: Wymiar Pracownik Wymiar Produkt

yaphet
Download Presentation

Karol Kuryło karol@kurylo

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Slowlychangingdimension w SSIS Karol Kuryło karol@kurylo.net

  2. Agenda • Co to jest wymiar ? • Co to jest wymiar SCD ? • Typy wymiarów SCD • Metody implementacji w SSIS • Demo

  3. Co to jest wymiar • Wymiar pozwala grupować, filtrować i nazywać fakty, np.: • Wymiar Pracownik • Wymiar Produkt • Wymiar Region • Wymiar Czas • Każdy wymiar posiada atrybuty np. w przypadku wymiaru pracownika mogą to być: • Imię • Nazwisko • Oddział • Płeć

  4. Co to jest wymiar SCD • To wymiary zawierające atrybuty zmieniające się w czasie • Wymiary gdzie atrybuty zmieniają się bardzo często, dynamiczne, w regularnych interwałach czasowych to nie jest SCD.

  5. Typy wymiarów SCD • Typ 0 – bez zmian • Typ 1 – zmiany są nadpisywanie • Typ 2 – dodanie nowego wiersza, oznaczenie starego • Typ 3 – wykorzystanie dodatkowej kolumny w tabeli • Typ 4 – dodatkowa tabela z danymi historycznymi • Hybrydy

  6. SCD Type 1 • Nadpisuje stare dane nowymi • Brak historii

  7. SCD Type 2 • Tworzy nowy rekord • Stary oznacza jako nieaktualny • Nieograniczona historia

  8. SCD Type 2

  9. SCD Type 2 & Type 1

  10. SCD Type 3 • Wykorzystanie dodatkowych kolumn na dane historyczne • Historia ograniczona do liczby dodatkowych kolumn

  11. Metody implementacji DEMO

  12. SCD Wizard • Standardowy komponent SSIS • Wolny • Niewielka możliwość konfiguracji • Case sensitive, trailingspacessensitive • Próba ponownego uruchomienia wizarda – zupełnie niszczy dotychczasowy data flow • Nie wspiera generowania kluczy podstawowych • Domyślnie wstawia NULL w pole daty wygaśnięcia rekordu • (zmiana tego i ponowne uruchomienie wizarda, niszczy data flow) • Nie można oznaczyć usuniętych wierszy

  13. Merge • Dużo szybszy niż SCD Wizard • Elastyczny • Mało przejrzysty w konfiguracji

  14. CheksumTransformation • Dużo szybszy niż SCD Wizard • Wspierane algorytmy: • Originalchecksum – depreciated od SQL 2005 RTM • .Net Framework Cheksum – różne wartości na systemach 32/64 bitowych • CRC32 – domyślny (problemy z unikalnością) • Do ściągnięcia: • http://www.sqlis.com/sqlis/

  15. MultipleHash • Dużo szybszy niż SCD WIzard • Wspierane algorytmy: • MD5, • SHA1, • SHA256, • SHA384, • SHA512 • Możliwość generowania kilku skrótów w jednej transformacji • Do ściągnięcia: • http://ssismhash.codeplex.com/

  16. DimensionMerge SCD • Dużo szybszy niż SCD Wizard • Stanowczo najbardziej rozbudowane narzędzie • Szybki, bardzo dużo opcji • Na początku może być trudny w konfiguracji • Do ściagnięcia: • http://dimensionmergescd.codeplex.com/

  17. Dziękuję za uwagę! karol@kurylo.net

More Related