1 / 13

Talend Open Studio

Talend Open Studio. Ing. David Pejčoch Tutorial. Instalace a spuštění. Stáhněte zip soubor z webu Talend.com (velikost cca 240 MB) Rozzipujte na disk H Spusťte TOS_DQ-win32-x86.exe Při spuštění přeskočte registraci kliknutím na „Register Later“. Stažení z webu Talend.com.

Download Presentation

Talend Open Studio

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Talend Open Studio Ing. David Pejčoch Tutorial

  2. Instalace a spuštění • Stáhněte zip soubor z webu Talend.com (velikost cca 240 MB) • Rozzipujte na disk H • Spusťte TOS_DQ-win32-x86.exe • Při spuštění přeskočte registraci kliknutím na „Register Later“

  3. Stažení z webu Talend.com

  4. Talend Open Studio: úvodní obrazovka

  5. Integrovaný help „for Dummies“ Help se zobrazuje v záložce v pravé části úvodního okna. Neumožňuje přímé spouštění wizardů, pouze odkazuje na jednotlivé kroky.

  6. Vytvoření připojení k databázi

  7. Připojení k MySQL Vyplňte příslušný login, heslo, adresu serveru a název databáze.

  8. Vytvoření pravidel pro oskórování dat

  9. Popis základních funkčních prvků • Rules = pouze WHERE klauzule • Patterns = vzory pro validaci • pomocí regulárních výrazů (nástroj obsahuje předpřipravené regulární výrazy v různých složkách podle domén) • pomocí SQL LIKE klauzule specifické pro různá RDBMS • Source files = SQL příkazy, které lze spustit pomocí Data Expolreru (v rámci existujícího připojení na databázi) • Indicators = SQL příkazy s využitím sady předdefinovaných templatů • Pattern Matching: počet záznamů, které vyhovují regulárnímu výrazu; počet záznamů, které vyhovují SQL LIKE klauzuli • Pattern Finder = hledání četností vzorů • Soundex: tabulka četností Soundex hodnot • ...

  10. Popis funkcionalit v rámci DB Connection • Na úrovni připojení: porovnání databází, overview analýza (počty tabulek, řádků, indexů v tabulkách) • Na úrovni databáze: overview analýza • Na úrovni seznamu tabulek: porovnání tabulek • Na úrovni tabulek: • analýza tabulky pomocí SQL rules, • column analysis (na základě výběru datového typu, vzoru, indikátoru, sloupců a where podmínky provede analýzu s grafickým výstupem), • pattern frequency analysis (viz. předchozí, ale zkoumá četnosti vzorů; z výsledků lze vidět záznamy odpovídající jednotlivým vzorům, generovat ze vzorů regulární výrazy) • preview table (přehodí do módu s konzolí pro SQL)

  11. Popis funkcionalit v rámci DB Connection • Na úrovni sloupce: • Analýza hodnot z množiny sloupců • Analýza korelace mezi sloupci • Analýza kategorií nominální proměnné • Pattern frequency analysis + další viz na úrovni tabulek

More Related