Szkolenie Jakość danych w biznesie

Jakość danych w biznesie

Rosnąca ilość danych w organizacjach w większości przypadków nie idzie w parze z ich jakością. Różne źródła danych, różne formaty, różni właściciele, niespójne procesy zarządzania danymi, to wszystko generuje rosnący problem z jakością informacji i jakością decyzji podejmowanych na ich bazie. W ramach szkolenia uczestnicy poznają procesy biznesowe związane z zarządzaniem danymi, ustalaniem odpowiedzialności za dane oraz mierzenia jakości informacji prezentowanych na raportach.

Zakres szkolenia

  • Znaczenie, dobór i przetwarzanie danych
  • Definiowanie jakości danych
  • Ocena jakości przechowywanych danych
  • Poprawa jakości danych
  • Profilowanie danych
  • Praktyczne przykłady oceny jakości zbioru danych
  • Systemy wspomagające utrzymanie jakości danych: MDM, DQM i inne
  • Demonstracja systemu wsparcia jakości danych i jego wpływ na jakość informacji
  • Dyskusja nt. nabytej wiedzy i doświadczeń Codec z wdrożeń

Odbiorcy szkolenia

  • Osoby odpowiedzialne za zarządzanie danymi w firmie,
  • Chief Data Officer,
  • członkowie zespołów kompetencyjnych Business Intelligence,
  • architekci hurtowni danych i rozwiązań Business Intelligence
  • oraz inne osoby, dla których jakość danych jest kluczowym elementem pracy.

Forma szkolenia

Szkolenie jest zaplanowane w formie warsztatów (wykłady teoretyczne połączone z ćwiczeniami praktycznymi). Czas trwania: 2 dni po 8 godzin lekcyjnych po 45 minut.

W przypadku szkoleń dedykowanych możliwe jest rozszerzenie lub skrócenie zakresu merytorycznego.

W trakcie szkolenia uczestnicy zostaną zaznajomieni z teoretycznymi podstawami każdej z sekcji szkolenia a większości tychże sekcji będą oni mogli utrwalić nabytą wiedzę w formie ćwiczeń wykonywanych na indywidualnych stanowiskach komputerowych (zapewniamy sprzęt).

Wypełnij formularz

Wypełnienie formularza jest wstępną deklaracją uczestnictwa tzn. do momentu ostatecznych uzgodnień nie obliguje do niczego.

Wyrażam zgodę na przetwarzanie moich danych osobowych w celach i zakresie zgodnymi z realizacją usług szkoleniowych opisanej w Polityce prywatności Codec. Wiem, że zgodę tą mogę w każdej chwili wycofać.

Program szkolenia

1. Ogólne informacje o znaczeniu, doborze i przetwarzaniu danych

W pierwszej części szkolenia przedstawione zostaną założenia teorii informacji w zakresie opisywania procesów biznesowych poprzez dane; definicja danych; ich znaczenie dla realizacji bieżących i przyszłych potrzeb biznesowych.

Zostanie także omówione pochodzenie danych ze względu na źródło (ręczne wprowadzanie, import (push vs pull), integracja z innymi systemami, transformacje wewnętrzne, inwentaryzacja biznesowa i techniczna (metadane) oraz ocena użyteczności danych vs wymagania biznesowe.

Pierwsza sekcja zakończy się przeglądem systemów przechowywania danych: lokalne i rozproszone bazy danych, pliki tekstowe, arkusze kalkulacyjne, XML, Big Data, relacyjne, wielowymiarowe i dokumentowe bazy danych, EAV.

2. Definiowanie jakości danych

W trakcie tej sekcji uczestnicy zapoznają się z podstawowymi wiadomościami o procedurach opisu danych względem informacji, jakie mają przechowywać:

  • Typy danych, dziedziny, zakresy
  • Sekcja ta zakończy się ćwiczeniami w zakresie prezentowania typów danych oraz każdego z omówionych typów błędów danych.

Sekcja ta zakończy się ćwiczeniami w zakresie prezentowania typów danych oraz każdego z omówionych typów błędów danych.

3. Ocena jakości danych

Niniejsza sekcja pozwoli uczestnikom na szersze spojrzenie na jakość danych jako część procesu ich zarządzania poprzez pracę z całymi zestawami danych (w porównaniu z poprzednią sekcją skupioną na pojedynczych atrybutach). Jej temat obejmie swoim zakresem:

  • Definiowanie „mierzalności” jakości danych (miary jakości, umowne zakresy poprawności)
  • Raportowanie pomiarów jakości danych
  • Analizowanie błędów i badanie przyczyn złej jakości danych

Mając wiadomości o tworzeniu analizy jakości danych uczestnicy zbudują przykładowy raport jakości danych.

4. Zarządzanie danymi w organizacji

W tej krótkiej części zostaną zaprezentowane podstawy budowy procesów zarządzania danymi od strony biznesowej

  • Katalog danych, grupowanie atrybutów, encje i pochodzenie ich atrybutów, ocena atrybutów pod kątem kryteriów jakości danych (dokładność, dostępność, kompletność, rozkład, duplikacja, itp.)
  • Formalne zarządzanie danymi jako aktywami wewnątrz organizacji (dostępność, użyteczność, integralność oraz bezpieczeństwo)
  • Rola data stewarda

Na zakończenie uczestnicy zapoznają się z przykładami arkuszy klasyfikacji danych jako narzędzi pomocnych w zarządzaniu informacją.

5. Poprawa jakości, metadane oraz profilowanie danych

Ze względu na niekiedy ograniczoną możliwość korekty danych w systemach źródłowych należy tę operację wykonać w trakcie przetwarzania danych. Niniejsza część szkolenia skupi się na metodach zwiększania jakości danych. Będą to m.in.:

  • Profilowanie danych
  • Ocena i walidacja
  • Strategia oczyszczania
  • Oczyszczanie i wzbogacanie
  • Monitorowanie

Uczestnicy będą także mieli okazję sami przyjrzeć się przykładowemu narzędziu, który pozwala na dostarczanie kompleksowych informacji o danych, w tym o ich jakości.

6. Systemy wspomagające utrzymanie jakości danych: MDM, DQM

W tej praktycznej części słuchacze zaznajomią się z praktycznym wpływem pracy data stewarda na jakość danych prezentowanych na raportach zarządczych. W szczególności ćwiczenia zostaną przeprowadzone za pomocą:

  • Master Data Management – zarządzanie „złotym rekordem” w organizacji
  • Data Quality Management – automatyczna korekcja danych

7. Dyskusja nt. nabytej wiedzy i doświadczeń Codec z wdrożeń

Ostatnia część szkolenia obejmie pytania i praktyczne podejście do kwestii jakości danych w różnego rodzaju organizacjach (m.in. instytucjach finansowych).

Prowadzący

Zapewniamy praktyków, a nie teoretyków.

Hubert Kobierzewski
Hubert pracuje w firmie Codec jako BI Practice Lead i pomaga klientom zebrać ich dane oraz przekonwertować je w wartościowe informacje. Od lat związany z tematyką szeroko rozumianych rozwiązań Business Intelligence – od integracji, jakości danych, hurtowni danych, po zaawansowane systemy analityczne i raportowe. Realizował projekty dla wielu film w Polsce, Irlandii, UK, czy Szwajcarii. Poza pracą Hubert prowadzi dwie grupy społecznościowe: warszawski oddział Data Community Poland oraz Warsaw Power BI User Group.

Terminy

Termin jest ustalany z uczestnikami po zebraniu grupy minimalnej tj. 6 osób.

Miejsce

  • Warszawa
  • W przypadku szkolenia dedykowanego lub zebrania grupy zainteresowanej inną lokalizacją – miejsce może być ustalane indywidualnie (podana cena dotyczy szkolenia w Warszawie).

Cena

Cena szkolenia w Warszawie: 1600 pln + VAT.  (Cena obejmuje: uczestnictwo w zajęciach, wynajęcie sprzętu, materiały szkoleniowe, przerwy kawowe, lunch.)