Program studiów
Hurtownie i eksploracja danych (wybieralny)
W ciągu ostatnich kilkunastu lat bardzo rozwinął się rynek aplikacji analitycznych, które na podstawie dużej ilości danych archiwalnych umożliwiają znajdowanie zależności i trendów, ułatwiających na przykład planowanie sprzedaży lub ocenę ryzyka biznesowego. Sieć marketów, po przeanalizowaniu setek tysięcy transakcji, może odkryć reguły, którymi kierują się klienci podczas zakupów. Sklep internetowy na podstawie dotychczasowych zamówień może sugerować klientowi dodatkowe produkty („osoby, które wybrały ten towar, kupiły również...”). Analiza taka oparta jest na statystyce matematycznej, technikach maszynowego uczenia się, a także specjalistycznym oprogramowaniu, w którym metody te są zaimplementowane.<br/><br/>Przedmiot wybieralny „Hurtownie i eksploracja danych” to szansa na zapoznanie się ze współczesnymi metodami i technologiami gromadzenia oraz przetwarzania analitycznego danych. W pierwszej części kursu uczestnicy uczą się budowania zapytań analitycznych w bazach OLTP z wykorzystaniem operatorów, klauzul i funkcji języka SQL służących do grupowania i agregowania danych. Studenci poznają również mechanizmy łączenia danych korzystające z poleceń języka SQL i pakietów integracji danych. Później jednak – dosłownie – następuje przejście do innego wymiaru, gdyż uczestnicy kursu uczą się projektować i implementować bazy danych typu OLAP, korzystając z języka MDX i tworząc raporty hurtowni danych przy użyciu programów arkuszy kalkulacyjnych oraz usług raportowania. Ostatni duży dział przedmiotu poświęcony jest metodom eksploracji danych, takim jak: klasyfikacja, drzewa decyzyjne, grupowanie i reguły asocjacyjne. Praktyczne ćwiczenia z tego zakresu obejmują: konfigurowanie wybranego środowiska eksploracji danych, tworzenie modeli eksploracji z wykorzystaniem narzędzi wizualnych i języka DMX oraz importowanie i przetwarzanie danych źródłowych analizy.