Data Science

Data Scientist- najgorętszy zawód najbliższych lat

Data Science to termin, który przebojem wszedł na rynek i wszystko wskazuje na to, że w najbliższych latach będzie to jeden z najbardziej pożądanych zawodów IT, a tym samym prawdziwy hit na giełdzie pracy.

Szacuje się, że w ciągu kilku lat internet powiększy swój rozmiar nawet dziewięciokrotnie. Jak widać ilość danych rośnie w tak zastraszającym tempie, że za chwilę hasło Big Data będzie trzeba zastąpić innym, lepiej oddającym to zjawisko. Wraz z danymi rośnie też zapotrzebowanie na osoby, które będą w stanie nie tylko w konkretny sposób je przetworzyć i uporządkować, ale też wyciągnąć z nich sensowne wnioski.

Do tej pory danymi zajmowali się analitycy, statystycy i programiści, ale obecnie potrzebni są specjaliści, których działania w pewnym stopniu będą łączyć powyższe zawody.

Zgłoszenia na kurs przyjmujemy mailowo pod adresem: szkolaprogramowania@codeskills.pl

 

Naszym trenerem jest:

Data Science

 

 

Michał Mikołajewicz

Ukończył Uniwersytet Ekonomiczny w Poznaniu. Tematyką Data Science zajmuje się już od dobrych kilku lat. Jego hobby to nowe technologie, sport i motoryzacja.

LinkedIn: Michał Mikołajewicz

 

Czym zajmuje się Data Scientist?

Praca osoby na tym stanowisku jest bardzo zróżnicowana. Data Scientist gromadzi i przetwarza dane nieuporządkowane, a następnie szuka w nich trendów i zależności. Z całego gąszczu danych, które zwykłemu człowiekowi nie mówią absolutnie nic, potrafi wyłuskać kluczowe informacje pozwalające na polepszenie jakości usług oraz poprawienie wyników finansowych firmy. Ważną częścią jego pracy jest tzw. wizualizacja danych, czyli umiejętność graficznego zaprezentowania wniosków płynących z analizy.

Jakie umiejętności i kompetencje musi posiadać osoba, która chciałaby się rozwijać w kierunku Data Science?

Podstawowe umiejętności, jakimi musi wykazać się Data Scientist, by dostać pracę, to znajomość statystyki, języków programowania, takich jak R, Python czy SAS oraz technik analitycznych (m.in. uczenie maszynowe). Dobrze, by oprócz gruntownej wiedzy merytorycznej Data Scientist posiadał również prawidłowo rozwinięte umiejętności miękkie, ponieważ jego praca wymaga komunikacji zarówno z działami IT, jak i środowiskiem biznesowym. Poza tym powinien cechować się ciekawością, dociekliwością i intuicją, a także umiejętnością rozwiązywania problemów.

Gdzie Data Scientist znajdzie pracę?

Jest to zawód, który daje szerokie pole do popisu. Specjaliści Data Science poszukiwani są wszędzie dam, gdzie gromadzi się dane, czyli właściwie wszędzie. Dlatego mogą liczyć na dobrą posadę zarówno w sektorze finansowym, jak i w marketingu.

Program zajęć:

1. Stworzenie środowiska pracy
Instalacja R z repozytorium CRAN (Microsoft R Open & MKL)
Dostosowanie środowiska pracy
R Studio: GUI do korzystania z języka R
(poruszanie się po najpopularniejszym interfejsie do programowania w R, korzystanie z pomocy, instalacja dodatkowych pakietów, itp.)
Konfiguracja środowiska Python
Instalacja różnych dystrybucji Python, konfigurowanie środowiska pracy, poruszanie się po GUI, wywoływanie komend, korzystanie z pomocy, itp.
Rodeo
Visual Studio

2. System kontroli wersji (GIT)
Wprowadzenie do kontroli wersji
Instalacja + wstępna konfiguracja środowiska
Tworzenie własnego repozytorium
Rejestrowanie i cofanie zmian
Praca ze zdalnym repozytorium
Tworzenie i zarządzanie gałęziami
Praca z GIT na serwerze
Hosting GIT
Debugowanie z systemem kontroli wersji
Dostosowywanie GIT
Mechanizmy wewnętrzne
Github

3. Języki programowania:
R
Instalacja oraz podstawowe komendy
Typy danych i operacje
Wczytywanie i zapisywanie danych
Przeczesywanie danych
Operacje wektorowe
Daty i czas
Data Frame’y
Pętle
Funkcje
Funkcje wektorowe
Wyrażenia regularne
Debugowanie

Python
Instalacja oraz podstawowe komendy
Wczytywanie i zapisywanie danych
Ipython
Użycie bibliotek NumPy & Pandas
Przeczesywanie danych
Czyszczenie, transformowanie i łączenie danych
Agregowanie danych
Szeregi czasowe
Zaawansowane operacje

4. Statystyka
Wprowadzenie do statystyki
Zmienne i rozkłady
Statystyki opisowe
Korelacja
Testowanie hipotez
Przedziały ufności
Regresja liniowa
Testy statystyczne
Analiza wariancji

5. Wizualizacja danych
Podstawowe pakiety wizualizacji danych w programie R
Pakiet ggplot2 – bardziej zaawansowana wizualizacja
Rysowanie map
Tworzenie raportów i/ lub dokumentów
Interaktywne aplikacje webowe

6. Analiza danych
Data mining w praktycznym zastosowaniu – Use Case

7. Machine Learning
Czym jest Machine Learning? – wprowadzenie
Supervised Learning
Unsupervised Learning
Reinforcement Learning
Regresja i Klasyfikacja
Drzewa decyzyjne
Wnioskowanie Bayesowskie
Klasteryzowanie
Tuning algorytmów
Dobór zmiennych
Teoria Gier
Łańcuchy Markova

8. Big Data
Wprowadzenie do koncepcji Big Data
Map Reduce
Hadoop
Przepływ danych
Analityka Big Data (Pig Hive)
Machine Learning na Big Data (Storm, Spark)
Wyszukiwarki pełnotekstowe
Cloud Computing

9. Deep learning

 

Ilość miejsc ograniczona!

Zapisz się!