látogató számláló
HU | ENG

Data Science bevezető

Áttekintés

A kétszer félnapos workshop során röviden áttekintjük a nyelv alapjait, és könnyed gyakorlatok segítségével megismerkedünk a működésével, lehetőségeivel. A gyors ismerkedés után a Python legfontosabb adatelemzési (pandas) és általánosan használt gépi tanulási (scikit-learn) könyvtárai segítségével fogjuk előkészíteni a beolvasott adatokat, majd gépi tanuló algoritmusok segítségével kiaknázni az adatokban rejlő értékeket.

Manapság minden adatokkal kapcsolatos témában megkerülhetetlen a mesterséges intelligencia. Tanfolyamunk során az MI-t körülvevő misztikumot oszlatjuk el a legfontosabb gépi tanuló algoritmusok érthető bemutatásával, egy-egy működő példa felépítésével, majd egy kiválasztott probléma közös megoldásával.

 

Kinek szól?

Ezt a tanfolyamot azoknak javasoljuk, akik munkájuk során gyakran találkoznak adatelemzési feladatokkal, érdeklődnek a mesterséges intelligencia iránt és szeretnék megismerni a Python nyelv ezt támogató eszközeit.

 

Előfeltételek

Előzetes programozási tudásra nincs szükség, némi Excel tapasztalat és érdeklődés az adatelemzés iránt hasznos.

 

Tematika

Bevezetés a Pythonba

  • Mi is az és miért éppen a Python?
  • Ismerkedés a Python alapokkal
  • A fontosabb adatelemzési könyvtárak: pandas és barátai

Adatelemzés egyszerűen

  • Adatok betöltése forrásállományokból (XLS, CSV)
  • Az adatok feltérképezése, adatszerkezet vizsgálata
  • Az adatok lekérdezése, sorok és oszlopok szűrése
  • Számított mezők készítése
  • Adatok csoportosítása és rendezése
  • Vizuális adatelemzés, egyszerű grafikonok készítése
  • Adatok mentése

Bevezetés a Data Science-be

  • Mi az a Data Science és mi az a gépi tanulás?
  • Legfontosabb gépi tanulási módszerek
  • Data Science projektek felépítése, megoldások fejlesztése

Adatok előkészítése

  • Hiányzó és kiugró értékek kezelése
  • Duplikátumok kiszűrése
  • Tanuló és teszt minták

Mesterséges Intelligencia algoritmusok

  • Regressziós problémák megoldása
  • Klasszifikáció vagy osztályozás
  • Csoportosítás szegmentáció segítségével
  • Modellek teljesítményének mérése, kiértékelése