Analiza danych chemicznych w Python - metody nadzorowane i nienadzorowane w chemii obliczeniowej

2-dniowy kurs “Analiza danych chemicznych w Python” jest skierowany do uczestników, którzy chcą zdobyć praktyczne umiejętności w użyciu języka Python do analizy danych chemicznych, metod uczenia nienadzorowanego i nadzorowanego oraz zadań modelowania molekularnego.
Po ukończeniu tego kursu uczestnicy będą wyposażeni w umiejętności efektywnej analizy danych chemicznych, tworzenia modeli uczenia maszynowego oraz będą znali podstawy wykorzystywania narzędzi programistycznych do pracy nad zadaniami w dziedzinie chemii obliczeniowej.
Kurs prowadzony jest w angielskim (lub polskim – jeśli cała grupa uczestników będzie polskojęzyczna).
Cena
Data i miejsce
Forma
Uczestnicy
*Cena zawiera: udział w zajęciach, materiały szkoleniowe, certyfikat uczestnictwa.
Program szkolenia
Dzień 1: Przetwarzanie Danych i Metody Nienadzorowane
Sesja poranna:
Przetwarzanie i przygotowanie danych
- Wprowadzenie do kursu i oficjalne rozpoczęcie
- Wykład – zbieranie i przetwarzanie danych
- Znaczenie jakości danych w analizie danych chemicznych.
- Wprowadzenie do źródeł danych i metod zbierania danych.
- Techniki przetwarzania danych do radzenia sobie z brakującymi wartościami, duplikatami i wartościami odstającymi.
- Sesja code-along z prowadzącym (Python)
- Techniki przetwarzania i przygotowywania danych w Pythonie
- Wykorzystanie dedykowanych bibliotek do data science
Sesja popołudniowa:
Wprowadzenie do Analizy Danych Chemicznych i Nienadzorowanego Uczenia Maszynowego
- Wykład – wstęp do analizy danych chemicznych
- Specyfika analizy danych chemicznych i ich rodzaje (deskryptory struktury chemicznej, właściwości)
- Popularne bazy danych chemicznych
- Metody nienadzorowanego uczenia maszynowego w chemii z przykładami
- Sesja code-along z prowadzącym (Python)
- Wykorzystanie Pythona i API publicznych baz do automatyzacji generowania dataset’ów danych chemicznych
- Wykorzystanie wygenerowanych datasetów w wielowymiarowej analizie danych, przykłady różnych algorytmów nienadzorowanego uczenia maszynowego (grupowanie, analiza składowych, klastrowanie)
Dzień 2: Metody Nadzorowane i Metodologia QSAR/QSPR
Sesja poranna:
Wprowadzenie do Uczenia Maszynowego z Nadzorem i Metodologii QSAR/QSPR
- Wykład – uczenie maszynowe z nadzorem – regresja
- Czym jest uczenie z nadzorem?
- Jak się waliduje regresyjne modele prognostyczne? Pojęcie przeuczenia i metody jego minimalizacji.
- Feature selection w uczeniu maszynowym.
- Podstawy QSAR i QSPR
- Metody regresji
- Sesja code-along z prowadzącym (Python + Scikit-learn)
- Generowanie danych (deskryptorów struktury molekularnej) z wykorzystaniem Python
- Metody feature selection
- Stworzenie modelu QSAR/QSPR (regresja)
- Interpretacja modelu
Sesja popołudniowa:
Metody klasyfikacyjne
- Wykład – uczenie maszynowe z nadzorem – klasyfikatory
- Wstęp do metod klasyfikacyjnych
- Algorytmy klasyfikacyjne (drzewa decyzyjne, lasy losowe, SVM)
- Jak się waliduje klasyfikacyjne modele prognostyczne?
- Sesja code-along z prowadzącym (Python + Scikit-learn)
- Przygotowanie danych do uczenia klasyfikatora
- Optymalizacja hiperparametrów
- Stworzenie modelu QSAR/QSPR (klasyfikacja)
- Ewaluacja metryk klasyfikatora
- Wizualizacja i interpretacja modelu
- Uczestnicy po ukończonym szkoleniu otrzymują certyfikat.
- Razem raźniej - otrzymaj 10% zniżki na szkolenie otwarte dla każdego kolejnego pracownika z Twojej firmy.