Analiza danych chemicznych w Python

Analiza danych chemicznych w Python - metody nadzorowane i nienadzorowane w chemii obliczeniowej

2-dniowy kurs “Analiza danych chemicznych w Python” jest skierowany do uczestników, którzy chcą zdobyć praktyczne umiejętności w użyciu języka Python do analizy danych chemicznych, metod uczenia nienadzorowanego i nadzorowanego oraz zadań modelowania molekularnego.

Po ukończeniu tego kursu uczestnicy będą wyposażeni w umiejętności efektywnej analizy danych chemicznych, tworzenia modeli uczenia maszynowego oraz będą znali podstawy wykorzystywania narzędzi programistycznych do pracy nad zadaniami w dziedzinie chemii obliczeniowej.

Kurs prowadzony jest w angielskim (lub polskim – jeśli cała grupa uczestników będzie polskojęzyczna).

*Cena zawiera: udział w zajęciach, materiały szkoleniowe, certyfikat uczestnictwa.

Program szkolenia

Dzień 1: Przetwarzanie Danych i Metody Nienadzorowane

Sesja poranna:

Przetwarzanie i przygotowanie danych

  1. Wprowadzenie do kursu i oficjalne rozpoczęcie

  2. Wykład – zbieranie i przetwarzanie danych
    • Znaczenie jakości danych w analizie danych chemicznych.
    • Wprowadzenie do źródeł danych i metod zbierania danych.
    • Techniki przetwarzania danych do radzenia sobie z brakującymi wartościami, duplikatami i wartościami odstającymi.

  3. Sesja code-along z prowadzącym (Python)
    • Techniki przetwarzania i przygotowywania danych w Pythonie
    • Wykorzystanie dedykowanych bibliotek do data science

Sesja popołudniowa:

Wprowadzenie do Analizy Danych Chemicznych i Nienadzorowanego Uczenia Maszynowego

  1. Wykład – wstęp do analizy danych chemicznych
    • Specyfika analizy danych chemicznych i ich rodzaje (deskryptory struktury chemicznej, właściwości)
    • Popularne bazy danych chemicznych
    • Metody nienadzorowanego uczenia maszynowego w chemii z przykładami

  2. Sesja code-along z prowadzącym (Python)
    • Wykorzystanie Pythona i API publicznych baz do automatyzacji generowania dataset’ów danych chemicznych
    • Wykorzystanie wygenerowanych datasetów w wielowymiarowej analizie danych, przykłady różnych algorytmów nienadzorowanego uczenia maszynowego (grupowanie, analiza składowych, klastrowanie)

Dzień 2: Metody Nadzorowane i Metodologia QSAR/QSPR

Sesja poranna:

Wprowadzenie do Uczenia Maszynowego z Nadzorem i Metodologii QSAR/QSPR

  1. Wykład – uczenie maszynowe z nadzorem – regresja
    • Czym jest uczenie z nadzorem?
    • Jak się waliduje regresyjne modele prognostyczne? Pojęcie przeuczenia i metody jego minimalizacji.
    • Feature selection w uczeniu maszynowym.
    • Podstawy QSAR i QSPR
    • Metody regresji

  2. Sesja code-along z prowadzącym (Python + Scikit-learn)
    • Generowanie danych (deskryptorów struktury molekularnej) z wykorzystaniem Python
    • Metody feature selection
    • Stworzenie modelu QSAR/QSPR (regresja)
    • Interpretacja modelu

Sesja popołudniowa:

Metody klasyfikacyjne

  1. Wykład – uczenie maszynowe z nadzorem – klasyfikatory
    • Wstęp do metod klasyfikacyjnych
    • Algorytmy klasyfikacyjne (drzewa decyzyjne, lasy losowe, SVM)
    • Jak się waliduje klasyfikacyjne modele prognostyczne?

  2. Sesja code-along z prowadzącym (Python + Scikit-learn)
    • Przygotowanie danych do uczenia klasyfikatora
    • Optymalizacja hiperparametrów
    • Stworzenie modelu QSAR/QSPR (klasyfikacja)
    • Ewaluacja metryk klasyfikatora
    • Wizualizacja i interpretacja modelu
Weź udział w kursie! Wypełnij formularz rejestracyjny.