Analiza danych chemicznych w Python

Analiza danych chemicznych w Python - metody nadzorowane i nienadzorowane w chemii obliczeniowej

2-dniowy kurs “Analiza danych chemicznych w Python” jest skierowany do uczestników, którzy chcą zdobyć praktyczne umiejętności w użyciu języka Python do analizy danych chemicznych, metod uczenia nienadzorowanego i nadzorowanego oraz zadań modelowania molekularnego.

Po ukończeniu tego kursu uczestnicy będą wyposażeni w umiejętności efektywnej analizy danych chemicznych, tworzenia modeli uczenia maszynowego oraz będą znali podstawy wykorzystywania narzędzi programistycznych do pracy nad zadaniami w dziedzinie chemii obliczeniowej.

Kurs prowadzony jest w angielskim (lub polskim – jeśli cała grupa uczestników będzie polskojęzyczna).

*Cena zawiera: udział w zajęciach, materiały szkoleniowe, certyfikat uczestnictwa, catering kawowy.

Program szkolenia

Dzień 1: Przetwarzanie Danych i Metody Nienadzorowane

Sesja poranna:

Przetwarzanie i przygotowanie danych

  1. Wprowadzenie do kursu
  2. Zbieranie i Przetwarzanie Danych
    a. Znaczenie jakości danych w analizie danych chemicznych.
    b. Wprowadzenie do źródeł danych i metod zbierania danych.
    c. Techniki przetwarzania danych do radzenia sobie z brakującymi wartościami, duplikatami i wartościami odstającymi.
  3. Przetwarzanie Danych w Pythonie
    a. Techniki przetwarzania danych za pomocą bibliotek Pythona (NumPy, Pandas).
    b. Normalizacja danych, skalowanie i wybór cech.

Ćwiczenie Praktyczne: Uczestnicy będą pracować na dostarczonym zbiorze danych chemicznych i stosować techniki przetwarzania i przygotowania danych za pomocą Pythona.

Sesja popołudniowa:

Wprowadzenie do Analizy Danych Chemicznych i Nienadzorowanego Uczenia Maszynowego

  1. Podstawy Analizy Danych Chemicznych (ćwiczenia praktyczne w Pythonie).
    a) Badanie różnych typów danych chemicznych (struktury molekularne, właściwości, deskryptory itp.).
    b) Typowe wyzwania i kroki przetwarzania danych.
  2. Metody Nienadzorowanego Uczenia Maszynowego (ćwiczenia praktyczne w Pythonie).
    a) Nienadzorowane uczenie maszynowe i jego zastosowania w chemii obliczeniowej.
    b) Przedstawienie różnych algorytmów nienadzorowanego uczenia maszynowego (grupowanie, analiza składowych głównych itp.).

Dzień 2: Metody Nadzorowane i Metodologia QSAR/QSPR

Sesja poranna:
Wprowadzenie do Uczenia Maszynowego z Nadzorem i Metodologii QSAR/QSPR

  1. Wprowadzenie do Uczenia Maszynowego z Nadzorem,
    a) Typowe algorytmy uczenia maszynowego z nadzorem (regresja liniowa, drzewa decyzyjne, lasy losowe itp.).
    b) Pojęcie nadmiernego dopasowania i metody jego redukcji.

Metodologia QSAR/QSPR
Wprowadzenie do koncepcji QSAR (związki struktura-aktywność) i QSPR (związki struktura-właściwość).

Sesja popołudniowa:

Uczenie maszynowe z nadzorem i ccena modelu.

  1. Budowanie Modeli Uczenia Maszynowego z Nadzorem w Pythonie (ćwiczenia praktyczne w Pythonie)
    a) Implementacja modeli uczenia maszynowego z nadzorem za pomocą bibliotek Pythona (Scikit-learn).
    b) Szkolenie modeli, walidacja i dostrojenie hiperparametrów.
  2. Ocena i interpretacja modelu
    a) Metryki oceny dla zadań regresji i klasyfikacji w analizie danych chemicznych.
    b) Interpretacja i analiza wyników modelowania.

Ćwiczenia Praktyczne:
Uczestnicy będą pracować na dostarczonym zbiorze danych chemicznych, budować modele uczenia maszynowego z nadzorem i oceniać ich wydajność za pomocą Pythona.
Ćwiczenia praktyczne będą przeprowadzane za pomocą spersonalizowanych notatników Jupyter/Colab i interaktywnych środowisk Pythona, aby wzbogacić doświadczenie uczestników.

Weź udział w kursie! Wypełnij formularz rejestracyjny.