Analiza danych za pomocą uczenia maszynowego i sztucznej inteligencji
Nadmiar szumu informacji oraz zbyt duża wielowymiarowość dostępnych danych nie pozwalają na kompleksową ocenę wyników badań, nawet przez ekspertów w danej dziedzinie. Dlatego też jednym z podstawowych zadań współczesnej analizy danych jest ekstrakcja najistotniejszej informacji zawartej w dostępnym zbiorze danych. Dzięki zastosowaniu zaawansowanych metod uczenia maszynowego oraz sztucznej inteligencji (ang. Artificial Intelligence, AI) możemy zidentyfikować istniejące zależności oraz wyodrębnić najważniejsze informacje zawarte w dużym zbiorze danych w kontekście przedstawionego problemu badawczego.
W QSAR Lab rozwijamy i wykorzystujemy najnowsze technologie, które mogą stanowić istotną część prowadzonego projektu B+R oraz ułatwiać w proces podejmowania decyzji, zarówno naukowych jak i biznesowych. Oferujemy wykorzystanie zaawansowanych metod uczenia maszynowego/sztucznej inteligencji do pozyskania istotnej informacji zawartej w dużych zbiorach danych (np. chemicznych, medycznych).
W zależności od rodzaju danych i informacji jaką klient chce uzyskać, zespół ekspertów stworzy elastyczne dla klienta studium przypadku, w którym opisane zostaną wszystkie aspekty przeprowadzonego badania, takie jak: opis problemu i hipotez badawczych, opis najbardziej odpowiednich i dobranych metod uczenia maszynowego do przedstawionego problemu badawczego, dokumentację zawierającą raporty z wynikami badań oraz ich szczegółowym opisem.
Eksperci QSAR Lab przeprowadzają analizy z zastosowaniem technik m.in.:
- uczenia z nadzorem – metody opierające się na informacji wejściowej i efekcie końcowym oraz poszukiwaniu zależności pomiędzy nimi (metody regresji i klasyfikacji takie jak regresja liniowa i logistyczna, maszyny wektorów nośnych, drzewa decyzyjne, klasyfikatory Bayesowkie, wielowarstwowe sieci neuronowe oraz analiza obrazu)
- uczenia bez nadzoru – metody wykorzystujące tylko informacje wejściowe (bez efektu końcowego), poszukujące zależności, podobieństw, różnic pomiędzy analizowanymi obiektami (np. analiza skupień, sieci neuronowe i SOM, analiza głównych składowych, algorytmy ekspektacji-maksymalizacji).