Identifying informative distance measures in high-dimensional feature spaces

Wykład wygłosi prof. Alessandro Laio z Theoretical and Scientific Data Science Group działającej przy Scuola Internazionale Superiore di Studi Avanzati (SISSA) w Trieście we Włoszech.


Organizers:

Wizyta odbywa się w ramach programu wizyty krótkie profesorów wizytujących realizowanego w ramach inicjatywy IDUB.

Date:

8 May 2025, 10:15 - 11:15

Place:

Wydział Chemii przy ul. F. Joliot-Curie 14 we Wrocławiu, sala wykładowa nr 145

W dniach 7-9 maja gościem Wydziału Chemii, w szczególności Zespołu Struktury i Dynamiki Makroukładów, będzie prof. Alessandro Laio (SISSA Trieste), współtwórca m.in. metody metadynamiki (przyspieszonego przeszukania przestrzeni fazowych). Jest to fizyk-teoretyk specjalizujący się w dziedzinie analizy układów dynamicznych. W ostatnich latach jego zainteresowania naukowe rozszerzyły się o kwestie metod uczenia maszynowego oraz analizy wielkich zbiorów danych i tej właśnie tematyki będzie dotyczył wykład naszego Gościa. Wykład ten, w ramach Seminarium Wydziałowego Wydziału Chemii UWr, odbędzie się stacjonarnie.

Abstrakt:

Real-world data in biochemistry, material science and beyond typically contain a large number of features that are often heterogeneous in nature, relevance, and also units of measure. When assessing the similarity between data points, one can build various distance measures using subsets of these features. Finding a small set of features that
still retains sufficient information about the dataset is important for the successful application of many statistical learning approaches.

We introduce a statistical test that can assess the relative information retained when using two different distance measures, and determine if they are equivalent, independent, or if one is more informative than the other. This test can be used to identify the most informative distance measure and, therefore, the most informative set of features, out of a pool of candidates. The approach can be used to identify the most appropriate set of collective variables in molecular systems and to infer causality in high-dimensional dynamic processes and time series.

Projekt "Zintegrowany Program Rozwoju Uniwersytetu Wrocławskiego 2018-2022" współfinansowany ze środków Unii Europejskiej z Europejskiego Funduszu Społecznego

Fundusze Europejskie
Rzeczpospolita Polska
Unia Europejska
NEWSLETTER