Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego (ICM) ma przyjemność zaprosić osoby zainteresowane grafowymi i sieciowymi metodami przetwarzania danych na zdalne, bezpłatne warsztaty o narzędziach Urika-XC Cray Graph Engine i Trovares xGT.
Grafowe i sieciowe metody przetwarzania informacji znajdują zastosowanie w wielu dziedzinach, takich jak nauki społeczne, epidemiologia, logistyka czy wnioskowanie semantyczne. ICM posiada unikalne oprogramowanie do wydajnego przetwarzania danych grafowych i sieciowych w dowolnej skali. Narzędzia obecnie dostępne w ICM to:
– Trovares xGT
– Urika-XC Cray Graph Engine
W skład obu pakietów wchodzą m.in. algorytmy takie jak liczenie metryk, znajdowanie ścieżek czy dopasowanie wzorca dla dowolnie dużych grafów i sieci. Przy ich pomocy możliwe jest wykonywanie intensywnych i skomplikowanych obliczeń naukowych.
Wymagania wstępne
Podczas warsztatów będziemy korzystać z następujących narzędzi: powłoka Linux (ls, cd, mv, mkdir, rm); łączenie się przez SSH ze zdalnym serwerem; język Python i biblioteka Pandas; system kolejkowy Slurm; kontenery Docker lub Singularity; w przypadku Trovares xGT: język Cypher Query Language; w przypadku Urika-XC Cray Graph Engine: RDF oraz język SPARQL.
Znajomość ww. narzędzi jest przydatna, ale nieobowiązkowa. Prosimy o dokładne wypełnienie formularza zgłoszeniowego, który pomoże nam w ocenie kwalifikacji uczestników oraz w przygotowaniu materiałów. Osoby zakwalifikowane, które nie znają powyższych narzędzi, otrzymają zestaw tutoriali i ćwiczeń na kilka dni przed warsztatami.
Program warsztatów
- Zalogowanie się uczestników na superkomputer ICM, uruchomienie środowiska przez uczestników (kontener Singularity), wprowadzenie do systemu kolejkowego na superkomputerze
- Jak wczytywać dane, narzędzia do zmiany formatu danych, jak dane są reprezentowane w narzędziu
- Wprowadzenie do narzędzia:
- wybieranie danych: (np. SELECT i WHERE)
- agregowanie danych (np. COUNT i MEAN)
- składanie zapytań (ciąg zapytań z zapisywaniem wyników pośrednich)
- zapisywanie danych do pliku
- optymalizacja (plan zapytania)
- Problemy dziedzinowe:
- średnica grafu
- rozkład stopni wierzchołka
- średni stopień wierzchołka
- liczba klik rozmiaru N
- PageRank
- problemy zaproponowane przez uczestników
- Wprowadzenie do grafów RDF
- Omówienie metod konwersji innych modeli grafów do RDF
- Zalogowanie się uczestników na klastrze ICM
- Przygotowanie danych
- Uruchomienie CGE, sprawdzenie połączenia
- Wprowadzenie do SPARQL
- Ćwiczenia z zapytań SPARQL – wyszukiwanie wzorca w grafie
- Wprowadzenie do funkcji wbudowanych CGE
- Ćwiczenia z funkcji wbudowanych CGE na przykładach:
- PageRank
- Community Detection
- S-T Connectivity
- Problemy zaproponowane / przedstawione przez uczestników
Rejestracja uczestników trwa do 4 października 2020 r. Można zgłosić udział w jednym lub obydwu warsztatach. Prosimy o dokładne wypełnienie poniższej ankiety; pomoże ona organizatorom w przygotowaniu materiałów do warsztatów.
Uwaga! Liczba miejsc jest ograniczona do 10. Organizatorzy skontaktują się z osobami zakwalifikowanymi w terminie do 7 października. Możliwe jest zorganizowanie dodatkowego terminu warsztatów, jeśli liczba chętnych znacząco przekroczy liczbę miejsc.
Registration FormFormularz rejestracyjny
Rejestracja na to wydarzenie nie jest już dostępna