Zapraszamy na warsztaty Scrapowanie danych publicznych w Pythonie! Uczestnicy warsztatów poznają techniki pozyskiwania danych dostępnych na stronach instytucji publicznych.
Celem nie będzie nauczenie jednej biblioteki czy stworzenie skryptu wydobywającego dane z jednej strony, lecz wykształcenie w uczestnikach ogólnej orientacji w istniejących rozwiązaniach.
Podczas spotkania omówione zostaną pythonowe biblioteki open source do wydobywania danych z internetu. Jedną z nich jest extruct, który umożliwia pozyskiwanie danych w formatach opengraph czy json-ld. Szybką możliwością pozyskania danych ze stron internetowych mogą być również metody bibliotek do przetwarzania danych, np. metoda “read_html” biblioteki pandas.
Do kogo kierujemy warsztaty?
Zapraszamy osoby z podstawową znajomością programowania. Wymagamy umiejętności instalowania paczek z pythona (pip install), pisania i uruchamiania prostych funkcji czy obiektów.
Co będzie rezultatem warsztatów?
Uczestnicy zdobędą podstawową wiedzę na temat scrapowania danych, którą potem mogą dalej rozwijać w swoich projektach.
Zapisy przyjmujemy do 18.03. Informację o tym, czy dostałaś/łeś się na warsztaty, otrzymasz do 21.03. Zapraszamy!
Z wykształcenia humanista, absolwent Uniwersytetu Śląskiego i studiów doktoranckich na Uniwersytecie Warszawskim.
Od 2014 zawodowo zajmuje się programowaniem w Pythonie i tworzeniem projektów w Scrapym.
Pasjonat open source. Współautor biblioteki ScrapyRT, która dostarcza HTTP API dla projektów w Scrapym.