Zapraszamy na spotkanie Jak wydobywać dane z internetu? Wprowadzenie do biblioteki Scrapy w ramach Summerlab 2022!
Celem warsztatów jest wprowadzenie uczestników i uczestniczek do tworzenia własnych spiderów w bibliotece Scrapy.
Scrapy to biblioteka open source w języku Python. Umożliwia tworzenie programów wydobywających dane z aplikacji i stron internetowych.
Czego dowiesz się na spotkaniu?
Osoby uczestniczące zdobędą podstawową wiedzę na temat scrapowania danych, którą potem mogą dalej rozwijać w swoich projektach.
Plan spotkania
Rozpoczniemy od krótkiego omówienia, czym jest Scrapy oraz elementarnych pojęć potrzebnych po to, by tworzyć własnego spidera.
Główną częścią warsztatów będzie tworzenie własnego programu wydobywającego dane – spidera w Scrapym.
Na warsztat weźmiemy strony zaproponowane przez uczestników i uczestniczki.
Do kogo kierujemy spotkanie?
Zapraszamy osoby z podstawową znajomością programowania (potrzebować będziesz umiejętności instalowania paczek z pythona (pip install), pisania i uruchamiania prostych funkcji czy obiektów).
Z wykształcenia humanista, absolwent Uniwersytetu Śląskiego i studiów doktoranckich na Uniwersytecie Warszawskim.
Od 2014 zawodowo zajmuje się programowaniem w Pythonie i tworzeniem projektów w Scrapym. Pasjonat open source.
Współautor biblioteki ScrapyRT, która dostarcza HTTP API dla projektów w Scrapym.
Linki autora: