Kurs suchen 👉

Web Scraping und Web-Crawler mit Python - Grundlagen

GFU Cyrus AG, in Köln (+2 Standorte)
Dauer
3 Tage
Durchführungsform
Präsenzkurs / vor Ort, Online-Kurs / Fernlehrgang, Inhouse-Schulung
Nächster Starttermin
10 Februar, 2025 (+5 Starttermine)
Preis
1.930 EUR MwSt. befreit
Webseite des Anbieters
Sprache
Deutsch
Dauer
3 Tage
Durchführungsform
Präsenzkurs / vor Ort, Online-Kurs / Fernlehrgang, Inhouse-Schulung
Nächster Starttermin
10 Februar, 2025 (+5 Starttermine)
Preis
1.930 EUR MwSt. befreit
Webseite des Anbieters
Sprache
Deutsch
Ab 1.930 EUR MwSt. befreit / Person

Beschreibung

GFU Cyrus AG

Web Scraping und Web-Crawler mit Python - Grundlagen

Das World Wide Web enthält eine Vielzahl von Daten. Die Fähigkeit, die benötigten  Informationen daraus zu extrahieren, ist heutzutage für alle, die mit Daten arbeiten,  eine Notwendigkeit. Natürlich gibt es bereits viele Datensätze, die in aufbereiteten Formaten zum Download angeboten werden, aber in vielen Fällen wird man die Daten, die man benötigt, nicht so einfach finden. 
Oft liegen die Daten nämlich  unstrukturiert vor und nicht per se in einem maschinenlesbaren, bequemen Format. Zum Beispiel alle Blogartikel in einem Blog, die einem gewissen Kriterium entsprechen oder Preise von Artikeln in einem Webshop.
Webscraping setzt einen Schritt vor dem Data-Mining an und beschäftigt sich daher weniger mit dem Pre-Processing und der Analyse der Daten als eher mit dem Extrahieren von Rohdaten in ein maschinenlesbares Format, zum Beispiel einer CSV Datei oder einer Datenbank-Tabelle. Web Scraping ist also das Verfahren, Daten aus (vornehmlich) Webseiten zu extrahieren. 
Web Crawling hingegen ist das Verfahren, viele Seiten einer Hauptdomain einzulesen und zu durchsuchen. Damit lassen sich Webspider programmieren, die zum Beispiel periodisch Webangebote durchforsten. Python, als einsteigerfreundliche und einfache Skript- und Programmiersprache, bietet sich für diese Aufgabe an. Mit relativ wenigen Zeilen Code lässt sich schon oft ein sehr gutes Ergebnis erzielen, um zum Beispiel alle Katalogpreise in eine Excel Datei zu überführen. 

Kommende Starttermine

Wählen Sie aus 5 verfügbaren Startterminen

10 Februar, 2025

  • Präsenzkurs / vor Ort
  • Köln
  • Deutsch

10 Februar, 2025

  • Online-Kurs / Fernlehrgang
  • Online-Kurs / Fernlehrgang
  • Deutsch

5 Mai, 2025

  • Präsenzkurs / vor Ort
  • Köln
  • Deutsch

5 Mai, 2025

  • Online-Kurs / Fernlehrgang
  • Online-Kurs / Fernlehrgang
  • Deutsch

Inhouse-Schulung auf Anfrage

  • Inhouse-Schulung
  • Deutschland
  • Deutsch

Inhalte / Module



  • Einrichten der Entwicklungsumgebung
    • Anlegen der Ordnerstruktur
    • Einrichten der IDE VSCode
    • Virtuelle Umgebung und installieren der nötigen Software
  • Grundlagen
    • Python Wiederholung (Datentypen, Funktionen, Generatoren, OOP)
    • Einführung in Pandas
    • Einführung HTTP, HTML, CSS und DOM
    • Einführung JSON
    • Client-Server Architektur
    • Was ist denn eigentlich Scraping genau?
    • Webscraping ist NICHT Data-Mining
  • Web Scraping, erste Schritte
    • ethische und rechtliche Grenzen, Drosselung
    • die robots.txt Datei
    • Installieren von Beautiful Soup und der requests Bibliothek
    • Parsen einer einfachen Webseite 
    • Medien, Texte, Bilder und URLs extrahieren
    • Speichern der Informationen in einer CSV-Datei
    • Speichern der Informationen in einer Json-Datei
    • Speichern in einer Datenbank
    • Probleme erkennen: dynamische Webseiten, JavaScript, das DOM
  • HTML Vertiefung
    • Attribute, verschachtelte Strukturen
    • HTML als Baumstruktur, Knoten, Kanten
    • eine kleiner Exkurs über ascii, utf8 und den Zeichenkodierungs-Dschungel
  • Web Scraping, erweitert
    • eine URL-Liste abarbeiten
    • URLs extrahieren und URL-liste abarbeiten
    • einen Katalog nach Titeln parsen
    • einen Webshop nach Artikeln und Preisen parsen
    • Bilder runterladen, komprimieren und auf der HD speichern
    • Tabellen auslesen
    • Daten in einem Pandas Dataframe darstellen
    • Umgang mit fehlerhaften Daten

Zielgruppe / Voraussetzungen

Dieses Seminar richtet sich an Entwickler:innen, Data-Scientists, Machine Learner, Wissenschaftler:innen, Marketing Expert:innen und Analysten, die das Web gezielt und effizient nach Informationen durchsuchen und diese Daten extrahieren wollen.
Grundlegende Python-Kenntnisse und OOP sind von Vorteil, aber kein Muss.

Hinweis: Dieser Kurs richtet sich an Mitarbeitende aus Unternehmen und Institutionen. 

Für Privatpersonen ist dieser Kurs leider nicht geeignet.

Eine Informationsanfrage zu diesem Kurs ist nur für Beteiligte aus dem B2B-Bereich sinnvoll.

Abschlussqualifikation / Zertifikat

Teilnahmezertifikat und digitales Badge

Infos anfordern

Stellen Sie jetzt eine Informationsanfrage

Kontaktieren Sie hier den Anbieter, um mehr über das Kursangebot Web Scraping und Web-Crawler mit Python - Grundlagen zu erfahren!

  Sie erhalten weitere Infos

  Unverbindlich

  Kostenfrei


reCAPTCHA logo Diese Webseite ist durch reCAPTCHA geschützt. Es gelten die Google Datenschutzbestimmungen und Nutzungsbedingungen.
GFU Cyrus AG
Am Grauen Stein 27
51105 Köln

GFU Cyrus AG

Erweitern Sie Ihre IT-Skills mit einem offenen IT-Training oder ganz nach Ihren Bedürfnissen durch eine individuelle IT-Schulung. Programmiersprachen (C#, Python, Java, …), Microsoft Office 365, Anforderungsmanagement, Projektmanagement, Business Intelligence, Data Science, Künstliche Intelligenz, IT-Sicherheit , Administration & Datenbanken, Softwareentwicklung, Testmanagement...

Erfahren Sie mehr über GFU Cyrus AG und weitere Kurse des Anbieters.

Anzeige