Beschreibung
Data Mining mit Python und Pandas
Zielgruppe: Nur für Unternehmen und Institutionen.Die Sprache Python wird immer beliebter, und das aus gutem Grund. Sie bietet dem Programmierenden eine große Flexibilität; sie verfügt über eine große Anzahl von Modulen zur Ausführung verschiedener Aufgaben und Python-Code ist in der Regel lesbarer und prägnanter als in anderen Sprachen. Es gibt eine große und aktive Gemeinschaft von Forschern, Praktikern und Anfängern, die Python für Data Mining verwenden.
In dieser Schulung verwenden wir IPython. IPython ist eine Plattform für die Python-Entwicklung, die eine Reihe von Werkzeugen und Umgebungen für die Ausführung von Python enthält und über mehr Funktionen als den Standard-Interpreter verfügt. Es enthält das leistungsstarke IPython Notebook, mit dem Sie Programme in einem Webbrowser schreiben können. Es formatiert auch Ihren Code, zeigt die Ausgabe an und erlaubt Ihnen, Ihre Skripte mit Anmerkungen zu versehen. Es ist ein gutes Werkzeug zum Erforschen von Datensätzen.
Die Teilnehmenden lernen in dieser Schulung die Theorien hinter dem Data Mining kennen. Außerdem wird das Arbeiten mit Pandas vermittelt. Verschiedene Methoden zur Vorbereitung, Bereinigung und Auswertung von Daten werden vermittelt.
Pandas ist eine der mächtigsten und beliebtesten Python-Bibliotheken für die Datenanalyse. Es ist auch eines der beliebtesten Tools für Data Scientists, weil es ihnen bei Transformation, Manipulation und Analyse von Daten hilft.
Kommende Starttermine
Inhalte / Module
- Datensatz Beschreibung
- Lesen & Schreiben von Daten mit Pandas
- Verstehen von Dateisystem & Shell-Befehlen
- Lesen von Excel- & CSV-Dateien
- Daten schreiben mit Pandas
- Übung: Lesen einer csv-Datei mit Pandas
- Pandas-Dataframes
- Was sind Pandas Dataframes & ihre Operationen?
- Auswählen von Spalten & Zeilen in Pandas (Indizierung)
- Übung: DataFrames und grundlegende Operationen
- Datenexploration mit Pandas
- Grundlegende deskriptive Statistik mit Pandas
- Plotten mit Pandas
- Übung: Datenexploration mit Pandas
- Datenmanipulation mit Pandas
- Umbenennen von Spalten mit Pandas
- Sortieren von Daten in Pandas DataFrame
- Behandlung fehlender Werte
- Funktion anwenden in Pandas für elementweise Operationen
- Übung: Pandas Apply Function
- Aggregieren von Daten mit Pandas
- Arten von Aggregationen in Pandas
- Aggregationen mit Pandas in Aktion
- Übung: Aggregationen in Pandas
- Zusammenführen von Daten mit Pandas
- Zusammenführen von Daten in Pandas Dataframes
- Übung: Zusammenführen von Daten mit Pandas
- Ausblick auf die Bibliothek scikit-learn
- Export der erstellten Notebooks und Einrichten einer eigenen Entwicklungsumgebung mit Pandas
Zielgruppe / Voraussetzungen
Hinweis: Dieser Kurs richtet sich an Mitarbeitende aus Unternehmen und Institutionen.
Für Privatpersonen ist dieser Kurs leider nicht geeignet.
Bitte beachten Sie: Bildungsgutscheine der Agentur für Arbeit werden für diesen Kurs NICHT anerkannt.
Abschlussqualifikation / Zertifikat
Infos anfordern
GFU Cyrus AG
Erweitern Sie Ihre IT-Skills mit einem offenen IT-Training oder ganz nach Ihren Bedürfnissen durch eine individuelle IT-Schulung. Programmiersprachen (C#, Python, Java, …), Microsoft Office 365, Anforderungsmanagement, Projektmanagement, Business Intelligence, Data Science, Künstliche Intelligenz, IT-Sicherheit , Administration & Datenbanken, Softwareentwicklung, Testmanagement...
Erfahren Sie mehr über GFU Cyrus AG und weitere Kurse des Anbieters.
Gute Einführung in das Thematik