Beschreibung
Machine Learning zur Text-Analyse und Text Mining mit Python
Im digitalen Informationszeitalter, in dem wir leben, hat die Datenmenge exponentiell zugenommen und sie wächst in einem noch nie dagewesenen Tempo. Bei den meisten dieser Daten handelt es sich um unstrukturierte Daten. Unstrukturierte Daten sind Informationen, die nicht in einer herkömmlichen relationalen Datenbank gespeichert sind. Beispiele hierfür sind Dokumente, Bilder und Videos. Die Erschließung unstrukturierter Daten spielt für jedes Unternehmen, das bessere Entscheidungen treffen möchte, eine entscheidende Rolle. Dieses Seminar hilft Ihnen, das Potenzial von Textdaten zu erschließen. Textdaten machen mehr als 50 % der unstrukturierten Daten aus. Beispiele sind Tweets/Posts in sozialen Medien, Chat-Konversationen, Nachrichten, Blogs, Artikel, Produkt- oder Dienstleistungsbewertungen und Patientenakten im Gesundheitswesen.Um aussagekräftige und umsetzbare Erkenntnisse aus Textdaten zu gewinnen und ihr Potenzial zu erschließen, setzen wir Methoden des Natural Language Processing (NLP) in Verbindung mit maschinellem Lernen und Deep Learning ein.
Maschinen und Algorithmen verstehen keinen Text - daher ist es sehr wichtig, Textdaten in ein maschinenverständliches Format umzuwandeln, um sie zu analysieren. NLP ermöglicht es Maschinen, die menschliche Sprache zu verstehen und zu interpretieren.
In diesem Seminar werden die Konzepte und die Umsetzung der natürlichen Sprachverarbeitung und ihrer Anwendungen in der realen Welt vorgestellt. Im Rahmen dieses NLP-Kurses werden praxisrelevante Probleme behandelt, wie zum Beispiel Informationsextraktion, Erkennung von Eigennamen (von Personen, Institutionen, sowie medizinischen Fachausdrücken), automatische Spracherkennung, maschinelle Übersetzungen, Meinungs- und Stimmungsanalysen, automatische Beantwortung von Fragen sowie automatische Text-Zusammenfassungen, Text-Generierung und -Klassifikation.
Kommende Starttermine
Inhalte / Module
- Datenaufbereitung
- Datenakquisition
- Reguläre Ausdrücke
- Tokenisierung, Lematisierung, Stemming
- Wortartenerkennung (Speech Tagging)
- Eigennamenerkennung (Named Entity Recognition)
- Grammatik-Analyse (Parsing)
- Wörter, Sätze und Dokumente kategorisieren
- Text Data Augmentation
- Feature Engineering (für Texte)
- Worteinbettungen
- Umwandlung von Wörtern in Zahlen
- Bag of Words, TF-IDF
- Statische Einbettungen - Word2Vec, GloVe,
- Sprachmodell-basierte Einbettungen - BERT, GPT
- Vortrainierte Worteinbettungen
- Transfer-Lernen mit vortrainierten Einbettungen für Dokumentklassifizierung
- Textklassifikation
- Klassifizierung von Verbraucherbeschwerden
- Textzusammenfassung und Topic Modeling (Textkategorisierung)
- Extrahierende und abstrahierende Algorithmen (TextRank, Luhn, Pegasus)
- Textzusammenfassung mit NLTK
- Topic Modeling mit LDA
- Textklassifizierung mit Deep Learning
- Stimmungsanalyse mit supervised und unsupervised Techniken
- Stimmungsanalyse mit RNN, LSTM
- Stimmungsanalyse mit CNN
- Textübersetzung mit Seq2Seq-Modell
- Erstellen von Seq2Seq-Trainingsmodellen
- Vorhersagen mit Seq2Seq
- Neuester Stand der Technik mit BERT-Transformer
- Textklassifikation mit BERT
- Frage-und-Antwort (Q&A)
- bei dem das Modell über einen Eingabetext (z. B. einen Wikipedia-Artikel) nachdenken muss, um Fragen zu beantworten
Zielgruppe / Voraussetzungen
Hinweis: Dieser Kurs richtet sich an Mitarbeitende aus Unternehmen und Institutionen.
Für Privatpersonen ist dieser Kurs leider nicht geeignet.
Bitte beachten Sie: Bildungsgutscheine der Agentur für Arbeit werden für diesen Kurs NICHT anerkannt.
Abschlussqualifikation / Zertifikat
Infos anfordern
GFU Cyrus AG
Erweitern Sie Ihre IT-Skills mit einem offenen IT-Training oder ganz nach Ihren Bedürfnissen durch eine individuelle IT-Schulung. Programmiersprachen (C#, Python, Java, …), Microsoft Office 365, Anforderungsmanagement, Projektmanagement, Business Intelligence, Data Science, Künstliche Intelligenz, IT-Sicherheit , Administration & Datenbanken, Softwareentwicklung, Testmanagement...
Erfahren Sie mehr über GFU Cyrus AG und weitere Kurse des Anbieters.