Dieser Workshop bietet eine praxisorientierte Einführung in die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP). Die Teilnehmenden lernen grundlegende Konzepte, Methoden und aktuelle Entwicklungen kennen. Neben der Theorie stehen praktische Übungen mit modernen NLP-Tools im Fokus. Am Ende des Workshops sind die Teilnehmenden in der Lage, einfache NLP-Modelle anzuwenden und eigene kleine Projekte umzusetzen.
Der Workshop beginnt mit einer Einführung in die Verarbeitung natürlicher Sprache (NLP), in der grundlegende Konzepte und Anwendungsbereiche wie Chatbots, Suchmaschinen und Textklassifikation vorgestellt werden.
Anschließend beschäftigen wir uns mit der Textvorverarbeitung, einschließlich Tokenisierung, Stoppwortentfernung, Lemmatisierung, Stemming, Part-of-Speech-Tagging und Named Entity Recognition. Diese Methoden werden anhand praktischer Beispiele mit spaCy oder NLTK angewendet.
Ein zentraler Bestandteil des Workshops ist die Darstellung verschiedener Wortrepräsentationen. Neben klassischen Methoden wie Bag-of-Words (BoW) und TF-IDF werden moderne Ansätze wie Word Embeddings (Word2Vec, GloVe, FastText) sowie kontextuelle Embeddings (BERT, GPT) behandelt. Durch Visualisierungen wird der Nutzen von Wortvektoren veranschaulicht.
Im weiteren Verlauf
...
show more
Dieser Workshop bietet eine praxisorientierte Einführung in die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP). Die Teilnehmenden lernen grundlegende Konzepte, Methoden und aktuelle Entwicklungen kennen. Neben der Theorie stehen praktische Übungen mit modernen NLP-Tools im Fokus. Am Ende des Workshops sind die Teilnehmenden in der Lage, einfache NLP-Modelle anzuwenden und eigene kleine Projekte umzusetzen.
Der Workshop beginnt mit einer Einführung in die Verarbeitung natürlicher Sprache (NLP), in der grundlegende Konzepte und Anwendungsbereiche wie Chatbots, Suchmaschinen und Textklassifikation vorgestellt werden.
Anschließend beschäftigen wir uns mit der Textvorverarbeitung, einschließlich Tokenisierung, Stoppwortentfernung, Lemmatisierung, Stemming, Part-of-Speech-Tagging und Named Entity Recognition. Diese Methoden werden anhand praktischer Beispiele mit spaCy oder NLTK angewendet.
Ein zentraler Bestandteil des Workshops ist die Darstellung verschiedener Wortrepräsentationen. Neben klassischen Methoden wie Bag-of-Words (BoW) und TF-IDF werden moderne Ansätze wie Word Embeddings (Word2Vec, GloVe, FastText) sowie kontextuelle Embeddings (BERT, GPT) behandelt. Durch Visualisierungen wird der Nutzen von Wortvektoren veranschaulicht.
Im weiteren Verlauf werden verschiedene NLP-Anwendungen vorgestellt. Dazu gehören Textklassifikation (z. B. Sentiment-Analyse), Named Entity Recognition (Erkennung von Personen, Orten, Organisationen), Textzusammenfassung, maschinelle Übersetzung sowie Frage-Antwort-Systeme und Chatbots, insbesondere mit Retrieval-Augmented Generation (RAG). Die Teilnehmenden haben die Möglichkeit, einige NLP-Anwendungen anhand ausgewählter Beispiele und mithilfe von Open-Source-Tools auszuprobieren.
Neben den technischen Aspekten werden auch Herausforderungen und ethische Fragestellungen in NLP thematisiert, darunter Verzerrungen (Bias) in KI-Modellen und die Erklärbarkeit von NLP-Systemen. Zudem werden verschiedene Metriken betrachtet, mit denen NLP-Methoden evaluiert werden.Veton MatoshiVeton Matoshi ist Wissenschaftler mit Schwerpunkt Natural Language Processing (NLP) und arbeitet derzeit als wissenschaftlicher Mitarbeiter an der Berner Fachhochschule. Er verfügt über langjährige Erfahrung in der Entwicklung, Anwendung und Evaluation von NLP-Methoden.
Seine Forschung umfasst Themen wie automatisierte Textklassifikation, Large Language Models (LLMs), Information Retrieval und Semantische Textanalyse. Neben akademischen Projekten hat er als NLP-Researcher in der Industrie gearbeitet, unter anderem bei der Know-Center GmbH in Graz und als Freelance-Computerlinguist.
Mit seinem interdisziplinären Hintergrund in Linguistik, Computerlinguistik und maschinellem Lernen vermittelt er praxisnahes Wissen zur Verarbeitung natürlicher Sprache und zeigt, wie NLP-Technologien in verschiedenen Anwendungsbereichen effektiv eingesetzt werden können.
Mit seinem interdisziplinären Hintergrund in Linguistik, Computerlinguistik und maschinellem Lernen vermittelt er praxisnahes Wissen zur Verarbeitung natürlicher Sprache und zeigt, wie NLP-Technologien in verschiedenen Anwendungsbereichen effektiv eingesetzt werden können.
show less