Skip to main content

Statistische Textanalyse


uzh
Enrollment is Closed

Über den Kurs

Der Kurs führt in die automatische Textverarbeitung ein, und in die Programmiersprache Python.

Er besteht aus den folgenden Teilen:

  • Erste Schritte in Python
  • Texte vorbereiten (besonders: Wortarten und Satzglieder extrahieren, Stemming, N-Grams, mit Regular Expressions bestimmte Textstellen finden)
  • Texte analysieren (besonders: Konkordanzen, ähnliche Texte finden mit TF-IDF, Sentiment-Analyse)
  • Ergebnisse statistisch auswerten
  • Und einer Capstone-Aufgabe, wobei aus drei vorgegebenen ausgewählt werden kann.

Neben der abschliessenden Capstone-Aufgaben, enthält der Kurs neben Videos auch kurze Aufgaben in Quiz-Form sowie kürzere Programmier-Aufgaben. Wir verwenden die Anaconda-Installation von Python sowie Jupyter Notebooks, welche wir zu beginn installieren.

Zielgruppen

Master- oder Doktoratsstudenten, die Text-Verarbeitung (NLP) für wissenschaftliche Projekte gebrauchen können. Der Onlinekurs richtet sich an Studierende nichttechnischer Fächer (d.h. Fächer, in denen regulär bislang keine Grundlagen der Statistik oder Informatik vermittelt werden). Als Zielpublikum werden daher primär Studierende der Rechtswissenschaftlichen Fakultät (RWF), der Theologischen Fakultät (ThF) und der Philosophischen Fakultät (PhF) angesprochen.

Vorkenntnisse

Interesse daran, Texte mit Python automatisiert zu analysieren. Wir bemühen uns, dass keine Vorkenntnisse nötig sind. Für das Textanalyse-Kapitel ist es nützlich, zu wissen was ein Vektor ist.

Lehrpersonen

Course Staff Image #1

Susanne Keller

MSc. Interdisziplinäre Naturwissenschaften

Course Staff Image #2

Sophia Conrad

BSc. Computerlinguistik

Course Staff Image #2

Prof. Dr. Tilmann Altwicker

LL.M., DAS ETH in Applied Statistics

Frequently Asked Questions

What web browser should I use?

The Open edX platform works best with current versions of Chrome, Edge, Firefox, Internet Explorer, or Safari.

See our list of supported browsers for the most up-to-date information.

Question #2

[no more questions yet]