WiSe 24/25  
Mathematik und ...  
Data Science  
Lehrveranstaltung

Data Science

Data Science

0590b_MA120
  • Introduction to Profile Areas

    0590bA1.1
  • Statistics for Data Science

    0590bA1.2
  • Machine Learning for Data Science

    0590bA1.3
    • 19330101 Vorlesung
      Maschinelles Lernen für Data Science (Grégoire Montavon)
      Zeit: Di 16:00-18:00, Do 16:00-18:00 (Erster Termin: 15.10.2024)
      Ort: T9/Gr. Hörsaal (Takustr. 9)

      Kommentar

      Qualifikationsziele:

      The course provides an overview of machine learning methods and algorithms for different learning tasks, namely supervised, unsupervised and reinforcement learning.

      In the first part of the course, for each task the main algorithms and techniques will be covered including experimentation and evaluation aspects.

      In the second part of the course, we will focus on specific learning challenges including high-dimensionality, non-stationarity, label-scarcity and class-imbalance.

      By the end of the course, you will have learned how to build machine learning models for different problems, how to properly evaluate their performance and how to tackle specific learning challenges.

      Inhalte

       Es werden Themen aus folgenden Gebieten behandelt:

       

      • Experiment Design
      • Sampling Techniques
      • Data cleansing
      • Storage of large data sets
      • Data visualization and graphs
      • Probabilistic data analysis
      • Prediction methods
      • Knowledge discovery
      • Neural networks
      • Support vector machines
      • Reinforcement learning and agent models

    • 19330102 Übung
      Übung zu Maschinelles Lernen Data Science (Grégoire Montavon)
      Zeit: Mi 16:00-18:00 (Erster Termin: 16.10.2024)
      Ort: T9/SR 006 Seminarraum (Takustr. 9)
  • Programming for Data Science

    0590bA1.4
    • 19330313 Praxisseminar
      Programming for Data Science (Sandro Andreotti)
      Zeit: Mo 12:00-16:00 (Erster Termin: 28.10.2024)
      Ort: A3/SR 120 (Arnimallee 3-5)

      Kommentar

      Qualifikationsziele

      Die Studentinnen und Studenten haben ein tieferes Verständnis für Konzepte in der Programmierung mit einer höheren Programmiersprache (z. B. C/C++, Java oder Python).

      Inhalte:

      Einführung in verschiedene Arten von Programmiertechniken.

  • Spezielle Aspekte der Datenverwaltung

    0089cA1.29
    • 19304801 Vorlesung
      Spezielle Aspekte der Datenverwaltung: Geospatial Databases (Agnès Voisard)
      Zeit: Di 14:00-16:00 (Erster Termin: 15.10.2024)
      Ort: T9/055 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Zielgruppe:

      Studierende im Masterstudiengang Voraussetzungen: Datenbanksysteme

      Kommentar

      Diese Vorlesung dient der Einführung in raumbezogene Datenbanken, wie sie insbesondere in geographischen Informationssystemen (GIS) Verwendung finden. Schwerpunkte sind u.a. die Modellierung raumbezogener Daten, Anfragesprachen und Optimierung sowie raumbezogene Zugriffsmethoden und Navigationssysteme ("Location-based services"). Grundwissen in Datenbanken ist erforderlich. Die Vorlesung beinhaltet Übungsblätter und Rechnerpraktika mit PostGIS.

      Sonstiges: Die Vorlesung wird in englischer Sprache gehalten

      Literaturhinweise

      Handouts are enough to understand the course.

      The following book will be mostly used: P. Rigaux, M. Scholl, A. Voisard.Spatial Databases - With Application to GIS. Morgan Kaufmann, May 2001. 432 p. (copies in the main library)

    • 19304802 Übung
      Übung zu Spezielle Aspekte der Datenverwaltung: Geospatial Databases (Agnès Voisard)
      Zeit: Do 14:00-16:00 (Erster Termin: 17.10.2024)
      Ort: T9/K 040 Multimediaraum (Takustr. 9)
  • Höhere Algorithmik

    0089cA2.1
    • 19303501 Vorlesung
      Höhere Algorithmik (László Kozma)
      Zeit: Di 10:00-12:00, Fr 10:00-12:00 (Erster Termin: 15.10.2024)
      Ort: T9/SR 006 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Zielgruppe

      alle Masterstudenten, und Bachelorstudenten, die sich in Algorithmen vertiefen wollen.

      Empfohlene Vorkenntnisse

      Grundkenntnisse im Bereich Entwurf und Analyse von Algorithmen

      Kommentar

      Es werden Themen wie:

      • allgemeine Algorithmenentwurfsprinzipien
      • Flussprobleme in Graphen,
      • Dynamische Programmierung,
      • Amortisierte Laufzeitanalyse und fortgeschrittene Datenstrukturen,
      • NP-Vollständigkeit
      • Approximationsalgorithmen für schwere Probleme,
      • arithmetische Algorithmen und Schaltkreise sowie schnelle Fourier-Transformation

      behandelt. Die Vorlesung wird in der englischen Sprache gehalten.

      Literaturhinweise

      • Cormen, Leiserson, Rivest, Stein: Introduction to Algorithms, 4th Ed. MIT Press 2022
      • Kleinberg, Tardos: Algorithm Design, Addison-Wesley 2005.
      • Sedgewick, Wayne: Algorithms, 4th Ed., Addison-Wesley 2016

    • 19303502 Übung
      Übung zu Höhere Algorithmik (László Kozma)
      Zeit: Fr 08:00-10:00, Fr 14:00-16:00 (Erster Termin: 18.10.2024)
      Ort: T9/046 Seminarraum (Takustr. 9)
  • Telematik

    0089cA3.5
    • 19305101 Vorlesung
      Telematik (Jochen Schiller)
      Zeit: Mo 12:00-14:00, Mi 10:00-12:00 (Erster Termin: 14.10.2024)
      Ort: T9/046 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Voraussetzungen:

      Grundkenntnisse im Bereich Rechnersysteme, z.B. TI-III.

      Kommentar

      Telematik ist Telekommunikation mit Hilfe von Mitteln der Informatik und befasst sich mit Themen der technischen Nachrichtenübertragung, Rechnernetze, Internet-Techniken, WWW, und Netzsicherheit.

      Behandelte Themen sind unter anderem folgende:

      • Allgemeine Grundlagen: Protokolle, Dienste, Modelle, Standards, Datenbegriff;
      • Nachrichtentechnische Grundlagen: Signale, Codierung, Modulation, Medien;
      • Sicherungsschicht: Datensicherung, Medienzugriff;
      • Lokale Netze: IEEE-Standards, Ethernet, Brücken;
      • Vermittlungsschicht: Wegewahl, Router, Internet-Protokoll (IPv4, IPv6);
      • Transportschicht: Dienstgüte, Flussteuerung, Staukontrolle, TCP;
      • Internet: Protokollfamilie rund um TCP/IP;
      • Anwendungen: WWW, Sicherheitsdienste, Netzwerkmanagement;
      • Neue Netzkonzepte.

      Literaturhinweise

      • Larry Peterson, Bruce S. Davie: Computernetze - Ein modernes Lehrbuch, dpunkt Verlag, Heidelberg, 2000
      • Krüger, G., Reschke, D.: Lehr- und Übungsbuch Telematik, Fachbuchverlag Leipzig, 2000
      • Kurose, J. F., Ross, K. W.: Computer Networking: A Top-Down Approach Featuring the Internet, Addi-son-Wesley Publishing Company, Wokingham, England, 2001
      • Siegmund, G.: Technik der Netze, 4. Auflage, Hüthig Verlag, Heidelberg, 1999
      • Halsall, F.: Data Communi-cations, Computer Networks and Open Systems 4. Auflage, Addison-Wesley Publishing Company, Wokingham, England, 1996
      • Tanenbaum, A. S.: Computer Networks, 3. Auflage, Prentice Hall, Inc., New Jersey, 1996

    • 19305102 Übung
      Übung zu Telematik (Marius Max Wawerek)
      Zeit: Mo 16:00-18:00 (Erster Termin: 14.10.2024)
      Ort: T9/SR 006 Seminarraum (Takustr. 9)
  • Spezielle Aspekte der Data Science in Life Sciences

    0590bB1.4
    • 19328301 Vorlesung
      Datenvisualisierung (Claudia Müller-Birn)
      Zeit: -
      Ort: keine Angabe

      Zusätzl. Angaben / Voraussetzungen

      https://www.mi.fu-berlin.de/en/inf/groups/hcc/teaching/winter_term_2021_22/course_data_visualization.html

      Kommentar

      Die rasante technologische Entwicklung erfordert die Verarbeitung großer Mengen von Daten unterschiedlichster Art, um diese durch den Menschen nutzbar zu machen. Diese Herausforderung betrifft heutzutage sehr viele Bereiche des Lebens, wie der Forschung, Wirtschaft und Politik. Datenvisualisierungen werden hier dazu eingesetzt, Informationen und Zusammenhänge durch grafische Darstellung von Daten zu erklären, diese durch visuelle Analyse zu erkunden, um damit die Entscheidungsfindungen zu unterstützen. Ziel dieser Veranstaltung ist es, Studierende mit den Prinzipien, Techniken und Algorithmen der Datenvisualisierung vertraut zu machen und praktische Fertigkeiten für die Gestaltung und Implementierung von Datenvisualisierungen zu vermitteln.

      Dieser Kurs soll Studierenden eine fundierte Einführung in die Grundlagen der Datenvisualisierung mit aktuellen Inhalten aus Forschung und Praxis geben. Am Ende der Veranstaltung werden die Studierenden

      1. ausgehend von einer Problemstellung Methoden zur Konzipierung von Visualisierungen auswählen und anwenden können,
      2. wesentliche theoretische Grundlagen der Visualisierung zur grafischen Wahrnehmung und Kognition kennen,
      3. Visualisierungsansätze und deren Vor- und Nachteile kennen und auswählen können,
      4. Visualisierungslösungen kritisch bewerten können, und
      5. praktische Fertigkeiten für die Implementierung von Visualisierungen besitzen.

      Diese Veranstaltung richtet sich sowohl an Studierende, die daran interessiert sind, Datenvisualisierung in ihrer Arbeit einzusetzen, als auch an Studierende, die Visualisierungs-software entwickeln wollen. Grundkenntnisse in der Programmierung (HTML, CSS, Javascript, Python) und Datenanalyse (z.B. R) sind hilfreich.

      Neben der Teilnahme an den Diskussionen in der Veranstaltung absolvieren die Studierenden mehrere Programmier- und Datenanalyseaufgaben sowie ein Abschlussprojekt, in welchem Sie eine gegebene Problemstellung lösen sollen. Von den Studierenden wird erwartet, dass sie die Ergebnisse der Aufgaben und des Projekts im Sinne der Reproduzierbarkeit dokumentieren und präsentieren.

      Bitte beachten Sie, dass die Veranstaltung sich darauf konzentriert, wie Daten visuell kodiert und für die Analyse präsentiert werden, nachdem die Struktur der Daten und deren Inhalt bekannt ist. Explorative Analysemethoden zur Entdeckung von Erkenntnissen in Daten sind nicht der Schwerpunkt der Veranstaltung.

      Literaturhinweise

      Textbuch

      Munzner, Tamara. Visualization analysis and design. AK Peters/CRC Press, 2014.

       

      Zusätzliche Literatur

      Kirk, Andy: Data visualisation: A handbook for data driven design. Sage. 2016.

      Yau, Nathan: Visualize This: The FlowingData Guide to Design, Visualization, and Statistics. Wiley Publishing, Inc. 2011.

      Spence, Robert: Information Visualization: Design for Interaction. Pearson. 2007.

    • 19336801 Vorlesung
      Integrative Analyse lebenswissenschaftlicher Daten und Einbeziehung von Vorwissen (Katharina Baum, Pauline Hiort, Pascal Iversen)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.10.2024)
      Ort: A6/SR 007/008 Seminarraum (Arnimallee 6)

      Kommentar

      Gerade in den Lebenswissenschaften liegen für eine Fragestellung oft Daten verschiedener Herkunft vor, und die Forschung hat bereits Vorwissen, wie zum Beispiel zu dynamischen Aspekten, oder räumlichen bzw. regulatorischen Beziehungen zwischen Entitäten. Diese Veranstaltung beschäftigt sich mit Analyse-Methoden, die verschiedene Daten und Vorwissen kombinieren können. Dabei geht es zum Beispiel grundlegend um die Verknüpfung von kontinuierlichen und kategorischen Daten in gemischten Modellen, aber auch Netzwerkintegration und multi-faktorielle Matrixmultiplikation. Ein Schwerpunkt liegt zudem auf verschiedenen Ansätzen des informierten maschinellen Lernens wie zum Beispiel graph-neuronalen Netzwerke, Transferlernen oder aktuellen Verfahren aus der Forschung wie simulationsbasiertes Vortrainieren. Der Fokus liegt dabei explizit nicht auf der Verarbeitung von Bildern, sondern tabellarischer oder anderweitiger Daten. Die Veranstaltungsprache ist Englisch, aber Übungsaufgaben und Fragen können auch auf Deutsch beigetragen werden.

    • 60102001 Vorlesung
      Methodik klinischer Studien (N.N.)
      Zeit: Fr 14:00-16:00 (Erster Termin: 18.10.2024)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)

      Kommentar

      Siehe englischer Text.

    • 60102301 Vorlesung
      Statistik für kleine Fallzahlen (Frank Konietschke)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.10.2024)
      Ort: A6/SR 031 Seminarraum (Arnimallee 6)

      Kommentar

      Beschreibung liegt auf Englisch vor.

    • 19328302 Übung
      Übung zu Data Visualization (Claudia Müller-Birn)
      Zeit: -
      Ort: keine Angabe
    • 19336802 Übung
      Übung zu Integrative Analyse lebenswissenschaftlicher Daten und Einbeziehung von Vorwissen (Katharina Baum)
      Zeit: Fr 10:00-12:00 (Erster Termin: 18.10.2024)
      Ort: T9/046 Seminarraum (Takustr. 9)
    • 60102002 Übung
      Übung zu Methodik klinischer Studien (N.N.)
      Zeit: Fr 16:00-18:00 (Erster Termin: 18.10.2024)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)
    • 60102302 Übung
      Übung zu Statistik mit kleinen Fallzahlen (Frank Konietschke)
      Zeit: Mi 16:00-18:00 (Erster Termin: 16.10.2024)
      Ort: A6/SR 031 Seminarraum (Arnimallee 6)
  • Aktuelle Forschungsthemen der Data Science in Life Sciences

    0590bB1.5
    • 19328301 Vorlesung
      Datenvisualisierung (Claudia Müller-Birn)
      Zeit: -
      Ort: keine Angabe

      Zusätzl. Angaben / Voraussetzungen

      https://www.mi.fu-berlin.de/en/inf/groups/hcc/teaching/winter_term_2021_22/course_data_visualization.html

      Kommentar

      Die rasante technologische Entwicklung erfordert die Verarbeitung großer Mengen von Daten unterschiedlichster Art, um diese durch den Menschen nutzbar zu machen. Diese Herausforderung betrifft heutzutage sehr viele Bereiche des Lebens, wie der Forschung, Wirtschaft und Politik. Datenvisualisierungen werden hier dazu eingesetzt, Informationen und Zusammenhänge durch grafische Darstellung von Daten zu erklären, diese durch visuelle Analyse zu erkunden, um damit die Entscheidungsfindungen zu unterstützen. Ziel dieser Veranstaltung ist es, Studierende mit den Prinzipien, Techniken und Algorithmen der Datenvisualisierung vertraut zu machen und praktische Fertigkeiten für die Gestaltung und Implementierung von Datenvisualisierungen zu vermitteln.

      Dieser Kurs soll Studierenden eine fundierte Einführung in die Grundlagen der Datenvisualisierung mit aktuellen Inhalten aus Forschung und Praxis geben. Am Ende der Veranstaltung werden die Studierenden

      1. ausgehend von einer Problemstellung Methoden zur Konzipierung von Visualisierungen auswählen und anwenden können,
      2. wesentliche theoretische Grundlagen der Visualisierung zur grafischen Wahrnehmung und Kognition kennen,
      3. Visualisierungsansätze und deren Vor- und Nachteile kennen und auswählen können,
      4. Visualisierungslösungen kritisch bewerten können, und
      5. praktische Fertigkeiten für die Implementierung von Visualisierungen besitzen.

      Diese Veranstaltung richtet sich sowohl an Studierende, die daran interessiert sind, Datenvisualisierung in ihrer Arbeit einzusetzen, als auch an Studierende, die Visualisierungs-software entwickeln wollen. Grundkenntnisse in der Programmierung (HTML, CSS, Javascript, Python) und Datenanalyse (z.B. R) sind hilfreich.

      Neben der Teilnahme an den Diskussionen in der Veranstaltung absolvieren die Studierenden mehrere Programmier- und Datenanalyseaufgaben sowie ein Abschlussprojekt, in welchem Sie eine gegebene Problemstellung lösen sollen. Von den Studierenden wird erwartet, dass sie die Ergebnisse der Aufgaben und des Projekts im Sinne der Reproduzierbarkeit dokumentieren und präsentieren.

      Bitte beachten Sie, dass die Veranstaltung sich darauf konzentriert, wie Daten visuell kodiert und für die Analyse präsentiert werden, nachdem die Struktur der Daten und deren Inhalt bekannt ist. Explorative Analysemethoden zur Entdeckung von Erkenntnissen in Daten sind nicht der Schwerpunkt der Veranstaltung.

      Literaturhinweise

      Textbuch

      Munzner, Tamara. Visualization analysis and design. AK Peters/CRC Press, 2014.

       

      Zusätzliche Literatur

      Kirk, Andy: Data visualisation: A handbook for data driven design. Sage. 2016.

      Yau, Nathan: Visualize This: The FlowingData Guide to Design, Visualization, and Statistics. Wiley Publishing, Inc. 2011.

      Spence, Robert: Information Visualization: Design for Interaction. Pearson. 2007.

    • 19336801 Vorlesung
      Integrative Analyse lebenswissenschaftlicher Daten und Einbeziehung von Vorwissen (Katharina Baum, Pauline Hiort, Pascal Iversen)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.10.2024)
      Ort: A6/SR 007/008 Seminarraum (Arnimallee 6)

      Kommentar

      Gerade in den Lebenswissenschaften liegen für eine Fragestellung oft Daten verschiedener Herkunft vor, und die Forschung hat bereits Vorwissen, wie zum Beispiel zu dynamischen Aspekten, oder räumlichen bzw. regulatorischen Beziehungen zwischen Entitäten. Diese Veranstaltung beschäftigt sich mit Analyse-Methoden, die verschiedene Daten und Vorwissen kombinieren können. Dabei geht es zum Beispiel grundlegend um die Verknüpfung von kontinuierlichen und kategorischen Daten in gemischten Modellen, aber auch Netzwerkintegration und multi-faktorielle Matrixmultiplikation. Ein Schwerpunkt liegt zudem auf verschiedenen Ansätzen des informierten maschinellen Lernens wie zum Beispiel graph-neuronalen Netzwerke, Transferlernen oder aktuellen Verfahren aus der Forschung wie simulationsbasiertes Vortrainieren. Der Fokus liegt dabei explizit nicht auf der Verarbeitung von Bildern, sondern tabellarischer oder anderweitiger Daten. Die Veranstaltungsprache ist Englisch, aber Übungsaufgaben und Fragen können auch auf Deutsch beigetragen werden.

    • 60102301 Vorlesung
      Statistik für kleine Fallzahlen (Frank Konietschke)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.10.2024)
      Ort: A6/SR 031 Seminarraum (Arnimallee 6)

      Kommentar

      Beschreibung liegt auf Englisch vor.

    • 19328302 Übung
      Übung zu Data Visualization (Claudia Müller-Birn)
      Zeit: -
      Ort: keine Angabe
    • 19336802 Übung
      Übung zu Integrative Analyse lebenswissenschaftlicher Daten und Einbeziehung von Vorwissen (Katharina Baum)
      Zeit: Fr 10:00-12:00 (Erster Termin: 18.10.2024)
      Ort: T9/046 Seminarraum (Takustr. 9)
    • 60102302 Übung
      Übung zu Statistik mit kleinen Fallzahlen (Frank Konietschke)
      Zeit: Mi 16:00-18:00 (Erster Termin: 16.10.2024)
      Ort: A6/SR 031 Seminarraum (Arnimallee 6)
  • Masterseminar Data Science in Life Sciences

    0590bB1.6
    • 19333611 Seminar
      Seminar Deep Learning for biomedical applications (Vitaly Belik)
      Zeit: Mo 16:00-18:00 (Erster Termin: 14.10.2024)
      Ort: T9/051 Seminarraum (Takustr. 9)

      Kommentar

      Recent developments in the area of machine learning due to availability of data and computational power promise to revolutionize almost every area of science. The driving technology behind this advancement is deep learning – a machine learning technology based on artificial neural networks consisting of many layers. Deep learning is capable of processing huge amount of data of different nature and already outperforming humans in many decision-making tasks. Biomedical research became now a source of large heterogeneous data, i.e. images, video, activity sensors, omics and text data. Leveraging the opportunities of this deep learning technology in the biomedical field requires particular set of skills combining thorough knowledge of necessary algorithms, specifics of biomedical data and designated programming tools. In this course we aim to offer students with background in computer science an opportunity to acquire the above skills to be able to deploy deep learning technology with a focus on biomedical applications. The course is structured as a seminar, where students under extensive guidance of instructors read fundamental books and recent research articles on deep learning, learn necessary programming tools, and produce their own implementations of computational pipelines in case studies using already published or original data. Starting from fundamental aspects of deep learning we aim to cover its applications to e.g. image data, time series data, text data, complex networks.

      Literaturhinweise

      [1] Andresen N, Wöllhaf M, Hohlbaum K, Lewejohann L, Hellwich O, Thöne- Reineke C, Belik V, Towards a fully automated surveillance of well-being status in laboratory mice using deep learning: Starting with facial expres- sion analysis. Plos One, 15(4):e0228059, (2020) https://doi.org/10.1371/ journal.pone.0228059

      [2] Jarynowski A, Semenov A, Kamiński M, Belik V. Mild Adverse Events of Sputnik V Vaccine in Russia: Social Media Content Analysis of Telegram via Deep Learning. J Med Internet Res 2021;23(11):e30529 https://doi.org//10.2196/30529

    • 19334617 Seminar/Proseminar
      Seminar/Proseminar: Large Language Models (Tim Landgraf)
      Zeit: Mo 10:00-12:00 (Erster Termin: 14.10.2024)
      Ort: A6/SR 007/008 Seminarraum (Arnimallee 6)

      Kommentar

      This seminar provides an exploration of large language models (LLMs), covering both foundational concepts and the latest advancements in the field. Participants will gain a comprehensive understanding of the architecture, training, and applications of LLMs, based on seminal research papers. The course will be organised as a journal club: students present individual papers, which are then discussed in the group to make sure we all get the ideas presented.

      ### Potential Topics

         - Neural networks and deep learning basics

         - Sequence modeling and RNNs (Recurrent Neural Networks)

         - Vaswani et al.'s "Attention is All You Need" paper

         - Self-attention mechanism

         - Multi-head attention and positional encoding

         - GPT-1: Radford et al.'s pioneering work

         - GPT-2: Scaling and implications

         - GPT-3: Architectural advancements and few-shot learning

         - BERT (Bidirectional Encoder Representations from Transformers)

         - T5 (Text-To-Text Transfer Transformer)

         - DistilBERT and efficiency improvements

         - Mamba:l and other SSMs: Design principles and performance

         - Flash Attention et al: Improving efficiency and scalability

         - Training regimes and resource requirements

         - Fine-tuning and transfer learning

      - Emergence of new capabilities

    • 19335011 Seminar
      Seminar: Netzwerke, dynamische Modelle und ML für Datenintegration in den Lebenswissenschaften (Katharina Baum, Pauline Hiort, Pascal Iversen)
      Zeit: Fr 12:00-13:30 (Erster Termin: 26.07.2024)
      Ort: T9/137 Konferenzraum (Takustr. 9)

      Kommentar

      Forschungsseminar der Arbeitsgruppe Data Integration in the Life Sciences (DILiS). Auch offen für Seminarteilnahmen im Masterstudium, Online-Teilnahme möglich. Bitte entnehmen Sie Termine dem aktuellen Plan im Whiteboard!

      Das Seminar bietet Raum für die Diskussion weiterführender und integrativer Datenanalysetechniken, insbesondere Vorträge und Diskussion von laufenden oder geplanten Forschungsprojekten, Neuigkeiten von Konferenzen, Besprechung aktueller Literatur und Diskussion möglicher zukünftiger Lehrformate und -inhalte, und Vorstellungen, sowie Abschlussvorträge zu Abschlussarbeiten oder Projektseminaren. Die Seminarsprache ist weitestgehend Englisch. Gern können interessierte Studierende teilnehmen und unverbindlich vorbeischauen oder ein selbst gewähltes Thema von Interesse für die Arbeitsgruppe vorstellen. Achtung: Einzelne Termine können ausfallen oder verschoben werden. Kontaktieren Sie mich gern für Fragen (katharina.baum@fu-berlin.de)!

    • 19336311 Seminar
      Visualization for Artificial Intelligence Explainability (Georges Hattab)
      Zeit: Mi 10:00-12:00 (Erster Termin: 23.10.2024)
      Ort: A3/019 Seminarraum (Arnimallee 3-5)

      Kommentar

      As AI systems grow more powerful, there is an increasing need to make these complex "black box" models interpretable and explainable. This seminar explores how data visualization techniques can provide crucial insights into how AI models operate and arrive at their outputs. Cutting-edge methods like saliency maps, decision trees, and dimensionality reduction visualizations allow us to peer inside deep neural networks and understand what factors they are considering.

       

      The seminar also covers visualization literacy - effectively communicating AI explainability visualizations to different stakeholders. Case studies highlight best practices for visualizing model behavior, evaluating fairness, and instilling appropriate levels of trust. Attendees will gain an understanding of how visualization can demystify AI, foster transparency, and enable real-world deployment of these systems in high-stakes domains.

    • 19336717 Seminar/Proseminar
      Graph-neural networks in the life sciences and beyond (Katharina Baum, Pauline Hiort, Pascal Iversen)
      Zeit: Di 12:00-14:00 (Erster Termin: 15.10.2024)
      Ort: A6/SR 009 Seminarraum (Arnimallee 6)

      Kommentar

      Komplexe Daten lassen sich oft auf natürliche Weise als Graphen modellieren. Graphen oder Netzwerke beschreiben die Interaktion zwischen Objekten und sind ein wirksames Instrument zur Darstellung von Systemen in vielen Anwendungen. Graphneuronale Netze sind neuronale Netze, die Graphstrukturen direkt verarbeiten, und haben sich in letzter Zeit als leistungsfähiges Werkzeug zur Analyse von Netzwerken und zur Vorhersage von Eigenschaften von Knoten und Verbindungen erwiesen.

      Dieses Seminar bietet eine eingehende Untersuchung von Graph Neural Networks (GNNs) und deren Anwendungen in verschiedenen Bereichen, mit besonderem Schwerpunkt auf den Biowissenschaften und der Biomedizin. Wir werden zunächst die grundlegenden Konzepte und Architekturen von GNNs erörtern, darunter Graph Convolutional Networks (GCNs) und Graph Attention Networks (GATs). Zu den besprochenen Anwendungen gehören Protein-Protein-Interaktionsnetzwerke, Pharmaforschung und personalisierte Medizin. Die Studierenden werden Forschungsarbeiten lesen und präsentieren und an kritischen Diskussionen teilnehmen.

      Die Sprache dieses Seminars ist Englisch. Die Studierenden sind ermutigt, auf Englisch zu präsentieren und zu diskutieren, aber Beiträge auf Deutsch sind auch möglich.

    • 19337211 Seminar
      Representation Learning (Georges Hattab)
      Zeit: Mi 14:00-16:00 (Erster Termin: 23.10.2024)
      Ort: A3/019 Seminarraum (Arnimallee 3-5)

      Kommentar

      While traditional feature engineering has been successful, modern machine learning increasingly relies on representation learning - automatically discovering informative features or representations from raw data. This seminar dives into advanced neural network-based approaches that learn dense vector representations capturing the underlying explanatory factors in complex, high-dimensional datasets.

       

      The seminar will cover techniques like autoencoders, variational autoencoders, and self-supervised contrastive learning methods that leverage unlabeled data to learn rich representations. You'll learn about properties of effective learned representations like preserving locality, handling sparse inputs, and disentangling underlying factors. Case studies demonstrate how representation learning enables breakthrough performance on tasks like image recognition and natural language understanding. You'll gain insights into interpreting these learned representations as well as their potential and limitations.

    • 19402911 Seminar
      Journal Club Computational Biology (Knut Reinert)
      Zeit: Mo 14:00-16:00 (Erster Termin: 14.10.2024)
      Ort: T9/053 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Zielgruppe:

      Master- und PhD-Student*inn*en

      Kommentar

      Inhalt:

      In diesem Seminar werden aktuelle Forschungsarbeiten der Bioinformatik sowie die Fortschrittsberichte der PhD-Student*inn*en vorgestellt. Master-Student*inn*en stellen entweder einen ihnen zugewiesenen Zeitschriftenartikel oder ihre Masterarbeit vor oder sie berichten über ihr Forschungspraktikum. Credits werden nur für die Präsentation von Artikeln vergeben.

      Anmeldungen bitte über Whiteboard ("Site Browser" aufrufen und nach Journal Club suchen).

      Literaturhinweise

      aktuelle Publikationen aus der Forschung

    • 19404611 Seminar
      Open science, data handling and ethical aspects in bioinformatics (Thilo Muth)
      Zeit: Do 14:00-16:00 (Erster Termin: 17.10.2024)
      Ort: T9/051 Seminarraum (Takustr. 9)

      Kommentar

      Siehe englische Beschreibung

    • 19405911 Seminar
      Biochemical networks and disease (Jana Wolf)
      Zeit: Mi 12:00-14:00 (Erster Termin: 16.10.2024)
      Ort: T9/051 Seminarraum (Takustr. 9)

      Kommentar

      Molecular metabolic, signaling and gene-regulatory networks form complex networks that underly the normal physiological functioning of the cell. Various perturbations within these networks have been described in diseases. We will here use original papers to study and discuss how perturbations can be implemented in models and how they change the network characteristics. We will focus on dynamic models described by ordinary differential equations.

    • 19406411 Seminar
      Journal Club: Public Health Data Science (Max von Kleist)
      Zeit: -
      Ort: keine Angabe

      Kommentar

      In diesem Seminar werden aktuelle Forschungsarbeiten im Bereich der datengetriebenen public health Forschung, sowie die Fortschrittsberichte der PhD-Student*inn*en und Post-Docs vorgestellt. Master-Student*inn*en stellen entweder einen ihnen zugewiesenen Zeitschriftenartikel oder ihre Masterarbeit vor oder sie berichten über ihr Forschungspraktikum. Credits werden nur für die Präsentation von Artikeln vergeben.

      Termin: online, nach Vereinbarung

  • Spezielle Aspekte der Data Science Technologies

    0590bB2.3
    • 19327201 Vorlesung
      Datenkompression (Heiko Schwarz)
      Zeit: Mo 14:00-16:00 (Erster Termin: 14.10.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Kommentar

      Die Datenkompression stellt eine Technologie dar, welche zahlreiche Anwendungen in unserem Informationszeitalter erst ermöglich.  Obwohl es der Endnutzer oft nicht bemerkt, verwenden wir sie täglich beim Musik hören, Bilder und Videos anschauen, oder der generellen Benutzung unseres Mobiltelefons.

      In der Vorlesung wird eine Einführung in die grundlegenden und am häufigsten verwendeten Verfahren der Datenkompression gegeben. Es werden sowohl theoretische Grundlagen als auch praktische Verfahren behandelt und anhand von Beispielen aus der Praxis erläutert.

      Der erste Teil der Vorlesung behandelt die verlustlose Kompression, bei der die Originaldaten exakt rekonstruiert werden können. Dieser Teil umfasst die folgenden Themen:

      • Eindeutige Decodierbarkeit und Prefix-Codes
      • Entropie und Entropierate als theoretische Grenzen der verlustlosen Kompression
      • Optimale Codes, Huffman Codes
      • Arithmetische Codierung
      • Lempel-Ziv Codierung
      • Linear Prädiktion
      • Beispiele aus der Text-, Bild- und Audiokompression

      Im zweiten Teil der Vorlesung wird die allgemeinere verlustbehaftete Kompression eingeführt, bei der nur eine Approximation der Originaldaten rekonstruiert werden kann. Diese Art der Kompression ermöglicht deutlich höhere Kompressionsfaktoren und ist die dominante Form der Kompression für Audio-, Bild- und Videodaten. Dieser zweite Teil der Vorlesung umfasst folgende Themen:

      • Skalare Quantisierung, optimale skalare Quantisierung
      • Theoretische Grenzen der verlustbehafteten Kompression: Rate-Distortion-Funktionen
      • Vektorquantisierung
      • Prädiktive Quantisierung
      • Transformationscodierung
      • Beispiele aus der Audio-, Bild- und Videocodierung

      Literaturhinweise

      • Sayood, K. (2018), “Introduction to Data Compression,” Morgan Kaufmann, Cambridge, MA.
      • Cover, T. M. and Thomas, J. A. (2006), “Elements of Information Theory,” John Wiley & Sons, New York.
      • Gersho, A. and Gray, R. M. (1992), “Vector Quantization and Signal Compression,” Kluwer Academic Publishers, Boston, Dordrecht, London.
      • Jayant, N. S. and Noll, P. (1994), “Digital Coding of Waveforms,” Prentice-Hall, Englewood Cliffs, NJ, USA.
      • Wiegand, T. and Schwarz, H. (2010), “Source Coding: Part I of Fundamentals of Source and Video Coding,” Foundations and Trends in Signal Processing, vol. 4, no. 1-2.

    • 19328601 Vorlesung
      Kryptowährungen und Blockchain (Katinka Wolter, Justus Purat)
      Zeit: Di 10:00-12:00 (Erster Termin: 15.10.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Kommentar

      In dieser Lehrveranstaltung werden wir uns mit den Technologien, der Geschichte und den Anwendungen von Kryptowährungen und Blockchain beschäftigen.

      Literaturhinweise

      Bitcoin and Cryptocurrency Technologies: A Comprehensive Introduction, by Arvind Narayanan, Joseph Bonneau, Edward Felten, Andrew Miller, Steven Goldfeder

    • 19327202 Übung
      Übung zur Datenkompression (Heiko Schwarz)
      Zeit: Mo 12:00-14:00 (Erster Termin: 14.10.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)
    • 19328602 Übung
      Übung zu Kryptowährungen und Blockchain (Justus Purat)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.10.2024)
      Ort: T9/SR 005 Übungsraum (Takustr. 9)
  • Aktuelle Forschungsthemen der Data Science Technologies

    0590bB2.4
    • 19327201 Vorlesung
      Datenkompression (Heiko Schwarz)
      Zeit: Mo 14:00-16:00 (Erster Termin: 14.10.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Kommentar

      Die Datenkompression stellt eine Technologie dar, welche zahlreiche Anwendungen in unserem Informationszeitalter erst ermöglich.  Obwohl es der Endnutzer oft nicht bemerkt, verwenden wir sie täglich beim Musik hören, Bilder und Videos anschauen, oder der generellen Benutzung unseres Mobiltelefons.

      In der Vorlesung wird eine Einführung in die grundlegenden und am häufigsten verwendeten Verfahren der Datenkompression gegeben. Es werden sowohl theoretische Grundlagen als auch praktische Verfahren behandelt und anhand von Beispielen aus der Praxis erläutert.

      Der erste Teil der Vorlesung behandelt die verlustlose Kompression, bei der die Originaldaten exakt rekonstruiert werden können. Dieser Teil umfasst die folgenden Themen:

      • Eindeutige Decodierbarkeit und Prefix-Codes
      • Entropie und Entropierate als theoretische Grenzen der verlustlosen Kompression
      • Optimale Codes, Huffman Codes
      • Arithmetische Codierung
      • Lempel-Ziv Codierung
      • Linear Prädiktion
      • Beispiele aus der Text-, Bild- und Audiokompression

      Im zweiten Teil der Vorlesung wird die allgemeinere verlustbehaftete Kompression eingeführt, bei der nur eine Approximation der Originaldaten rekonstruiert werden kann. Diese Art der Kompression ermöglicht deutlich höhere Kompressionsfaktoren und ist die dominante Form der Kompression für Audio-, Bild- und Videodaten. Dieser zweite Teil der Vorlesung umfasst folgende Themen:

      • Skalare Quantisierung, optimale skalare Quantisierung
      • Theoretische Grenzen der verlustbehafteten Kompression: Rate-Distortion-Funktionen
      • Vektorquantisierung
      • Prädiktive Quantisierung
      • Transformationscodierung
      • Beispiele aus der Audio-, Bild- und Videocodierung

      Literaturhinweise

      • Sayood, K. (2018), “Introduction to Data Compression,” Morgan Kaufmann, Cambridge, MA.
      • Cover, T. M. and Thomas, J. A. (2006), “Elements of Information Theory,” John Wiley & Sons, New York.
      • Gersho, A. and Gray, R. M. (1992), “Vector Quantization and Signal Compression,” Kluwer Academic Publishers, Boston, Dordrecht, London.
      • Jayant, N. S. and Noll, P. (1994), “Digital Coding of Waveforms,” Prentice-Hall, Englewood Cliffs, NJ, USA.
      • Wiegand, T. and Schwarz, H. (2010), “Source Coding: Part I of Fundamentals of Source and Video Coding,” Foundations and Trends in Signal Processing, vol. 4, no. 1-2.

    • 19328601 Vorlesung
      Kryptowährungen und Blockchain (Katinka Wolter, Justus Purat)
      Zeit: Di 10:00-12:00 (Erster Termin: 15.10.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Kommentar

      In dieser Lehrveranstaltung werden wir uns mit den Technologien, der Geschichte und den Anwendungen von Kryptowährungen und Blockchain beschäftigen.

      Literaturhinweise

      Bitcoin and Cryptocurrency Technologies: A Comprehensive Introduction, by Arvind Narayanan, Joseph Bonneau, Edward Felten, Andrew Miller, Steven Goldfeder

    • 19327202 Übung
      Übung zur Datenkompression (Heiko Schwarz)
      Zeit: Mo 12:00-14:00 (Erster Termin: 14.10.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)
    • 19328602 Übung
      Übung zu Kryptowährungen und Blockchain (Justus Purat)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.10.2024)
      Ort: T9/SR 005 Übungsraum (Takustr. 9)
  • Ausgewählte Themen der Data Science Technologies A

    0590bB2.5
    • 19312101 Vorlesung
      Betriebssysteme (Barry Linnert)
      Zeit: Mo 10:00-12:00, Do 12:00-14:00 (Erster Termin: 14.10.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Sprache

      Kurssprache ist Deutsch, aber die Folien sind auf Englisch.

      Die Übungszettel und die Klausur sind auf Deutsch, können aber auch auf Englisch beantwortet werden.

      Homepage

      https://www.inf.fu-berlin.de/w/SE/VorlesungBetriebssysteme

      Kommentar

      Betriebssysteme verbinden die Anwendungs- und Nutzungsebene mit der Verwaltung der Hardware. Ausgehend von den Aufgaben eines Betriebssystems und den Anforderungen an moderne Betriebssysteme werden die wichtigsten Aspekte im Zusammenhang mit Aufbau und Entwurf eingeführt:

      • Betriebssystemstruktur und –entwurf einschließlich Historischer Abriss und Betriebssystemphilosophien, Systemgliederung und Betriebsarten, Betriebsmittel und –verwaltung;
      • Prozesse einschließlich Prozessverwaltung;
      • Scheduling einschließlich Real-Time-Scheduling;
      • Prozessinteraktionen und Interprozesskommunikation;
      • Betriebsmittelverwaltung einschließlich des Betriebs von Geräten und Treiberentwicklung und Ein-Ausgabegeräten;
      • Speicherverwaltung einschließlich Prozessadressraum und virtueller Speicher;
      • Dateiverwaltung einschließlich Festplattenbetrieb und Speicherhierarchien;
      • Verteilte Betriebssysteme einschließlich verteilter Architekturen zur Ressourcenverwaltung;
      • Leistungsbewertung einschließlich Überlastproblematik.

      Für die einzelnen Aspekte dienen aktuelle Betriebssysteme als Beispiele und es wird die aktuelle Forschung auf dem Gebiet herangezogen. Der Übungsbetrieb dient der Reflexion der vermittelten Inhalte in Form praktischer Umsetzung und Programmierung der behandelten Ansätze durch die Studierenden.

      Literaturhinweise

      • A.S. Tanenbaum: Modern Operating Systems, 2nd Ed. Prentice-Hall, 2001
      • A. Silberschatz et al.: Operating Systems Concepts with Java, 6th Ed. Wiley, 2004

    • 19312102 Übung
      Übung zu Betriebssysteme (Barry Linnert)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.10.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)
  • Ausgewählte Themen der Data Science Technologies B

    0590bB2.6
    • 19312101 Vorlesung
      Betriebssysteme (Barry Linnert)
      Zeit: Mo 10:00-12:00, Do 12:00-14:00 (Erster Termin: 14.10.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Sprache

      Kurssprache ist Deutsch, aber die Folien sind auf Englisch.

      Die Übungszettel und die Klausur sind auf Deutsch, können aber auch auf Englisch beantwortet werden.

      Homepage

      https://www.inf.fu-berlin.de/w/SE/VorlesungBetriebssysteme

      Kommentar

      Betriebssysteme verbinden die Anwendungs- und Nutzungsebene mit der Verwaltung der Hardware. Ausgehend von den Aufgaben eines Betriebssystems und den Anforderungen an moderne Betriebssysteme werden die wichtigsten Aspekte im Zusammenhang mit Aufbau und Entwurf eingeführt:

      • Betriebssystemstruktur und –entwurf einschließlich Historischer Abriss und Betriebssystemphilosophien, Systemgliederung und Betriebsarten, Betriebsmittel und –verwaltung;
      • Prozesse einschließlich Prozessverwaltung;
      • Scheduling einschließlich Real-Time-Scheduling;
      • Prozessinteraktionen und Interprozesskommunikation;
      • Betriebsmittelverwaltung einschließlich des Betriebs von Geräten und Treiberentwicklung und Ein-Ausgabegeräten;
      • Speicherverwaltung einschließlich Prozessadressraum und virtueller Speicher;
      • Dateiverwaltung einschließlich Festplattenbetrieb und Speicherhierarchien;
      • Verteilte Betriebssysteme einschließlich verteilter Architekturen zur Ressourcenverwaltung;
      • Leistungsbewertung einschließlich Überlastproblematik.

      Für die einzelnen Aspekte dienen aktuelle Betriebssysteme als Beispiele und es wird die aktuelle Forschung auf dem Gebiet herangezogen. Der Übungsbetrieb dient der Reflexion der vermittelten Inhalte in Form praktischer Umsetzung und Programmierung der behandelten Ansätze durch die Studierenden.

      Literaturhinweise

      • A.S. Tanenbaum: Modern Operating Systems, 2nd Ed. Prentice-Hall, 2001
      • A. Silberschatz et al.: Operating Systems Concepts with Java, 6th Ed. Wiley, 2004

    • 19312102 Übung
      Übung zu Betriebssysteme (Barry Linnert)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.10.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)
  • Masterseminar in Data Science Technologies

    0590bB2.7
    • 19303811 Seminar
      Projektseminar: Datenverwaltung (Muhammed-Ugur Karagülle, Agnès Voisard)
      Zeit: Do 12:00-14:00 (Erster Termin: 17.10.2024)
      Ort: A6/SR 009 Seminarraum (Arnimallee 6)

      Zusätzl. Angaben / Voraussetzungen

      Voraussetzungen

      • ALP I
      • ALP II
      • Datenbanksysteme

      Kommentar

      Inhalt

      Ein Projektseminar dient als Vorbereitung für eine Bachelor- oder Masterarbeit in der AGDB. Im Rahmen des Projektseminars beschäftigen wir uns mit der Analyse und Visualisierung medizinischer Daten. Studierende lernen in einem iterativen Verfahren das Verfassen von wissenschaftlichen Dokumenten. Zusätzlich werden wir ein kleines praktisches Projekt realisieren.

      Literaturhinweise

      Wird bekannt gegeben.

    • 19328217 Seminar/Proseminar
      Seminar/Proseminar: New Trends in Information Systems (Agnès Voisard, Muhammed-Ugur Karagülle)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.10.2024)
      Ort: T9/SR 005 Übungsraum (Takustr. 9)

      Kommentar

      Ziel dieses Seminars ist es, aktuelle Trends im Datenmanagement zu untersuchen. Wir werden uns unter anderem mit zwei aufstrebenden Themen beschäftigen: Location Based Services (LBS) und Event-Based Services (EBS).

      Event-Based Systems (EBS) sind Teil vieler aktueller Anwendungen wie Überwachung von Geschäftsaktivitäten, Börsenticker, Facility Management, Datenstreaming oder Sicherheit. In den vergangenen Jahren hat das Thema sowohl in der Industrie als auch in der Wissenschaft zunehmend an Bedeutung gewonnen. Aktuelle Forschungsschwerpunkte konzentrieren sich auf verschiedene Aspekte, die von Ereigniserfassung (eingehende Daten) bis zur Auslösung von Reaktionen reichen. Dieses Seminar zielt darauf ab, einige der aktuellen Trends in Event-basierten Systemen mit einem starken Fokus auf Modelle und Design zu studieren. Ortsbasierte Dienste sind heutzutage oft Teil des täglichen Lebens durch Anwendungen wie Navigationsassistenten im öffentlichen oder privaten Transportbereich. Die zugrundeliegende Technologie befasst sich mit vielen verschiedenen Aspekten, z. B. Standortbestimmung, Informationsabruf oder Datenschutz. In jüngerer Zeit wurden Aspekte wie der Benutzerkontext und Präferenzen berücksichtigt, um den Benutzern mehr personalisierte Informationen zu senden.

      Ein solider Hintergrund in Datenbanken ist erforderlich, typischerweise ein Datenbankkurs auf Bachelor-Niveau.

      Literaturhinweise

      Wird bekannt gegeben.

    • 19333417 Seminar/Proseminar
      Seminar/Proseminar: Explainable AI for Data Science (Grégoire Montavon)
      Zeit: Di 14:00-16:00 (Erster Termin: 15.10.2024)
      Ort: KöLu24-26/SR 006 Neuro/Mathe (Königin-Luise-Str. 24 / 26)

      Kommentar

      Explainable AI is a recent and growing subfield of machine learning (ML) that aims to bring transparency into ML models without sacrificing their predictive accuracy. This seminar will explore current research on the use of Explainable AI for extracting insights from large datasets of interest. Use cases in biomedicine, chemistry and earth sciences will be covered.

      Students will select a few papers from a pool of thematically relevant research papers, which they will read and present over the course of the semester.

    • 19334717 Seminar/Proseminar
      Seminar/Proseminar: Machine Learning for Process Control (Grégoire Montavon)
      Zeit: Do 14:00-16:00 (Erster Termin: 17.10.2024)
      Ort: KöLu24-26/SR 006 Neuro/Mathe (Königin-Luise-Str. 24 / 26)

      Kommentar

      Numerous real-world processes need to be kept under control in order to ensure safety or efficiency. Machine learning models are good candidates for this. They can for example detect shifts/anomalies/decalibrations/instabilities/etc. and possibly also predict which action needs to be taken on the process. The real-time nature of such tasks brings unique challenges from a ML perspective compared to classical application of ML. This seminar will explore relevant ML methods such as online/reinforcement learning and real-time data analysis. Use cases in manufacturing and intensive care will be covered. Students will select a few papers from a pool of thematically relevant research papers, which they will read and present over the course of the semester.

    • 19336311 Seminar
      Visualization for Artificial Intelligence Explainability (Georges Hattab)
      Zeit: Mi 10:00-12:00 (Erster Termin: 23.10.2024)
      Ort: A3/019 Seminarraum (Arnimallee 3-5)

      Kommentar

      As AI systems grow more powerful, there is an increasing need to make these complex "black box" models interpretable and explainable. This seminar explores how data visualization techniques can provide crucial insights into how AI models operate and arrive at their outputs. Cutting-edge methods like saliency maps, decision trees, and dimensionality reduction visualizations allow us to peer inside deep neural networks and understand what factors they are considering.

       

      The seminar also covers visualization literacy - effectively communicating AI explainability visualizations to different stakeholders. Case studies highlight best practices for visualizing model behavior, evaluating fairness, and instilling appropriate levels of trust. Attendees will gain an understanding of how visualization can demystify AI, foster transparency, and enable real-world deployment of these systems in high-stakes domains.

    • 19337211 Seminar
      Representation Learning (Georges Hattab)
      Zeit: Mi 14:00-16:00 (Erster Termin: 23.10.2024)
      Ort: A3/019 Seminarraum (Arnimallee 3-5)

      Kommentar

      While traditional feature engineering has been successful, modern machine learning increasingly relies on representation learning - automatically discovering informative features or representations from raw data. This seminar dives into advanced neural network-based approaches that learn dense vector representations capturing the underlying explanatory factors in complex, high-dimensional datasets.

       

      The seminar will cover techniques like autoencoders, variational autoencoders, and self-supervised contrastive learning methods that leverage unlabeled data to learn rich representations. You'll learn about properties of effective learned representations like preserving locality, handling sparse inputs, and disentangling underlying factors. Case studies demonstrate how representation learning enables breakthrough performance on tasks like image recognition and natural language understanding. You'll gain insights into interpreting these learned representations as well as their potential and limitations.

  • Softwareprojekt Data Science B

    0590bB2.8
    • 19308312 Projektseminar
      Softwareprojekt: Anwendungen von Algorithmen (László Kozma)
      Zeit: Di 14:00-16:00 (Erster Termin: 08.10.2024)
      Ort: T9/K 040 Multimediaraum (Takustr. 9)

      Kommentar

      Inhalt

      Ein typisches Anwendungsgebiet von Algorithmen wird ausgewählt und softwaretechnisch behandelt. In diesem Semester soll es um Algorithmen zum Graphenzeichnen gehen. Das Ziel ist es, Programme zur Herstellung guter Zeichnungen zu schreiben und damit an dem Zeichenwettbewerb teilzunehmen, der im September im Zusammenhang mit der internationalen Konferenz über Graph Drawing and Network Visualization stattfindet.

      Voraussetzungen

      Grundkenntnisse in Entwurf und Analyse von Algorithmen

      Literaturhinweise

      je nach Anwendungsgebiet

    • 19315312 Projektseminar
      Softwareprojekt: Verteilte Systeme (Justus Purat)
      Zeit: Di 14:00-16:00 (Erster Termin: 15.10.2024)
      Ort: T9/053 Seminarraum (Takustr. 9)
    • 19334212 Projektseminar
      Softwareprojekt: Maschinelles Lernen mit Graphen für verbesserte (Krebs-)Behandlung (Pauline Hiort, Pascal Iversen)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.10.2024)
      Ort: T9/K 040 Multimediaraum (Takustr. 9)

      Kommentar

      Im Softwareprojekt werden wir verschiedene Machine-Learning (ML)-Methoden implementieren, trainieren und evaluieren. Der Fokus im Projekt liegt auf graph-neuronalen Netzwerken (GNN), die Graphen als Input-Feature für das Lernen verwenden. Die GNNs werden wir mit verschiedenen Baseline Methoden, zum Beispiel mit neuronalen Netzen und Regressionsmodellen, vergleichen. Die verschiedenen ML Methoden werden auf einen spezifischen Datensatz, z.B. zur Vorhersage von Medikamentenkombinationen gegen Krebserkrankungen, angewendet und ausgewertet. Der Datensatz wird von uns vorbereitet und mit den implementierten Methoden analysiert.

      Die Programmiersprache ist Python, und wir planen die Verwendung von modernen Python-Modulen für ML wie scikit-learn, TensorFlow oder PyTorch. Gute Python-Kenntnisse sind Voraussetzung. Das Ziel ist die Erstellung eines Python-Pakets, das für den konkreten Anwendungsfall wiederverwendbaren Code zur Präprozessierung, Training auf ML-Modelle und Evaluation der Ergebnisse mit Dokumentation (z.B. mit sphinx) liefert. Das Softwareprojekt findet semesterbegleitend statt und kann auch auf Englisch durchgeführt werden.

  • Softwareprojekt Data Science A

    0590bB2.1
    • 19308312 Projektseminar
      Softwareprojekt: Anwendungen von Algorithmen (László Kozma)
      Zeit: Di 14:00-16:00 (Erster Termin: 08.10.2024)
      Ort: T9/K 040 Multimediaraum (Takustr. 9)

      Kommentar

      Inhalt

      Ein typisches Anwendungsgebiet von Algorithmen wird ausgewählt und softwaretechnisch behandelt. In diesem Semester soll es um Algorithmen zum Graphenzeichnen gehen. Das Ziel ist es, Programme zur Herstellung guter Zeichnungen zu schreiben und damit an dem Zeichenwettbewerb teilzunehmen, der im September im Zusammenhang mit der internationalen Konferenz über Graph Drawing and Network Visualization stattfindet.

      Voraussetzungen

      Grundkenntnisse in Entwurf und Analyse von Algorithmen

      Literaturhinweise

      je nach Anwendungsgebiet

    • 19314012 Projektseminar
      Softwareprojekt: Semantische Technologien (Adrian Paschke)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.10.2024)
      Ort: A7/SR 031 (Arnimallee 7)

      Zusätzl. Angaben / Voraussetzungen

      Weitere Informationen finden sich auf der Veranstaltungsseite der AG Corporate Semantic Web.

      Kommentar

      Im Rahmen des Softwareprojekts werden gemischte Gruppen von Bachelor- und Master-Studenten gebildet, die entweder ein eigenständiges Projekt erstellen oder aber ein Teil eines größeren Projektes im Bereich semantischer KI Technologien übernehmen. Bei der Umsetzung der Aufgaben werden vertiefte Programmierkenntnisse in der Anwendung semantischer Technologien und künstlicher Intelligenz (KI) erworben, Projektmanagement und Teamfähigkeit gefördert, sowie Praktiken der guten Software-Entwicklung großer verteilter Systeme und Semantic Web Anwendungen geübt. Das Softwareprojekt kann in Zusammenarbeit mit einem externen Partner aus der Industrie oder Standardisierung durchgeführt werden. Die Fortführung des Projektes als Bachelor- oder Masterarbeit ist möglich und ausdrücklich erwünscht.

    • 19315312 Projektseminar
      Softwareprojekt: Verteilte Systeme (Justus Purat)
      Zeit: Di 14:00-16:00 (Erster Termin: 15.10.2024)
      Ort: T9/053 Seminarraum (Takustr. 9)
    • 19334212 Projektseminar
      Softwareprojekt: Maschinelles Lernen mit Graphen für verbesserte (Krebs-)Behandlung (Pauline Hiort, Pascal Iversen)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.10.2024)
      Ort: T9/K 040 Multimediaraum (Takustr. 9)

      Kommentar

      Im Softwareprojekt werden wir verschiedene Machine-Learning (ML)-Methoden implementieren, trainieren und evaluieren. Der Fokus im Projekt liegt auf graph-neuronalen Netzwerken (GNN), die Graphen als Input-Feature für das Lernen verwenden. Die GNNs werden wir mit verschiedenen Baseline Methoden, zum Beispiel mit neuronalen Netzen und Regressionsmodellen, vergleichen. Die verschiedenen ML Methoden werden auf einen spezifischen Datensatz, z.B. zur Vorhersage von Medikamentenkombinationen gegen Krebserkrankungen, angewendet und ausgewertet. Der Datensatz wird von uns vorbereitet und mit den implementierten Methoden analysiert.

      Die Programmiersprache ist Python, und wir planen die Verwendung von modernen Python-Modulen für ML wie scikit-learn, TensorFlow oder PyTorch. Gute Python-Kenntnisse sind Voraussetzung. Das Ziel ist die Erstellung eines Python-Pakets, das für den konkreten Anwendungsfall wiederverwendbaren Code zur Präprozessierung, Training auf ML-Modelle und Evaluation der Ergebnisse mit Dokumentation (z.B. mit sphinx) liefert. Das Softwareprojekt findet semesterbegleitend statt und kann auch auf Englisch durchgeführt werden.

    • Mustererkennung 0089cA1.12
    • Netzbasierte Informationssysteme 0089cA1.13
    • Rechnersicherheit 0089cA1.16
    • Verteilte Systeme 0089cA1.20
    • Künstliche Intelligenz 0089cA1.9
    • Mobilkommunikation 0089cA3.3
    • Applied Machine Learning in Bioinformatics 0262cD1.12
    • Machine Learning in Bioinformatics 0262cD1.7
    • Big Data Analysis in Bioinformatics 0262cD1.8
    • Data Science in Life Sciences 0590bB1.1
    • Forschungspraxis 0590bB1.2
    • Interdisziplinäre Zugänge im Rahmen von Data Science A 0590bB1.27
    • Interdisziplinäre Zugänge im Rahmen von Data Science B 0590bB1.28
    • Ethical Foundations of Data Science 0590bB1.3
    • Ausgewählte Themen der Data Science in Life Sciences 0590bB1.7
    • Datenbanksysteme Data Science 0590bB2.9
    • Begleitendes Kolloquium 0590bE1.2