SoSe 24  
Mathematik und ...  
Data Science  
Lehrveranstaltung

Data Science

Data Science

0590b_MA120
  • Künstliche Intelligenz

    0089cA1.9
  • Mobilkommunikation

    0089cA3.3
    • 19303901 Vorlesung
      Mobilkommunikation (Jochen Schiller)
      Zeit: Mi 10:00-12:00, zusätzliche Termine siehe LV-Details (Erster Termin: 17.04.2024)
      Ort: T9/SR 005 Übungsraum (Takustr. 9)

      Kommentar

      Inhalt:

      Das Modul Mobilkommunikation stellt exemplarisch alle Aspekte mobiler und drahtloser Kommunikation dar, welche derzeit den stärksten Wachstumsmarkt überhaupt darstellt und in immer mehr Bereiche der Gesellschaft vordringt.

      Während der gesamten Vorlesung wird ein starker Wert auf die Systemsicht gelegt und es werden zahlreiche Querverweise auf reale Systeme, internationale Standardisierungen und aktuellste Forschungsergebnisse gegeben.

      Die zu behandelnden Themen sind:

      • Technische Grundlagen der drahtlosen Übertragung: Frequenzen, Signale, Antennen, Signalausbreitung, Multiplex, Modulation, Spreizspektrum, zellenbasierte Systeme;
      • Medienzugriff: SDMA, FDMA, TDMA, CDMA;
      • Drahtlose Telekommunikationssysteme: GSM, TETRA, UMTS, IMT-2000, LTE;
      • Drahtlose lokale Netze: Infrastruktur/ad-hoc, IEEE 802.11/15, Bluetooth;
      • Mobile Netzwerkschicht: Mobile IP, DHCP, ad-hoc Netze;
      • Mobile Transportschicht: traditionelles TCP, angepasste TCP-Varianten, weitere Mechanismen;
      • Mobilitätsunterstützung;
      • Ausblick: 4. Generation Mobilnetze

      Literaturhinweise

      Jochen Schiller, Mobilkommunikation, Addison-Wesley, 2.Auflage 2003

      Alle Unterlagen verfügbar unter http://www.mi.fu-berlin.de/inf/groups/ag-tech/teaching/resources/Mobile_Communications/course_Material/index.html

  • Applied Machine Learning in Bioinformatics

    0262cD1.12
    • 19403613 Praxisseminar
      Current research topics in visual and data-centric computing (Tim Conrad)
      Zeit: Fr 08:00-12:00 (Erster Termin: 19.04.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Kommentar

      In this course, you will learn the basic statistical and algorithmic concepts in Machine Learning, focusing on their practical applications in bioinformatics. You will have the opportunity to work on practical problems and implement and use the methods learned during lectures to analyze biological datasets, drawing examples and case studies from research conducted at the Zuse Institute Berlin, specifically from the department of Visual and Data-centric Computing. This department specializes in developing tools for extracting insights from various datasets across fields including biology, biophysics, neuroscience, and medicine.

      We will cover topics like data pre-processing, model implementations, and analysis methods. You will learn about models for regression, clustering, and classification, feature selection, and advanced data preprocessing, such as imputation. We will also cover Deep Learning approaches.

      Throughout the course, you will complete weekly exercises with a focus of implementation and data analysis, including written reports. These exercises are designed to reinforce the practical applications of the material covered in the lectures.

      By the end of the course, you will be able to process data, choose appropriate models to answer specific questions, evaluate results, and effectively communicate your findings.

    • 60103513 Praxisseminar
      Computer vision for biomedical images (Sören Lukassen)
      Zeit: Do 14:00-18:00 (Erster Termin: 18.04.2024)
      Ort: A6/017 Frontalunterrichtsraum (Bioinf) (Arnimallee 6)

      Kommentar

      Imaging techniques have become an integral component of both biomedical research and clinical practice. At the same time, automated image analysis has experienced significant progress, driving technologies ranging from image search to autonomous vehicles. This automation is increasingly applied to biomedical images. However, adapting computer vision algorithms for biomedical images introduces unique challenges due to their distinct properties uncommon in other imaging datasets.

      In this course, you will explore the prevalent imaging modalities within biomedicine, including CT scans, MRI, ultrasound, and whole-slide microscopy images. We will investigate the common data formats for these images, understanding what distinguishes them from typical jpeg or png files, and how these distinctions can facilitate their efficient analysis. After an introduction to basic computer vision algorithms, we will trace the evolution of classification and segmentation models in this domain over the last decade, starting with convolutional neural networks and culminating with cutting-edge architectures such as vision transformers. Through practical exercises, you will apply your knowledge to a dataset of histology slide images from cancer patients, aiming to predict the tumor's stage and location. Additionally, we will investigate how your models arrive at their predictions, identifying the data patterns they consider informative and connecting these insights to the pathophysiological alterations within tumor tissues.

      Our models will be built using the pytorch package in Python. While familiarity with coding neural networks is not a prerequisite, prior experience in general Python programming is expected.

      By the conclusion of this course, you will be equipped to develop segmentation and classification models for biomedical images, recognize common pitfalls and artifacts, explain how your models arrive at their predictions, and effectively communicate your findings.

  • Machine Learning in Bioinformatics

    0262cD1.7
    • 19405701 Vorlesung
      Machine Learning in Bioinformatics (Philipp Florian Benner, Hugues Richard)
      Zeit: Mo 08:00-10:00 (Erster Termin: 15.04.2024)
      Ort: A6/SR 025/026 Seminarraum (Arnimallee 6)

      Kommentar

      Dieser Kurs führt Schlüsselkonzepte des maschinellen Lernens ein und wird von Tutorien und Übungsaufgaben begleitet, in denen Methoden des maschinellen Lernens auf aktuelle Probleme der Bioinformatik angewendet werden. Nach einer kurzen Wiederholung der Wahrscheinlichkeitstheorie stellen wir probabilistische Methoden zur Klassifikation und Sequenzanalyse vor (Naive Bayes, Mixture Models, Hidden Markov Models). Wir diskutieren die Erwartungs-Maximierung (EM) aus probabilistischer Perspektive und verwenden sie für die Sequenzanalyse. Lineare und logistische Regression dienen als Einstiegspunkt für komplexere Methoden des maschinellen Lernens, einschließlich Kernel-Methoden und neuronale Netze. Die Vorlesung behandelt mehrere neuronale Netzwerkarchitekturen (CNNs, GNN, Transformers), die derzeit in der Bioinformatik-Community und anderen Forschungsbereichen verwendet werden. In den Tutorien und im Rahmen von Übungsaufgaben werden ausgewählte Machine-Learning-Modelle mit scikit-learn und pytorch in Python implementiert. Der Kurs soll es den Studierenden ermöglichen, alle gängigen Techniken des maschinellen Lernens zu verstehen und State-of-the-Art-Klassifizierungsstrategien zu entwickeln, die dann auf Probleme in der Bioinformatik und verwandten Bereichen angewendet werden können.   Inhalte:
      - Naive Bayes
      - Clustering und Mixture Models
      - Hidden Markov Models
      - Regression und Partial Least Squares
      - Kernel Methods
      - Neural Networks und Architekturen
      - Regularization und Model Selection   Voraussetzungen:
      - Lineare Algebra (einfache Vector- and Matrixalgebra)
      - Analysis (mathematische Optimierung, Lagrange)
      - Programmierkenntnisse in Python -- einschließlich objektorientierte Programmierung
      - Grundlegende Kenntnisse oder starkes Interesse in molekularer Biologie und Anwendungen in der Bioinformatik

    • 19405702 Übung
      Übung zu Machine Learning in Bioinformatics (Philipp Florian Benner, Hugues Richard)
      Zeit: Mi 08:00-10:00 (Erster Termin: 17.04.2024)
      Ort: A7/SR 031 (Arnimallee 7)
  • Data Science in Life Sciences

    0590bB1.1
    • 19405606 Seminaristischer Unterricht
      Data Science in the Life Sciences (Katharina Jahn, Maryam Ghareghani)
      Zeit: Mo 10:00-14:00 (Erster Termin: 15.04.2024)
      Ort: T9/SR 006 Seminarraum (Takustr. 9)

      Kommentar

      This course offers an introduction to various types of data and analysis techniques which are typically used in the life sciences (e.g. omics technologies). The goal is to get a deeper understanding of advanced concepts and data analytical methods in the area of life sciences.

      The focus will be on the following topics:

      • acquisition and pre-processing of data from the area of life sciences,
      • explorative analysis techniques,
      • concepts and tools for reproducible research,
      • theory and practice of methods and models for the analysis of data from the life sciences (statistical inference, regression models, methods of machine learning),
      • introduction to methods of big data analysis.

      After successful completion of this course, participants are able to evaluate, plan and conduct investigations in the life sciences using common methods.

       

    • 19405612 Projektseminar
      Projektseminar zu Data Science in the Life Sciences (Katharina Jahn, Maryam Ghareghani,)
      Zeit: Mi 10:00-14:00 (Erster Termin: 17.04.2024)
      Ort: A6/SR 031 Seminarraum (Arnimallee 6)
  • Ethical Foundations of Data Science

    0590bB1.3
  • Spezielle Aspekte der Data Science in Life Sciences

    0590bB1.4
    • 19336901 Vorlesung
      Advanced Data Visualization for Artificial Intelligence (Georges Hattab)
      Zeit: Mi 10:00-12:00 (Erster Termin: 17.04.2024)
      Ort: T9/SR 006 Seminarraum (Takustr. 9)

      Kommentar

      Die Vorlesung über fortgeschrittene Datenvisualisierung für künstliche Intelligenz ist eine umfassende Erkundung der modernsten Techniken und Tools zur Erstellung und Validierung komplexer Visualisierungen für die Vermittlung von Dateneinblicken und Geschichten, mit einem besonderen Schwerpunkt auf Anwendungen in der Verarbeitung natürlicher Sprache (NLP) und erklärbarer KI. Der Vortrag führt die Teilnehmer in das verschachtelte Modell der Visualisierung ein, das vier Ebenen umfasst: Charakterisierung der Aufgabe und der Daten, Abstrahierung in Operationen und Datentypen, Entwurf visueller Kodierungs- und Interaktionstechniken und Erstellung von Algorithmen zur effizienten Ausführung von Techniken. Dieses Modell dient als Rahmen für den Entwurf und die Validierung von Datenvisualisierungen.

      Darüber hinaus wird in der Vorlesung die Anwendung der Datenvisualisierung im Bereich NLP behandelt, wobei der Schwerpunkt auf der Visualisierung von Worteinbettungen und Sprachmodellen liegt, um die Erforschung semantischer Beziehungen zwischen Wörtern und die Interpretation des Verhaltens von Sprachmodellen zu unterstützen. Im Kontext von Explainable AI liegt der Schwerpunkt auf der Verwendung von Visualisierungen zur Erklärung von Modellvorhersagen und der Bedeutung von Merkmalen, wodurch die Interpretierbarkeit von KI-Modellen verbessert wird. Durch die Nutzung des verschachtelten Modells der Visualisierung und die Fokussierung auf NLP und erklärbare KI zielt der Vortrag darauf ab, die Teilnehmer mit den wesentlichen Fähigkeiten auszustatten, um fortschrittliche Datenvisualisierungen zu entwerfen und zu validieren, die auf diese spezifischen Anwendungen zugeschnitten sind. So können sie letztendlich komplexe Datenmuster effektiv kommunizieren und tiefere Einsichten aus ihren Daten gewinnen.

    • 60101901 Vorlesung
      Fortgeschrittene Biometrische Methoden (Frank Konietschke)
      Zeit: Mi 14:00-16:00 (Erster Termin: 17.04.2024)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)

      Kommentar

      Siehe englische Beschreibung.

    • 60102701 Vorlesung
      Complex Data Analysis in Physiology (Dorothee Günzel, Mathias Steinach)
      Zeit: -
      Ort: keine Angabe

      Kommentar

      Gemeinsame Veranstaltung des Instituts für Klinische Physiologie und des Instituts für Physiologie der Charité.

      Theoretische und praktische Aspekte der Daten-Akquise, real-time Daten-Verarbeitung und automatisierte Mustererkennung in der Biomedizin. Es werden vertieft Themen aus folgenden Gebieten behandelt:

      • Datenerfassung und Prozessierung von Bilddateien in Forschung und Klinik (z. B. Live Cell Imaging, Super-Resolution-Mikroskopie, bildgebende Verfahren in der Medizin)
      • Elektrophysiologische Verfahren (z. B. Impedanzspektroskopie, Microarrays, EEG, EKG)
      • Verfahren und Anwendung automatisierter Mustererkennung (z. B. automatisierte Tumorerkennung, real-time Analyse biologischer Signale im Brain-Computer Interface oder in Retinaimplantaten, Vorhersage von individuellen Arrhythmierisiken)

      Der Kurs ist zeitlich geteilt: die ersten sieben Termine im Semester finden am Institut für Physiologie statt, die zweiten sieben Termine am Instituts für Klinische Physiologie.

      Weitere Informationen zur Veranstaltung: http://klinphys.charite.de/bioinfo/ oder bei Dorothee Günzel

    • 19336902 Übung
      Ü: Advanced Data Visualization for Artificial Intelligence (Georges Hattab)
      Zeit: Mi 14:00-16:00 (Erster Termin: 17.04.2024)
      Ort: T9/049 Seminarraum (Takustr. 9)
    • 60101902 Übung
      Übung zu Fortgeschrittene Biometrische Methoden (Frank Konietschke)
      Zeit: Mi 16:00-18:00 (Erster Termin: 17.04.2024)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)
    • 60102702 Übung
      Übung zu Complex Data Analysis in Physiology (Dorothee Günzel, Mathias Steinach)
      Zeit: -
      Ort: keine Angabe
  • Aktuelle Forschungsthemen der Data Science in Life Sciences

    0590bB1.5
    • 60102701 Vorlesung
      Complex Data Analysis in Physiology (Dorothee Günzel, Mathias Steinach)
      Zeit: -
      Ort: keine Angabe

      Kommentar

      Gemeinsame Veranstaltung des Instituts für Klinische Physiologie und des Instituts für Physiologie der Charité.

      Theoretische und praktische Aspekte der Daten-Akquise, real-time Daten-Verarbeitung und automatisierte Mustererkennung in der Biomedizin. Es werden vertieft Themen aus folgenden Gebieten behandelt:

      • Datenerfassung und Prozessierung von Bilddateien in Forschung und Klinik (z. B. Live Cell Imaging, Super-Resolution-Mikroskopie, bildgebende Verfahren in der Medizin)
      • Elektrophysiologische Verfahren (z. B. Impedanzspektroskopie, Microarrays, EEG, EKG)
      • Verfahren und Anwendung automatisierter Mustererkennung (z. B. automatisierte Tumorerkennung, real-time Analyse biologischer Signale im Brain-Computer Interface oder in Retinaimplantaten, Vorhersage von individuellen Arrhythmierisiken)

      Der Kurs ist zeitlich geteilt: die ersten sieben Termine im Semester finden am Institut für Physiologie statt, die zweiten sieben Termine am Instituts für Klinische Physiologie.

      Weitere Informationen zur Veranstaltung: http://klinphys.charite.de/bioinfo/ oder bei Dorothee Günzel

    • 60102702 Übung
      Übung zu Complex Data Analysis in Physiology (Dorothee Günzel, Mathias Steinach)
      Zeit: -
      Ort: keine Angabe
  • Masterseminar Data Science in Life Sciences

    0590bB1.6
    • 19333611 Seminar
      Seminar Deep Learning for biomedical applications (Vitaly Belik)
      Zeit: Mo 16:00-18:00 (Erster Termin: 15.04.2024)
      Ort: T9/046 Seminarraum (Takustr. 9)

      Kommentar

      Recent developments in the area of machine learning due to availability of data and computational power promise to revolutionize almost every area of science. The driving technology behind this advancement is deep learning – a machine learning technology based on artificial neural networks consisting of many layers. Deep learning is capable of processing huge amount of data of different nature and already outperforming humans in many decision-making tasks. Biomedical research became now a source of large heterogeneous data, i.e. images, video, activity sensors, omics and text data. Leveraging the opportunities of this deep learning technology in the biomedical field requires particular set of skills combining thorough knowledge of necessary algorithms, specifics of biomedical data and designated programming tools. In this course we aim to offer students with background in computer science an opportunity to acquire the above skills to be able to deploy deep learning technology with a focus on biomedical applications. The course is structured as a seminar, where students under extensive guidance of instructors read fundamental books and recent research articles on deep learning, learn necessary programming tools, and produce their own implementations of computational pipelines in case studies using already published or original data. Starting from fundamental aspects of deep learning we aim to cover its applications to e.g. image data, time series data, text data, complex networks.

      Literaturhinweise

      [1] Andresen N, Wöllhaf M, Hohlbaum K, Lewejohann L, Hellwich O, Thöne- Reineke C, Belik V, Towards a fully automated surveillance of well-being status in laboratory mice using deep learning: Starting with facial expres- sion analysis. Plos One, 15(4):e0228059, (2020) https://doi.org/10.1371/ journal.pone.0228059

      [2] Jarynowski A, Semenov A, Kamiński M, Belik V. Mild Adverse Events of Sputnik V Vaccine in Russia: Social Media Content Analysis of Telegram via Deep Learning. J Med Internet Res 2021;23(11):e30529 https://doi.org//10.2196/30529

    • 19402911 Seminar
      Journal Club Computational Biology (Knut Reinert)
      Zeit: Mo 14:00-16:00 (Erster Termin: 15.04.2024)
      Ort: A7/SR 140 Seminarraum (Hinterhaus) (Arnimallee 7)

      Zusätzl. Angaben / Voraussetzungen

      Zielgruppe:

      Master- und PhD-Student*inn*en

      Kommentar

      Inhalt:

      In diesem Seminar werden aktuelle Forschungsarbeiten der Bioinformatik sowie die Fortschrittsberichte der PhD-Student*inn*en vorgestellt. Master-Student*inn*en stellen entweder einen ihnen zugewiesenen Zeitschriftenartikel oder ihre Masterarbeit vor oder sie berichten über ihr Forschungspraktikum. Credits werden nur für die Präsentation von Artikeln vergeben.

      Anmeldungen bitte über Whiteboard ("Site Browser" aufrufen und nach Journal Club suchen).

      Literaturhinweise

      aktuelle Publikationen aus der Forschung

    • 19405211 Seminar
      Seminar zu Complex Systems in Bioinformatics (Max von Kleist, Martin Vingron, Frederik Laszlo Wieder)
      Zeit: Do 10:00-12:00 (Erster Termin: 18.04.2024)
      Ort: A3/SR 119 (Arnimallee 3-5)
    • 19406411 Seminar
      Journal Club: Public Health Data Science (Max von Kleist)
      Zeit: online, nach Vereinbarung
      Ort: keine Angabe

      Kommentar

      In diesem Seminar werden aktuelle Forschungsarbeiten im Bereich der datengetriebenen public health Forschung, sowie die Fortschrittsberichte der PhD-Student*inn*en und Post-Docs vorgestellt. Master-Student*inn*en stellen entweder einen ihnen zugewiesenen Zeitschriftenartikel oder ihre Masterarbeit vor oder sie berichten über ihr Forschungspraktikum. Credits werden nur für die Präsentation von Artikeln vergeben.

    • 60103311 Seminar Abgesagt
      Spatial Sequencing Analysis (Journal Club) (Christian Conrad)
      Zeit: Fr 10:00-12:00 (Erster Termin: 19.04.2024)
      Ort: A6/SR 009 Seminarraum (Arnimallee 6)

      Kommentar

      See English version

  • Ausgewählte Themen der Data Science in Life Sciences

    0590bB1.7
    • 19405201 Vorlesung
      Complex Systems in Bioinformatics (Max von Kleist, Martin Vingron, Frederik Laszlo Wieder)
      Zeit: Di 12:00-14:00 (Erster Termin: 16.04.2024)
      Ort: A3/SR 120 (Arnimallee 3-5)

      Kommentar

      Die Studierenden haben ein vertieftes Verständnis grundlegender mathematischer und algorithmischer Konzepte im Bereich der Modellierung, Simulation und Analyse von komplexen biologischen Systeme vor dem Hintergrund aktueller Forschungsrichtungen der Systembiologie und Biotechnologie. Sie sind in der Lage, eine gegebene biologische oder medizinische Fragestellung zu analysieren, einen geeigneten Modellierungsansatz auszuwählen, eigenständig eine Problemlösung zu entwickeln sowie die Ergebnisse zu beurteilen und zu kommunizieren.

      Inhalte:

      Es werden vertieft Themen aus folgenden Gebieten behandelt:

      - Netzwerkstrukturanalyse

      - Graphische Modellierung

      - Modellierung biochemischer Netzwerke mit gewöhnlichen Differentialgleichungen

      - Diskrete Modellierung regulatorischer Netzwerke

      - Constraint-basierte Modellierung

      - Stochastische und hybride Modellierung

      Literaturhinweise

      wird in der Veranstaltung bekanntgegeben.

    • 19405202 Übung
      Übung zu Complex Systems in Bioinformatics (Max von Kleist, Martin Vingron, Frederik Laszlo Wieder)
      Zeit: Di 14:00-16:00 (Erster Termin: 16.04.2024)
      Ort: A3/SR 120 (Arnimallee 3-5)
  • Spezielle Aspekte der Data Science Technologies

    0590bB2.3
    • 19216201 Vorlesung
      Markov chains and markov models (Feliks Nüske)
      Zeit: Mi 10:00-12:00 (Erster Termin: 17.04.2024)
      Ort: A3/SR 119 (Arnimallee 3-5)

      Zusätzl. Angaben / Voraussetzungen

      Master students of Mathematics and Physics

      Kommentar

      Markov chains are widely used to model stochastic behaviour across the sciences. In this course, we will focus on their application to model dynamical phenomena in the natural and engineering sciences. In the first half of the course, we will study the stationary and spectral properties of discrete Markov chains and how they can be used to analyse the long-time behaviour of the chain. In the second half, we will learn how to construct continuous Markov chains to sample complex probability distributions, and how to construct suitable discrete models for their approximation.

      Discrete Markov Chains
      - introduction and basic properties
      - stationary vectors and return times
      - spectral decomposition, reversible chains
      - Perron cluster analysis
      - committors and transition path theory

      Modeling with Markov Chains
      - Markov chains on continuous space
      - sampling and Markov chain Monte Carlo
      - Markov state models (MSMs)
      - MSM estimation based on maximum likelihood
      - error analysis

    • 19238501 Vorlesung
      Kernel Methods and Applications (Feliks Nüske)
      Zeit: Do 10:00-12:00 (Erster Termin: 18.04.2024)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)

      Zusätzl. Angaben / Voraussetzungen

      Zielgruppe: Studierende der Masterprogramme Mathematik, Informatik und Computational Sciences.


        

      Kommentar

      Siehe englische Sprachversion

    • 19216202 Übung
      Übung zu Markov chains and markov models (Feliks Nüske)
      Zeit: Mi 14:00-16:00 (Erster Termin: 17.04.2024)
      Ort: A3/ 024 Seminarraum (Arnimallee 3-5)

      Kommentar

      Markov chains are a universal tool to model real-world processes, including financial markets, reaction kinetics and molecular dynamics.

      Topics:

      • Introduction to the theory of Markov chains
      • Estimation of Markov chains from data
      • Estimation uncertainty
      • Transition path theory
      • Analysis of Markov chains
      • Spectral analysis
      • Discretization of continuous Markov processes

    • 19238502 Übung
      Übung zu Kernel Methods and Applications (Feliks Nüske)
      Zeit: Do 12:00-14:00 (Erster Termin: 18.04.2024)
      Ort: 1.4.03 Seminarraum T2 (Arnimallee 14)
  • Aktuelle Forschungsthemen der Data Science Technologies

    0590bB2.4
    • 19216201 Vorlesung
      Markov chains and markov models (Feliks Nüske)
      Zeit: Mi 10:00-12:00 (Erster Termin: 17.04.2024)
      Ort: A3/SR 119 (Arnimallee 3-5)

      Zusätzl. Angaben / Voraussetzungen

      Master students of Mathematics and Physics

      Kommentar

      Markov chains are widely used to model stochastic behaviour across the sciences. In this course, we will focus on their application to model dynamical phenomena in the natural and engineering sciences. In the first half of the course, we will study the stationary and spectral properties of discrete Markov chains and how they can be used to analyse the long-time behaviour of the chain. In the second half, we will learn how to construct continuous Markov chains to sample complex probability distributions, and how to construct suitable discrete models for their approximation.

      Discrete Markov Chains
      - introduction and basic properties
      - stationary vectors and return times
      - spectral decomposition, reversible chains
      - Perron cluster analysis
      - committors and transition path theory

      Modeling with Markov Chains
      - Markov chains on continuous space
      - sampling and Markov chain Monte Carlo
      - Markov state models (MSMs)
      - MSM estimation based on maximum likelihood
      - error analysis

    • 19238501 Vorlesung
      Kernel Methods and Applications (Feliks Nüske)
      Zeit: Do 10:00-12:00 (Erster Termin: 18.04.2024)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)

      Zusätzl. Angaben / Voraussetzungen

      Zielgruppe: Studierende der Masterprogramme Mathematik, Informatik und Computational Sciences.


        

      Kommentar

      Siehe englische Sprachversion

    • 19216202 Übung
      Übung zu Markov chains and markov models (Feliks Nüske)
      Zeit: Mi 14:00-16:00 (Erster Termin: 17.04.2024)
      Ort: A3/ 024 Seminarraum (Arnimallee 3-5)

      Kommentar

      Markov chains are a universal tool to model real-world processes, including financial markets, reaction kinetics and molecular dynamics.

      Topics:

      • Introduction to the theory of Markov chains
      • Estimation of Markov chains from data
      • Estimation uncertainty
      • Transition path theory
      • Analysis of Markov chains
      • Spectral analysis
      • Discretization of continuous Markov processes

    • 19238502 Übung
      Übung zu Kernel Methods and Applications (Feliks Nüske)
      Zeit: Do 12:00-14:00 (Erster Termin: 18.04.2024)
      Ort: 1.4.03 Seminarraum T2 (Arnimallee 14)
  • Masterseminar in Data Science Technologies

    0590bB2.7
    • 19303811 Seminar
      Projektseminar: Datenverwaltung (Muhammed-Ugur Karagülle)
      Zeit: Do 12:00-14:00 (Erster Termin: 18.04.2024)
      Ort: T9/051 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Voraussetzungen

      • ALP I
      • ALP II
      • Datenbanksysteme

      Kommentar

      Inhalt

      Ein Projektseminar dient als Vorbereitung für eine Bachelor- oder Masterarbeit in der AGDB. Im Rahmen des Projektseminars beschäftigen wir uns mit der Analyse und Visualisierung medizinischer Daten. Studierende lernen in einem iterativen Verfahren das Verfassen von wissenschaftlichen Dokumenten. Zusätzlich werden wir ein kleines praktisches Projekt realisieren.

      Literaturhinweise

      Wird bekannt gegeben.

    • 19328217 Seminar/Proseminar
      Seminar/Proseminar: New Trends in Information Systems (Muhammed-Ugur Karagülle)
      Zeit: Mi 10:00-12:00 (Erster Termin: 17.04.2024)
      Ort: A7/SR 031 (Arnimallee 7)

      Kommentar

      Ziel dieses Seminars ist es, aktuelle Trends im Datenmanagement zu untersuchen. Wir werden uns unter anderem mit zwei aufstrebenden Themen beschäftigen: Location Based Services (LBS) und Event-Based Services (EBS).

      Event-Based Systems (EBS) sind Teil vieler aktueller Anwendungen wie Überwachung von Geschäftsaktivitäten, Börsenticker, Facility Management, Datenstreaming oder Sicherheit. In den vergangenen Jahren hat das Thema sowohl in der Industrie als auch in der Wissenschaft zunehmend an Bedeutung gewonnen. Aktuelle Forschungsschwerpunkte konzentrieren sich auf verschiedene Aspekte, die von Ereigniserfassung (eingehende Daten) bis zur Auslösung von Reaktionen reichen. Dieses Seminar zielt darauf ab, einige der aktuellen Trends in Event-basierten Systemen mit einem starken Fokus auf Modelle und Design zu studieren. Ortsbasierte Dienste sind heutzutage oft Teil des täglichen Lebens durch Anwendungen wie Navigationsassistenten im öffentlichen oder privaten Transportbereich. Die zugrundeliegende Technologie befasst sich mit vielen verschiedenen Aspekten, z. B. Standortbestimmung, Informationsabruf oder Datenschutz. In jüngerer Zeit wurden Aspekte wie der Benutzerkontext und Präferenzen berücksichtigt, um den Benutzern mehr personalisierte Informationen zu senden.

      Ein solider Hintergrund in Datenbanken ist erforderlich, typischerweise ein Datenbankkurs auf Bachelor-Niveau.

      Literaturhinweise

      Wird bekannt gegeben.

    • 19336717 Seminar/Proseminar
      Von Krankenakten zu Proteinen: Datenbanken für biomedizinische Daten und ihre Bedeutung für die Forschung (Katharina Baum)
      Zeit: Fr 10:00-12:00, zusätzliche Termine siehe LV-Details (Erster Termin: 12.04.2024)
      Ort: T9/SR 006 Seminarraum (Takustr. 9)

      Kommentar

      In diesem Hauptseminar lernen Sie verschiedenste Datenbanken, ihren Aufbau und ihre programmatische Nutzung kennen. Wichtiger Bestandteil wird zudem die Diskussion der Bedeutung der darin abgelegten Daten und ihre Nutzung anhand aktueller Forschungsarbeiten.

      Beispiele für mögliche behandelte Datenbanken sind

      • MIMIC (elektronische Krankenakten),
      • STRING (Protein-Protein Interaktion),
      • Drugbank (Medikamente),
      • PRIDE (Proteinmessungen),
      • GEO (für genomische Daten), etc.

      Jede Datenbank soll am Ende des Vortrags im Kurs von allen Teilnehmenden vor Ort für die Beantwortung einer Frage benutzt werden (das Setup bereitet jeweils die vortragende Person vor) - bringen Sie also Ihren Laptop mit!

      Bachelorstudierende können an diesem Seminar teilnehmen, aber Inhalte sind sehr fortgeschritten und stammen weitestgehend aus aktueller Forschung. Grundlegende Literatur ist auf Englisch, daher sind gute Englischkenntnise erforderlich.

      Wir werden uns am Fr, 12.4.2024 um 10:15 Uhr (in einem hybriden Setting, bitte für Raum & Zugang die Ankündigung im Whiteboard beachten) zur Vorbesprechung und Themenvergabe treffen. Bitte kontaktieren Sie uns vorab (katharina.baum@fu-berlin.de), sollten Sie am Seminar teilnehmen wollen und diesen Termin nicht wahrnehmen können.

  • Softwareprojekt Data Science B

    0590bB2.8
    • 19308312 Projektseminar
      Softwareprojekt: Anwendungen von Algorithmen (Mahmoud Elashmawi)
      Zeit: Di 14:00-16:00 (Erster Termin: 16.04.2024)
      Ort: T9/SR 006 Seminarraum (Takustr. 9)

      Kommentar

      Inhalt

      Ein typisches Anwendungsgebiet von Algorithmen wird ausgewählt und softwaretechnisch behandelt. In diesem Semester soll es um Algorithmen zum Graphenzeichnen gehen. Das Ziel ist es, Programme zur Herstellung guter Zeichnungen zu schreiben und damit an dem Zeichenwettbewerb teilzunehmen, der im September im Zusammenhang mit der internationalen Konferenz über Graph Drawing and Network Visualization stattfindet.

      Voraussetzungen

      Grundkenntnisse in Entwurf und Analyse von Algorithmen

      Literaturhinweise

      je nach Anwendungsgebiet

    • 19315312 Projektseminar
      Softwareprojekt: Verteilte Systeme (Justus Purat)
      Zeit: Di 12:00-14:00 (Erster Termin: 16.04.2024)
      Ort: T9/046 Seminarraum (Takustr. 9)

      Kommentar

      Das Softwareprojekt: Verteilte Systeme behandelt Themen aus verschiedenen Projekten der AG Zuverlässige Systeme. Dabei ist eine Aufgabenstellung selbstständig durch Entwurf, Implementierung und Testen zu bearbeiten.

      Das Softwareprojekt ist verschiedenen Modulen zugeordnet. Bitte informieren Sie sich vorher, ob sie die Veranstaltung in einem Modul aus ihrem Studiengang belegen können.

      Themen in diesem Semester sind:
      - (Weiter-)Entwicklung einer Anwendung in Kooperation mit der Charité Berlin
      - Intelligente Clustersteuerung
      - SmartContract - Entwicklung
      - Tangle - Technologien als Alternative zur Blockchain für IoT

      Details werden in der ersten Sitzung besprochen.
      Das Softwareprojekt: Verteilte Systeme wird je nach Bedarf der Studierenden in deutscher oder englischer Sprache durchgeführt.

    • 19333912 Projektseminar
      Softwareprojekt: Lab Machine Learning for Data Science (Grégoire Montavon)
      Zeit: Fr 14:00-16:00 (Erster Termin: 19.04.2024)
      Ort: T9/K 036 Rechnerpoolraum (Takustr. 9)

      Kommentar

      The course will consist of applying machine learning techniques for extracting domain insights from real-world or simulated datasets. It will take the form of multiple lab exercises in Python, where the students will extract data, apply visualization techniques, train machine learning models on this data, use model selection/validation techniques, and finally apply interpretability techniques to extract domain insights from the learned models.

      Recommended prior course: Machine Learning for Data Science

      Format: Oral exam at the end of the semester

       

  • Softwareprojekt Data Science A

    0590bB2.1
    • 19308312 Projektseminar
      Softwareprojekt: Anwendungen von Algorithmen (Mahmoud Elashmawi)
      Zeit: Di 14:00-16:00 (Erster Termin: 16.04.2024)
      Ort: T9/SR 006 Seminarraum (Takustr. 9)

      Kommentar

      Inhalt

      Ein typisches Anwendungsgebiet von Algorithmen wird ausgewählt und softwaretechnisch behandelt. In diesem Semester soll es um Algorithmen zum Graphenzeichnen gehen. Das Ziel ist es, Programme zur Herstellung guter Zeichnungen zu schreiben und damit an dem Zeichenwettbewerb teilzunehmen, der im September im Zusammenhang mit der internationalen Konferenz über Graph Drawing and Network Visualization stattfindet.

      Voraussetzungen

      Grundkenntnisse in Entwurf und Analyse von Algorithmen

      Literaturhinweise

      je nach Anwendungsgebiet

    • 19314012 Projektseminar
      Softwareprojekt: Semantische Technologien (Adrian Paschke)
      Zeit: Mi 14:00-16:00 (Erster Termin: 17.04.2024)
      Ort: T9/055 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Weitere Informationen finden sich auf der Veranstaltungsseite.

      Kommentar

      Im Rahmen des Softwareprojekts werden gemischte Gruppen von Bachelor- und Master-Studenten gebildet, die entweder ein eigenständiges Projekt erstellen oder aber ein Teil eines größeren Projektes im Bereich semantischer Technologien übernehmen. Bei der Umsetzung der Aufgaben werden vertiefte Programmierkenntnisse in der Anwendung semantischer Technologien und künstlicher Intelligenz im Corporate Semantic Web erworben, Projektmanagement und Teamfähigkeit gefördert, sowie Praktiken der guten Software-Entwicklung großer verteilter Systeme und Semantic Web Anwendungen geübt. Das Softwareprojekt kann in Zusammenarbeit mit einem externen Partner aus der Industrie oder Standardisierung durchgeführt werden. Die Fortführung des Projektes als Bachelor- oder Masterarbeit ist möglich und ausdrücklich erwünscht.

    • 19315312 Projektseminar
      Softwareprojekt: Verteilte Systeme (Justus Purat)
      Zeit: Di 12:00-14:00 (Erster Termin: 16.04.2024)
      Ort: T9/046 Seminarraum (Takustr. 9)

      Kommentar

      Das Softwareprojekt: Verteilte Systeme behandelt Themen aus verschiedenen Projekten der AG Zuverlässige Systeme. Dabei ist eine Aufgabenstellung selbstständig durch Entwurf, Implementierung und Testen zu bearbeiten.

      Das Softwareprojekt ist verschiedenen Modulen zugeordnet. Bitte informieren Sie sich vorher, ob sie die Veranstaltung in einem Modul aus ihrem Studiengang belegen können.

      Themen in diesem Semester sind:
      - (Weiter-)Entwicklung einer Anwendung in Kooperation mit der Charité Berlin
      - Intelligente Clustersteuerung
      - SmartContract - Entwicklung
      - Tangle - Technologien als Alternative zur Blockchain für IoT

      Details werden in der ersten Sitzung besprochen.
      Das Softwareprojekt: Verteilte Systeme wird je nach Bedarf der Studierenden in deutscher oder englischer Sprache durchgeführt.

    • 19333912 Projektseminar
      Softwareprojekt: Lab Machine Learning for Data Science (Grégoire Montavon)
      Zeit: Fr 14:00-16:00 (Erster Termin: 19.04.2024)
      Ort: T9/K 036 Rechnerpoolraum (Takustr. 9)

      Kommentar

      The course will consist of applying machine learning techniques for extracting domain insights from real-world or simulated datasets. It will take the form of multiple lab exercises in Python, where the students will extract data, apply visualization techniques, train machine learning models on this data, use model selection/validation techniques, and finally apply interpretability techniques to extract domain insights from the learned models.

      Recommended prior course: Machine Learning for Data Science

      Format: Oral exam at the end of the semester

       

  • Datenbanksysteme Data Science

    0590bB2.9
    • 19301501 Vorlesung
      Datenbanksysteme (Agnès Voisard)
      Zeit: Di 14:00-16:00, Do 14:00-16:00, zusätzliche Termine siehe LV-Details (Erster Termin: 16.04.2024)
      Ort: T9/Gr. Hörsaal (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Zielgruppe

      • Pflichtmodul im Bachelorstudiengang Informatik
      • Pflichtmodul im lehramtsbezogenen Bachelorstudiengang mit Kernfach Informatik und Ziel: Großer Master
      • Studierende im lehramtsbezogenen Masterstudiengang (Großer Master mit Zeitfach Informatik) können dieses Modul zusammen mit dem "Praktikum DBS" absolvieren
      • Wahlpflichtmodul im Nebenfach Informatik

      Voraussetzungen

      • ALP 1 - Funktionale Programmierung
      • ALP 2 - Objektorientierte Programmierung
      • ALP 3 - Datenstrukturen und Datenabstraktion
      • ODER Informatik B

      Kommentar

      Inhalt

      Datenbankentwurf mit ERM/ERDD. Theoretische Grundlagen relationaler Datenbanksysteme: Relationale Algebra, Funktionale Abhängigkeiten, Normalformen. Relationale Datenbankentwicklung: SQL Datendefinition, Fremdschlüssel und andere Integritätsbedingungen. SQL als applikative Sprache: wesentliche Sprachelemente, Einbettung in Programmiersprachen, Anwendungsprogrammierung; objekt-relationale Abbildung. Transaktionsbegriff, transaktionale Garantien, Synchronisation des Mehrbenutzerbetriebs, Fehlertoleranzeigenschaften. Anwendungen und neue Entwicklungen: Data Warehousing, Data Mining, OLAP.

      Projekt: im begleitenden Projekt werden die Themen praktisch vertieft.

      Literaturhinweise

      • Alfons Kemper, Andre Eickler: Datenbanksysteme - Eine Einführung, 5. Auflage, Oldenbourg 2004
      • R. Elmasri, S. Navathe: Grundlagen von Datenbanksystemen, Pearson Studium, 2005

    • 19301502 Übung
      Übung zu Datenbanksysteme (Muhammed-Ugur Karagülle)
      Zeit: Mo 14:00-16:00, Mo 16:00-18:00, Di 08:00-10:00, Di 10:00-12:00, Di 12:00-14:00, Mi 12:00-14:00, Mi 14:00-16:00, Do 08:00-10:00, Do 10:00-12:00, Do 12:00-14:00, Fr 14:00-16:00, Fr 16:00-18:00 (Erster Termin: 17.04.2024)
      Ort: T9/055 Seminarraum (Takustr. 9)
    • Introduction to Profile Areas 0590bA1.1
    • Statistics for Data Science 0590bA1.2
    • Machine Learning for Data Science 0590bA1.3
    • Programming for Data Science 0590bA1.4
    • Mustererkennung 0089cA1.12
    • Netzbasierte Informationssysteme 0089cA1.13
    • Rechnersicherheit 0089cA1.16
    • Verteilte Systeme 0089cA1.20
    • Spezielle Aspekte der Datenverwaltung 0089cA1.29
    • Höhere Algorithmik 0089cA2.1
    • Telematik 0089cA3.5
    • Big Data Analysis in Bioinformatics 0262cD1.8
    • Forschungspraxis 0590bB1.2
    • Interdisziplinäre Zugänge im Rahmen von Data Science A 0590bB1.27
    • Interdisziplinäre Zugänge im Rahmen von Data Science B 0590bB1.28
    • Ausgewählte Themen der Data Science Technologies A 0590bB2.5
    • Ausgewählte Themen der Data Science Technologies B 0590bB2.6
    • Begleitendes Kolloquium 0590bE1.2