seminar on modern software engineering and database
play

Seminar on Modern Software Engineering and Database Concepts Gunter - PowerPoint PPT Presentation

Databases D B and Software S E Engineering Seminar on Modern Software Engineering and Database Concepts Gunter Saake, David Broneske, Gabriel Campero Durand, Bala Gurumurthy, Jacob Kr uger, Sabine Wehnert, Roman Zoun Arbeitsgruppe


  1. Databases D B and Software S E Engineering Seminar on Modern Software Engineering and Database Concepts Gunter Saake, David Broneske, Gabriel Campero Durand, Bala Gurumurthy, Jacob Kr¨ uger, Sabine Wehnert, Roman Zoun Arbeitsgruppe Datenbanken und Software Engineering 04. April 2019

  2. Databases D B and Software S E Engineering Organisatorisches – Einordnung Pro-Seminar , Bachelor, 3 CP Delivieries: • 20 Min. Vortrag • Bewertung von 2 anderen Vortr¨ age Wissenschaftliches Seminar , Bachelor, 3CP Delivieries: • 20 Min. Vortrag • 5-8 Seiten Ausarbeitung • Bewertung einer anderen Ausarbeitung Saake et al. Seminar on Modern Software Engineering and Database Concepts 2

  3. Databases D B and Software S E Engineering Organisatorisches – Durchf¨ uhrung • Einf¨ uhrungstermin (heute) • Treffen mit Betreuer aus der Arbeitsgruppe (je nach Thema) • Vorlesungen zu wissenschaftlichem Schreiben und Pr¨ asentationen an Einzelterminen • Vortr¨ age als Blockseminar (Termin wird am Ende festgelegt) • Folien werden eine Woche vor Vortrag eingereicht (Feedback) • Wissenschaftliche Ausarbeitung (nur Wiss. Sem.) muss 2 Wochen vor dem Vortrag abgegeben werden Saake et al. Seminar on Modern Software Engineering and Database Concepts 3

  4. Databases D B and Software S E Engineering Was machen wir? • Wichtige ”Soft Skills“ (Schl¨ usselkompetenzen) erlernen • Vortragsweise und -stil ¨ uben • ”Konferenzflair“ erleben • Ein wissenschaftliches Papier schreiben • Arbeit mit entsprechenden Vorlagen (Empfehlung: L A T EX) • Einarbeitung in ein neues spannendes Thema • Themen kommen aus aktueller Forschung → M¨ ogliches Thema f¨ ur Bachelor-Arbeit / Team-Projekt Saake et al. Seminar on Modern Software Engineering and Database Concepts 4

  5. Databases D B and Software S E Engineering Vortrag • 20 Minuten Vortrag • 5-10 Minuten Diskussion/Fragen • ¨ Uberziehen: Redner wird abgew¨ urgt • Zu Fr¨ uh: Mehr Fragen (ggf. mehr Kritik) • Rechner wird gestellt, vor Veranstaltung testen! Saake et al. Seminar on Modern Software Engineering and Database Concepts 5

  6. Databases D B and Software S E Engineering Vortrag: Bewertung D B S E Evaluationsbogen Vortrag Arbeitsgruppe Datenbanken und Software Engineering Titel des Vortrags: Sehr Gut . . . Neutral . . . Schlecht Pr¨ asentation Wertung: 1 2 3 4 5 6 7 Auftreten, z.B. • Ausstrahlung, Dynamik ahigkeit, ¨ • Motivationsf¨ Uberzeugungskraft Sprache und Stimme, z.B. • Lautst¨ arke, Modulation, Klarheit • Sprechgeschwindigkeit, -fl¨ ussigkeit Mimik und Gestik, z.B. • K¨ orperhaltung, Bewegungen • Ausdruck, Blickrichtung Fachlicher Eindruck, z.B. • Kompetenz, Seriosit¨ at • Verbindlichkeit Wertung: 1 2 3 4 5 6 7 Folien Design, z.B. • Farben, Schriften, Formatierungen Saake et al. Seminar on Modern Software Engineering and Database Concepts 6 • Klarheit, ¨ Ubersichtlichkeit

  7. Databases D B and Software S E Engineering Wissenschaftliches Papier Saake et al. Seminar on Modern Software Engineering and Database Concepts 7

  8. Databases D B and Software S E Engineering Warum ein Papier schreiben? Bekanntgeben von neuen Errungenschaften/Erfahrungen • Publizieren ist das Ergebnis wissenschaftlicher Arbeit • Forschung ist nie beendet, solange sie nicht publiziert wurde Andere (z.B. Community) ¨ uber die eigene Arbeit informieren • Anerkennung/Beachtung • Kontakte, wertvolle Zusammen-/Mitarbeit • Feedback F¨ ur euch: → ¨ Uben f¨ ur die Bachelor-Arbeit Saake et al. Seminar on Modern Software Engineering and Database Concepts 8

  9. Databases D B and Software S E Engineering Paper: Bewertung D B S E Evaluationsbogen wissenschaftliche Ausarbeitung Arbeitsgruppe Datenbanken und Software Engineering Titel der Ausarbeitung: Autor: Gutachter: Sehr Gut . . . Neutral . . . Schlecht Titel, Abstract, Einleitung Wertung: 1 2 3 4 5 6 7 Diskussionspunkte (z.B.): • Geeigneter Titel • Qualit¨ at der Zusammenfassung • Hinreichende Motivation • Klare Problemstellung Struktur Wertung: 1 2 3 4 5 6 7 Diskussionspunkte (z.B.): • Roter Faden Saake et al. Seminar on Modern Software Engineering and Database Concepts 9

  10. Databases D B and Software S E Engineering Themenvorstellung Saake et al. Seminar on Modern Software Engineering and Database Concepts 10

  11. Databases D B and Software S E Engineering CPU “smaller than”-selection GPU “smaller than”-selection i n t pos = 0; i n t t i d = t h r e a d I d x . x + b l o c k I d x . x ∗ blockDim . x ; f o r ( i n t i =0; i < a r r a y s i z e ; ++i ) { w h i l e ( tid < a r r a y s i z e ) { i f ( a r r a y [ i ] < comp val ) bitmask [ t i d ] = ( a r r a y [ t i d ] < comparison value ) ; r e s u l t [ pos++]=i ; t i d += blockDim . x ∗ gridDim . x ; } } Code Optimizations (Broneske) 1. B. Raducanu, P. Boncz, M. Zukowski. 2013. Micro Adaptivity in Vectorwise. SIGMOD 2. K. Datta, M. Murphy, V. Volkov, et al. 2008. Stencil Computation Optimization and Auto-tuning on State-of-the-Art Multicore Architectures. SC Saake et al. Seminar on Modern Software Engineering and Database Concepts 11

  12. Databases D B and Software S E Engineering Multi-Dimensional Index Structures for Main Memory (Broneske) Hauptspeicherdatenbanken sind ein heißes Forschungsthema. Aktuell stehen beschleunigte Scans im Fokus, wobei adaptierte, klassische Indexstrukturen jedoch nicht außer Acht gelassen werden sollten. Die Frage ist: Welche klassischen Indexstrukturen machen f¨ ur den Hauptspeicherbereich Sinn? Welche Adaptionen sind f¨ ur klassische Indexstrukturen in Hauptspeicherdatenbanken sinnvoll? 1. Volker Gaede und Oliver G¨ unther. 1998. Multidimensional access methods. ACM Computing Surveys 2. Kim, Changkyu, et al. 2010. FAST: Fast architecture sensitive tree search on modern CPUs and GPUs. SIGMOD Saake et al. Seminar on Modern Software Engineering and Database Concepts 12

  13. Databases D B and Software S E Engineering Machine Learning on Graph-Databases (Campero) Graph databases are a special kind of general data management system optimized for network-oriented analytical queries and storage. They are mainly developed to support a specific representation of a graph, namely property graphs. However, recent trends require further features from these databases, either to support novel data representations (embeddings) or highly efficient feature engineering processes. In this seminar topic we aim to study some of these trends, by considering one of two applications: machine learning on networks, or graph-based recommenders. For the chosen domain we describe carefully the domain, we take a detailed look at a given example study, and we outline the implications for system development. 1. Eksombatchai, Chantat, Pranav Jindal, Jerry Zitao Liu, Yuchen Liu, Rahul Sharma, Charles Sugnet, Mark Ulrich, and Jure Leskovec. 2018. Pixie: A system for recommending 3+ billion items to 200+ million users in real-time. WWW 2. Cao, Yixin, Xiang Wang, Xiangnan He, and Tat-Seng Chua. 2019. Unifying Knowledge Graph Learning and Recommendation: Towards a Better Understanding of User Preferences. 3. Hodler, Amy E., and Needham, Mark. 2019. Graph Algorithms. 4. Mutlu, Ece C., and Toktam A. Oghaz. 2019. Review on Graph Feature Learning and Feature Extraction Techniques for Link Prediction. Saake et al. Seminar on Modern Software Engineering and Database Concepts 13

  14. Databases D B and Software S E Engineering Learning to Hash (Campero) High-dimensional data (e.g. images or latent representations) is increasingly becoming important for advanced analytical use cases in the industry. However, working efficiently with such data requires clever hashing schemes that could accelerate similarity searches, through improvements in data organization. In this seminar topic we aim to create a taxonomy of hashing approaches for similarity search. We also propose to consider closely two approaches (one simple and one using supervised-learning). As a bonus, we seek to report on libraries and repositories available, helping in the adoption of these useful techniques for everyday data management. 1. Pagh R. 2018. Similarity Sketching. Encyclopedia of Big Data Technologies. 2. Wang, Jun, Wei Liu, Sanjiv Kumar, and Shih-Fu Chang. 2016. Learning to hash for indexing big data?A survey. Proceedings of the IEEE. Saake et al. Seminar on Modern Software Engineering and Database Concepts 14

Recommend


More recommend