Automatic Audio Segmentation: Segment Boundary and Structure - PowerPoint PPT Presentation

Outline Introduction Algorithm Evaluation Discussion Automatic Audio Segmentation: Segment Boundary and Structure Detection in Popular Music Ewald Peiszer Thomas Lidy Andreas Rauber Institute of Software Technology & Interactive Systems Workshop on Learning Semantics of Audio Signals, 2008 Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Introduction 1 Algorithm 2 Evaluation 3 Evaluation Setup Results Discussion 4 Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Automatic Audio Segmentation Tasks Segment boundaries Musical form / structure ( ABCDBCDBDA ) Chorus detection ( CD =chorus) Audio thumbnailing / summarization ( ABCD ) Semantic labelling (Intro - verse - prechorus - chorus - verse - prechorus - chorus - verse - chorus/bridge - outro) Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Motivation Browsing of music collections New features for playback devices Aid subsequent processing steps Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Contributions Algorithm for boundary and structure detection Evaluation using 109 song corpus Flexible XML ground truth file format Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Boundary Detection 22,050 Hz audio, beat detection, beat syncronized frames Feature extraction Self similarity matrix Novelty score [Foote] Low pass filter Local maxima → segment boundaries Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Structure Detection K-means Agglomerative hierarchical clustering “Voting” Dynamic Time Warping Cluster validity index (Dunn, Davies-Bouldin) Minimal user input: number of desired segment types Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Evaluation Setup Results Ground Truth Main problem Ambiguity! XML ground truth file SegmXML Alternative names Subsegments (two level hierarchical segmenation) Semantics → ground truth variants Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Evaluation Setup Results Corpus 94 + 15 = 109 songs A-HA, ABBA, ABBA, Alanis Morissette, Artful Dodger feat. Craig David , Beastie Boys , Beatles , Genres: rock, rop, dance, Bj¨ ork, Black Eyed Peas , Britney Spears , Chicago, Chumbawamba , Coolio , Cranberries , Creedence R&B, rap Clearwater Revival - , Depeche Mode , Desmond Dekkert , Deus , Dire Straits , Eminem ft. Dido , 60 from [LS07] a , 47 from Faith No More , Gloria Gayner , KC and the Sunshine Band t , KoRn , Lucy Pearl , Madonna , Marilyn Manson, Michael Jackson Nick Drake , [PK06] b , 14 as qmul14 , Nirvana , Nora Jones , Oasis , Pet Shop Boys , Portishead , Prince , Queen Yahna , R.E.M. , R Kelly 10 from RWC-Pop , Radiohead , Red Hot Chili Peppers , Salt N Pepa , Saxon , Scooter, Seal , Shania Twain , Simply Red , Realistic but music not Sinhead O Connor , Spice Girls , Suede , . . . free to get and use � a M. Levy and M. Sandler. Structural segmentation of musical audio by constrained clustering. IEEE Transactions on Audio, Speech and Language Processing, 16(1)318–326, 2007. b J. Paulus and A. Klapuri. Music structure analysis by finding repeated parts. In Proc AMCMM, pages 59–68, Santa Barbara, California, USA, 2006. ACM Press New York. Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Evaluation Setup Results Performance Measures Boundary Detection P = |B algo ∩ w B gt | (1) |B algo | R = |B algo ∩ w B gt | (2) |B gt | F = 2 PR (3) P + R Structure Detection r f = 1 − ed ′ s / t s (4) Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Evaluation Setup Results Boundary Detection: F = 0 . 66 ± 0 . 034 [LSC06] M. Levy, M. Sandler, and M. Casey. Extraction of high–level musical structure from audio data and its application to thumbnail generation. In Proc. ICASSP, Toulouse, France, 2006. [LS06] M. Levy and M. Sandler. New methods in structural segmentation of musical audio. In Proc. EUSIPCO, Florence, Italy, 2006. Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Evaluation Setup Results Structure Detection: r f = 0 . 707 ± 0 . 025 Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Discussion No restricting domain knowledge F = r f = 1 ? Unrealistic! E.g., Michael Jackson: Black or White. r gt = 0 . 76 f Robust against improvement attempts Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Future Work Higher level features Select parameter values song-by-song User input Common corpus, groundtruth MIREX task? Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Summary Algorithm for boundary and structure detection Large corpus, SegmXML annotations Source code Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Thank you Annotation files, source code available from http://www.ifs.tuwien.ac.at/mir/audiosegmentation/ Q&A Peiszer, Lidy, Rauber Automatic Audio Segmentation

Outline Introduction Algorithm Evaluation Discussion Erratum: article, page 10 Peiszer, Lidy, Rauber Automatic Audio Segmentation

Automatic Audio Segmentation: Segment Boundary and Structure - PowerPoint PPT Presentation

Outline Introduction Algorithm Evaluation Discussion Automatic Audio Segmentation: Segment Boundary and Structure Detection in Popular Music Ewald Peiszer Thomas Lidy Andreas Rauber Institute of Software Technology & Interactive

Segmentation Bottom-up Segmentation Semantic / instance segmentation Many Slides from L.

VIDEO SIGNALS Segmentation WHAT IS SEGMENTATION WHAT IS SEGMENTATION Segmentation is a

Semantic Segmentation / Instance Segmentation Based on Deep learning Yiding Liu 2018.12.08

Audio Device Client Better and Faster Audio I/O on Web Hongchan Choi Google Chrome Web Audio

Segmentation using Segmentation using Bayesian Decision Theory Bayesian Decision Theory

Segmentation Segmentation Segmentation Define the accurate boundaries of all objects in an image

Cirrus Audio Solutions Cirrus Audio Solutions Home Audio Portable Audio Personal CD Player

Boundary Line Discussion February 2018 Agenda District vision Why boundary line

Boundary value problems What problems does boundary value testing have? ECT2 Boundary

Automatic Verification of Automatic Verification of Automatic Verification of Automatic

EBLL Response in HCV Units Segment 1: The Basics EBLL Response in in HCV Units Segment 1:

PCEP Extensions for Service Segment Support in Segment Routing

Audio- -Visual Automatic Speech Recognition: Visual Automatic Speech Recognition: Audio Theory,

Automatic Classification of Automatic Classification of Audio Data Audio Data Carlos H. C.

Pixel-Level Im Image Understanding wit ith Semantic Segmentation and Panoptic Segmentation

Lecture 8: Image Segmentation Peng Chao Face++ Researcher pengchao@megvii.com Nov. 2017

Javascript: Functions ATLS 3020 - Digital Media 2 Week 4 - Day 2 Quiz #1 next Monday Structure:

Meet the Parents Primary 1 Briefing Session 24 Jan 2015 PERI Holistic Assessment English

Scheduling Response to Intervention Support Structures in High School Michael D. Rettig

Critical Peaks Redefined Nao Hirokawa Julian Nagele Vincent van Oostrom Michio Oyamaguchi IFIP

In Intr troduc ductory Mus usic ic Shuffle Along by Eubie Blake and Noble Sissle Two

Harmonic Interaction in Stitt & Rollinss The Eternal Triangle Michael McClimon SMT

Chapter 14 Temporal Planning Dana S. Nau University of Maryland 3:11 PM April 18, 2012 Dana

Diagnosis (06) Diagnosis by Chronicles Alban Grastien alban.grastien@rsise.anu.edu.au Systems

Sambuz

Useful Links

Newsletter

Mail Us

Automatic Audio Segmentation: Segment Boundary and Structure - PowerPoint PPT Presentation

Outline Introduction Algorithm Evaluation Discussion Automatic Audio Segmentation: Segment Boundary and Structure Detection in Popular Music Ewald Peiszer Thomas Lidy Andreas Rauber Institute of Software Technology & Interactive

Segmentation Bottom-up Segmentation Semantic / instance segmentation Many Slides from L.

VIDEO SIGNALS Segmentation WHAT IS SEGMENTATION WHAT IS SEGMENTATION Segmentation is a

Semantic Segmentation / Instance Segmentation Based on Deep learning Yiding Liu 2018.12.08

Audio Device Client Better and Faster Audio I/O on Web Hongchan Choi Google Chrome Web Audio

Segmentation using Segmentation using Bayesian Decision Theory Bayesian Decision Theory

Segmentation Segmentation Segmentation Define the accurate boundaries of all objects in an image

Cirrus Audio Solutions Cirrus Audio Solutions Home Audio Portable Audio Personal CD Player

Boundary Line Discussion February 2018 Agenda District vision Why boundary line

Boundary value problems What problems does boundary value testing have? ECT2 Boundary

Automatic Verification of Automatic Verification of Automatic Verification of Automatic

EBLL Response in HCV Units Segment 1: The Basics EBLL Response in in HCV Units Segment 1:

PCEP Extensions for Service Segment Support in Segment Routing

Audio- -Visual Automatic Speech Recognition: Visual Automatic Speech Recognition: Audio Theory,

Automatic Classification of Automatic Classification of Audio Data Audio Data Carlos H. C.

Pixel-Level Im Image Understanding wit ith Semantic Segmentation and Panoptic Segmentation

Lecture 8: Image Segmentation Peng Chao Face++ Researcher pengchao@megvii.com Nov. 2017

Javascript: Functions ATLS 3020 - Digital Media 2 Week 4 - Day 2 Quiz #1 next Monday Structure:

Meet the Parents Primary 1 Briefing Session 24 Jan 2015 PERI Holistic Assessment English

Scheduling Response to Intervention Support Structures in High School Michael D. Rettig

Critical Peaks Redefined Nao Hirokawa Julian Nagele Vincent van Oostrom Michio Oyamaguchi IFIP

In Intr troduc ductory Mus usic ic Shuffle Along by Eubie Blake and Noble Sissle Two

Harmonic Interaction in Stitt &amp; Rollinss The Eternal Triangle Michael McClimon SMT

Chapter 14 Temporal Planning Dana S. Nau University of Maryland 3:11 PM April 18, 2012 Dana

Diagnosis (06) Diagnosis by Chronicles Alban Grastien alban.grastien@rsise.anu.edu.au Systems

Sambuz

Useful Links

Newsletter

Mail Us

Harmonic Interaction in Stitt & Rollinss The Eternal Triangle Michael McClimon SMT