About the SIMSSA project

Why We Need a Single Interface for Music Score Searching and Analysis (SIMSSA)


Music prints and manuscripts created over the past thousand years sit on the shelves of libraries and museums around the globe. As these organizations digitize their collections, images of these scores are increasingly accessible online. However, the musical content remains difficult to search.

Google Books and HathiTrust have already made it possible to search the content of text documents through Optical Character Recognition (OCR), which transforms digital images of texts into a symbolic representation that can be searched by computers. For digital images of musical scores, the analogous technology is Optical Music Recognition (OMR).

We’re working to improve OMR technology so that computers can recognize the musical symbols in these images, enabling us to convert digital images of musical scores into symbolic representations of music. We can then search and analyze these symbolic representations, using software that we’re developing concurrently. Our goal is a single web interface that combines OMR conversion, search, and analysis tools. For the first time, it will be possible to search and analyze images of musical scores online, dramatically increasing the accessibility and usefulness of digital collections and enabling anyone to conduct powerful searches and do large-scale, data-driven analysis.


Content and Analysis


Our research is organized along two axes: content and analysis. The content axis creates document processing and OMR systems for digital images, transforming them into searchable symbolic notation. Check out the Cantus Ultimus project to see current OMR work in action on chant manuscripts from the CANTUS database at the University of Waterloo.

The analysis axis develops tools and techniques for large-scale search and analysis of music in symbolic notation. Take a look at the ELVIS Project to access our growing database of music in symbolic notation and explore some of our software development on GitHub.

Keep up-to-date with our blog, follow us on Twitter, and check out our publications, workshops, presentations, impact, and media.


The SIMSSA Team


We are a diverse team dedicated to accomplishing this mission. SIMSSA includes music scholars, performers, librarians, and music technologists, working to create new tools for the search and analysis of the collections of our partner museums, research libraries, and universities. Document processing and OMR correction for this vast collection will be carried out by musicians, students, and scholars around the world.


Pourquoi nous avons besoin de SIMSSA


Des siècles de partitions musicales, imprimées et manuscrites, reposent sur les rayons de bibliothèques et de musées partout dans le monde. Grâce aux programmes de numérisation de ces institutions, une portion croissante de ces collections est maintenant accessible en ligne. Cependant, il demeure difficile de faire des recherches dans le contenu musical de ces documents.

La recherche dans le contenu des documents textuels est pourtant déjà possible dans Google Books et HathiTrust grace à la reconnaissance optique de caractères (ROC), qui permet de transformer les images numériques de ces documents en contenu textuel dans lequel on peut effectuer des recherches.

Nous travaillons à améliorer la technologie pour la reconnaissance optique de la musique (ROM) afin que les ordinateurs puissent reconnaître les symboles musicaux dans les images. À l’aide des logiciels que nous développons, nous pourrons ainsi extraire automatiquement les symboles de notation musicale à partir d’images numériques de partitions. Notre objectif est de créer une interface Web qui combinera des outils pour la reconnaissance optique de la musique ainsi que des outils de recherche et d’analyse. Pour la première fois, il sera possible d’effectuer en ligne des recherches et des analyses de partitions musicales numérisées, ce qui permettra d’accroître considérablement l’accessibilité et l’utilité des collections numériques, tout en permettant à tous d’effectuer de puissantes requêtes et des analyses à grande échelle, basées sur des données.


Contenu et analyse


Notre projet de recherche s’articule autour de deux axes : le contenu et l’analyse. L’axe « contenu » porte sur le traitement des documents et le développement des technologies de reconnaissance optique de la musique (ROM) pour les images numériques, les convertissant en une représentation symbolique dans laquelle on peut faire des recherches. Pour voir le résultat des technologies ROM en action sur les manuscrits de plain-chant de la base de données CANTUS de l’Université de Waterloo, jetez un coup d’œil au projet Cantus Ultimus.

L’axe « analyse » vise à développer des outils et des techniques pour la recherche et l’analyse à grande échelle de partitions musicales. Pour accéder à notre base de données sans cesse croissante de partitions musicales sous forme de notation symbolique, visitez le site du projet ELVIS. Vous pouvez par ailleurs explorer quelques uns des logiciels que nous avons développés sur GitHub.

Pour vous tenir au courant, vous pouvez visiter notre blog, nous suivre sur Twitter et consulter nos publications, ateliers, présentations, impact, et médias.


L’équipe SIMSSA


Nous sommes une équipe diversifiée, déterminée à remplir notre mission. L’équipe SIMSSA regroupe des musicologues, des interprètes, des bibliothécaires et des spécialistes en technologies musicales travaillant ensemble à créer de nouveaux outils de recherche et d’analyse pour les collections des musées, bibliothèques et universités partenaires dans ce projet. Musiciens, étudiants et chercheurs de partout à travers le monde seront interpelés pour réaliser le traitement des documents et corriger les résultats de la reconnaissance optique de la musique de ces vastes collections.