Existen dos formas de acceder al contenido musical de una obra.
Mediante la utilización de varias herramientas de extracción de los datos característicos del audio, como: Aubio (http://aubio.org/), Yaafe (https://github.com/Yaafe/Yaafe) o Vamp plugins (www.vamp-plugins.org).
Una vez extraídos los datos, se abre un mundo de posibilidades de análisis inéditas para musicólogos, etnomusicólogos o investigadores interesados en el hecho musical. Se pueden analizar los datos musicales para encontrar relaciones en la estructura musical, como las resoluciones de acordes más utilizadas en un estilo determinado, el desarrollo de una serie en una obra dodecafónica o el estudio de diferencias presentes en cientos de interpretaciones de una misma pieza musical. Una de las técnicas más habituales en este tipo de análisis consiste en la conversión de los datos obtenidos en visualizaciones, como las que proporciona, por ejemplo, el software libre Sonic Visualiser, que cuenta con posibilidades que van más allá del clásico sonograma: www.sonicvisualiser.org
Varios ejemplos de investigación musicológica con Big Data (datos masivos o datos a gran escala) se pueden encontrar en el proyecto Digital Music Lab (http://dml.city.ac.uk), como su interfaz DML Vis disponible en línea (http://dml.city.ac.uk/vis). En esta aplicación el usuario puede explorar, analizar y comparar las grabaciones sonoras de tres grandes colecciones (British Library Sound Archives, CHARM y I like Music) mediante visualizaciones de la duración de los movimientos, las notas predominantes con respecto a la duración, la procedencia geográfica, los acordes, etc.
En los últimos años han surgido nuevas herramientas que permiten codificar la notación musical a partir de su imagen digitalizada. El reconocimiento óptico de la música (OMR, del inglés Optical Music Recognition) permite el acceso y el procesamiento de grandes cantidades de información musical en las bibliotecas digitales.
A pesar de los esfuerzos realizados por diferentes desarrolladores de software de edición musical como Finale o Sibelius, o de software específico de OMR (como PhotoScore), el resultado del reconocimiento óptico todavía genera demasiados errores. El proceso de conversión y traducción de los símbolos musicales, representados en píxeles, es una tarea, por lo pronto, complicada. La codificación presenta numerosos errores y depende, además, de muchos factores: el modo en el que se realizó la digitalización, el número de voces presentes en la partitura original, la complejidad rítmica, la ampliación de instrumentos a lo largo de la partitura, la densidad de notas en los sistemas, etc.
Hasta que nuevas tecnologías de reconocimiento óptico surjan, la clave en la reducción de errores de traducción pasaría por un tratamiento posterior de los datos codificados. Los investigadores y grupos de investigación que pasamos a mencionar proponen como solución, para corregir el resultado obtenido después de realizar el OMR, un procesamiento fundamentado en las siguientes estrategias:
Las pruebas realizadas con partituras manuscritas e impresas en la colección digital sobre Teatro musical español fueron claras en este sentido. El software libre para realizar el OMR, Audiveris (https://audiveris.kenai.com/), y la herramienta de pago, implementada en Sibelius, PhotoScore (www.neuratron.com/photoscore.htm), ofrecen resultados similares. Dependiendo de la dificultad de la notación y de la metodología aplicada para adaptar las digitalizaciones, los resultados incluyen un margen de error no asumible en un procesamiento masivo de partituras en el contexto de las bibliotecas. Otra dificultad se debe al propio proceso de digitalización realizado a lo largo de años y enfocado a la obtención de partituras en alta calidad. Ambos factores nos sitúan lejos de los requerimientos válidos para resultados de OMR legibles.
Por otra parte, en el caso de las partituras manuscritas (en nuestras pruebas se evaluaron con especial atención) se añade, si cabe, un agravante: la falta de normalización en la propia notación musical. Una dificultad, por cierto, habitual en el repertorio que hemos tomado como estudio en nuestra biblioteca para este proyecto: la música escénica vocal. Por ejemplo, si en una de las páginas no se mantienen las indicaciones de la clave o del ritmo, la diversidad y especificidad de la escritura musical puede producir una traducción prácticamente inservible. A fecha de hoy, la conversión de una partitura digital manuscrita es absolutamente ambigua para el software de OMR y exige la posterior corrección manual para obtener una representación veraz de la notación musical.