Cursillo de Introducción a la Informàtica Musical
Parte 2: Audio Digital

Autores: Hisham Mansour / David García Garzón

Crear nuevos sonidos a partir de sonidos. Este doctorial recoge informacion de como obtener, tratar y almacenar muestras digitales de sonido con el objetivo de construir con ellas composiciones musicales.

Indice

0. Como esta organizado el manual

Como la mayoria de los doctoriales de los MoDDeRs este manual esta hecho de tal forma que el lector pueda ir directamente a los capitulos que le sean utiles obviando el resto.

Algunos conceptos muy basicos se dan por sabidos en el resto del manual: Formas de onda, componentes en frecuencia de un sonido, respuesta en frecuencia, transformada de Fourier, diagrama de Bode y codificacion binaria y hexadecimal. Son conceptos que supongo que la mayoria tendran por la mano, pero, si no es asi, puedes visitar el Apendice A

1. Audio Digital

1.1. Analogico vs. Digital

Si a alguien que preguntase la pendiente de nuesta calle le respondieramos inclinando el brazo, le estamos dando informacion analogica, pero si le decimos que mas o menos 15 grados le estamos dando informacion digital. Es decir, en el primer caso damos una analogia con la realidad y en el segundo hacemos una abstraccion numerica.

Electronicamente hablando, una señal analogica es aquella que varia su nivel segun aquello que quiere representar. Una señal digital es aquella que lo codifica numericamente. Se utiliza para ello un formato binario, por lo general.

Al asignar un valor (cuantificar) estamos discretizando el conjunto de valores pero hacemos mas facil su procesado. Es decir, con la inclinacion del brazo, quizas puedas indicar precisamente una inclinacion del 15.123423424....% y nuestro amigo lo entendera pero le sera muy dificil operar con ello si antes no lo cuantifica.

1.2. Introduccion al sonido digital

La señal de audio que obtiene un microfono es analogica. El proceso para digitalizar la onda analogica es tomar muestras periodicas de la misma. A estas muestras se le asignan valores numericos que son convertidos al formato binario. Los unos y ceros son facilmente almacenables segun la presencia o la ausencia de algo: Carga electrica (memorias RAM), magnetismo (discos duros) o agujeros (CD).

1.3. Frecuencia de muestreo

La frecuencia de muestreo o sampling rate son las muestras que se recogen cada segundo en Hertzios. Si cogemos muestras mas a menudo, la calidad del sonido serar mayor, pero, tambien augmenta el espacio que ocupa la toma en bits.

Esta frecuencia de muestreo limita la frecuencia maxima que podremos recoger de la señal. La frecuencia de muestreo debe ser algo mas del doble de la frecuencia maxima que queremos registrar.

Asi, si el oido humano, genericamente, puede escuchar sonidos de hasta 20 KHz, la frecuencia de muestreo que se puso a los CD-audio es de 44'1 KHz, algo mas del doble que son 40KHz.

NOTA: El oido humano tambien tiene un umbral inferior de frecuencia. La gama de sonidos audibles va de los 20Hz a los 20KHz.

Aqui teneis algunas de las frecuencias de grabacion mas tipicas.

DAT48.000 Hz
CD-audio44.100 Hz
Trackers Tradicionales8.363 Hz
Telefonia8.000 Hz

1.4. Bits de profundidad

Los bits de profundidad son el numero de bits con los que se codifica una muestra. Dado que la electronica digital esta desarrollada para grupos de bits potencias de dos, las profundidades mas extendidas son 8 bits y 16 bits. Una profundidad de 8 bits da 28=256 niveles de amplitud y 16 bits dan 216=65536 nuveles.

La profundidad de 16 bits se ha popularizado en las targetas de sonido y en los samplers actuales debido a que es la utilizada en los CD-audio, y ofrece una calidad muy buena. Pero es obvio que una muestra grabada a 16 bits ocupara el doble de una muestra a 8 bits.

El error de cuantificacion es el que se produce al redondear a un valor continuo un valor discreto. Si la senyan analogica tiene un valor que esta entre el 4 y el 5 tenemos que elegir cual de los dos es el mas cercano.

El espacio que hay entre dos cuantificaciones contiguas se llama paso de cuantificacion. El maximo error de cuantificacion posible es la mitad de dicho paso..

1.5. Pasos de cuantificacion no liniales

A pesar de que podemos calcular el error de cuantificacion, lo que es perceptible al oido es la proporcion de error respecto al nivel de la señal: Es mas perceptible el error de quantificacion cuando la senyal tiene un nivel bajo. El mismo error, cuando la senyal tenga un nivel alto, puede ser imperceptible.

Por ello es util una codificacion no linial, es decir, en vez de utilizar un paso fijo, en los valores mas pequeños se utilizan pasos mas pequeños para reducir el error y en los valores mas altos da lo mismo si utilizamos una quantificacion mas relajada pues el error no es tan perceptible.

Exiten las leyes de cuantificacion µ-law y a-law que definen dos formas distintas de cuantificar la señal de una forma no linial.

Con la cuantificacion no linial es posible obtener la misma calidad de sonido con menos bits de profundidad.

1.6. Codificacion diferencial

La codificacion diferencial es otra forma de reducir los bits de profundidad. Se trata de codificar la diferencia entre dos muestras en vez de el valor de las mismas.

Por ejemplo, si codificamos el nivel con 8 bits (valores de 0 a 255), podriamos suponer que la diferencia maxima entre dos samples contiguos es de 64-1 pasos de cuantificacion y codificarlos con solo 6 bits.

Esta claro que esta codificacion no se puede adaptar con suficiente rapidez a los cambios bruscos de la señal y filtra las altas frecuencias. Pero, si no se busca calidad o si la señal lo permite, tambien es una alternativa valida.

1.7. Canales: Monofonia, stereofonia y cuadrofonia

Segun el numero de canales una senyal puede ser monofonica, stereofonica o incluso cuadrofonica. Usar mas de un canal da profundidad al sonido y permite dar la sensacion de que procede de un sitio o otro. En este sentido hay tecnicas como el Dobly-Surround o de sonido 3D que permiten mas control sobre esta localizacion del sonido sin incrementar el numero de canales.

A pesar de que la estereofonia y la cuadrofonia son muy deseables de cara al resultado final de nuestro trabajo, no lo es en los productos intermedios, como, por ejemplo, los samples, pues a parte de que cada canal replica el tamaño, complica mucho el procesado por eso se tiende a hacer la separacion en canales en las ultimas fases del proceso creativo.

2. Enemigos del audio digital

2.1. Aliasing

El aliasing se produce cuando la frecuencia de muestreo no es suficientemente alta para reproducir con fidelidad todos los aspectos de la forma de onda, es decir, las variaciones de alta frecuencia no quedan registradas pero si que afectan al valor muestreado introduciendo en la señal frecuencias fantasma que no existian en la señal original.

Tambien se produce cuando, por razones de espacio, decidimos resamplear una muestra, ya digitalizada, a una frecuencia inferior.

Solucion: Aplicar un filtro anti-aliasing antes de muestrear. La mision de un filtro anti-aliasing es la de filtrar las frecuencias de la señal que despues no podran ser registradas a la frecuencia de muestreo deseada.

Por ejemplo: Con una frecuencia de muestreo de 22,1KHz, solo quedan registradas las frecuencias menores 11'05KHz (la mitad). Para que no aparezca aliasing al muestrear habra que filtrar primero aquellas frecuencias mayores que 11'05KHz.

2.2. Infrasampleado

El infrasampleado se produce cuando la frecuencia de reproduccion no es suficientemente alta para reproducir la onda sin que el oido note los escalones de la digitalizacion. Este problema se da muy a menudo cuando los samples se bajan de frecuencia de reproduccion para generar las notas mas graves.

Solucion: Utilizar, al reproducir, interpolacion. La interpolacion sirve para obtener mas puntos entre sample y sample suponiendo que siguen una funcion matematica. La funcion mas simple es la de una linia que une los dos puntos pero suelen dar mejores resultados aunque son mas costosas de calcular las curbas (cuadraticas, cubicas, splines...)

2.3. Saturacion o clipping

Este otro efecto no deseado se produce cuando el nivel del sonido se va mas alla del limite de cuantificacion. Es decir, si tenemos 8 bits para codificar, si una onda pasa del nivel assingado a 255 que valor le ponemos?

Generalmente se le da ese valor maximo, lo que da a la forma de la onda un aspecto recortado y auditivamente, produce un molesto click.

Para gravaciones en las que no hay grandes variaciones de sonido la solucion perfecta es la amplificacion adaptativa o compresion. La hacen servir la mayoria de equipos (menos la SoundBlaster) y consiste en amplificar mas o menos segun el nivel de volumen que previamente haya llegado, para conseguir un nivel de señal casi constante.

Estos compresores, el que mas o el que menos, deja que el operador ajuste unos ciertos controles que determinan la forma en la que se producira la adaptacion.

A falta de compresion, se puede controlar el clipping controlando el volumen de grabacion, pero, en tiempo real es muy dificil de hacer para el operador. A falta de practica, lo mejor es grabar muestra en un soporte analogico de calidad y digitalizar controlando el volumen tal ke se maximize el nivel de la señal sin producir clipping. Para controlar cuando se produce el clipping algunos samplers tienen un detector de pico que indica cuando la entrada sobrepasa el valor maximo.

2.4. Error de cuantizacion

El error de cuantizacion se produce al discretizar los niveles a los que se puede associar una muestra.

Se evita augmentando la profundidad en bits del sonido y utilizando pasos de cuantificacion mas detallados para los valores de menos intensidad y mas amplios en valores de gran amplitud. Todo ello fue explicaco mas detalladamente en las secciones ??? y ???

2.5. Interferencias

Las interferencias es un fenomeno que se debe principalmente al hecho de que dos señales electricas proximas tienden a hacer los mismos cambios. Aunque tratando con informacion digital las interferencias no son mucho problema, si que afectan a la señal analogica que entra o sale de nuestro sistema digital. Incluso, a veces, tambien afectan a la señal que aun no ha salido de la tarjeta de sonido los otros componentes dentro del PC.

Para evitar interferencias lo mejor es alejar cables, tarjetas y equipos de las posibles fuentes de interferencias y apantallarlos, esto es rodearlos con una cubierta metalica que se lleva las interferencias

He aqui una pequeña guia:

2.6. Paquetizacion

Por naturaleza la informacion en el ordenador esta dispuesta de forma discontinua. En el disco duro esta dividida en bloques (habeis usado el Defrag?), la memoria la divide en paginas, la tranferencia entre el ordenador y los perifericos, como la targeta de sonido, se realiza en paquetes (Bloques DMA)...

En ordenadores no muy rapidos, cuando hay un cambio de un bloque de disco a otro o de pagina de memoria a otra... son momentos criticos para la grabacion, si el cambio no se produce con la suficiente rapidez, el sample puede quedar afectado.

El tipo de paquetizacion que afecta mas, debido a su lentitud, es la del disco duro, por lo que es aconsejable utilizar memoria si es posible, al menos como soporte intermedio.

2.7. Entornos multitarea y sistemas orientados a interrupciones

Dentro del mismo PC, existe otro problema es un entorno basado en interrupciones y, ademas, con Windows o similares, es multitarea.

Los entornos basados en interrupciones (que son la mayoria de sobremesa) son aquellos en los que la accion de un periferico (teclado, raton, disquetera...) hace que la CPU deje momentaneamente de hacer lo que estaba haciendo para atender al periferico. Si hay demasiados perifericos (la tarjeta de sonido es uno) compitiendo por la atencion de la CPU, a veces la CPU no siempre llega a tiempo de digitalizar y se pierden samples. El resultado de esta perdida de samples, suele ser un pequeño salto con su correspondiente clic.

Lo mismo pasara en un entorno multitarea en que los propios programas tambien compiten por la CPU. Puede haber samples que no sean atendidos por el digitalizador.

Ambos problemas se solucionan eliminando competidores al programa de digitalizacion, y trabajando en memoria (fisica no virtual), cuando ello sea posible, para hacer mas agil el almacenamiento.

Otra solucion es el uso de buffers. Un buffer es una cola en memoria donde se van almacenando los datos enviados por el periferico sin que este tenga que esperar al procesador.

Tambien existen buffers de salida para reproduccion. El buffer se llena antes de empezar a reproducir y sirve de reserva para cuando el procesador tiene que atender a otras tareas.

Un buffer tendria que tener una capacidad igual o mayor al numero de bytes que se pierden de golpe. Para un sistema que da saltos grandes, el buffer tendria que ser tambien grande. Sin embargo conviene tener cuidado con hacer buffers demasiado grandes en sistemas que pretendan responder en tiempo real, pues el buffer provoca algo de retardo.

Precisamente, el problema de Windows en algunas aplicaciones de audio en tiempo real es que su sistema interno de audio y MIDI, utiliza buffers en todas partes, lo que hace necesario un ordenador muy potente para reducir la latencia.

3. Sampling, obtencion de muestras

3.1. Concepto e historia

La tecnica del sampling consiste en obtener sonidos musicales a partir de copias digitales de un sonido original. Esa copia o sample se reproduce con mayor o menor rapidez para obtener toda la gama de notas. Esta forma de obtener las notas se llama desplazamiento de tono (en ingles, Pitch shifting).

Classicamente, un sampler podia venir en dos apariencias: La caja (rack) o el teclado. La caja es un aparato con un complejo panel de control que permite seleccionar y editar las muestras que tiene en memoria. Un sampler en rack suele permitir ser controlado por un teclado MIDI aunque tambien hay quien lo usa directamente, pero no suele ser el caso de musicos sino de DJ que solo necesitan lanzar sonidos en un momento dado i no crear melodias. El sampler en teclado simplemente es la fusion de el rack con el teclado controlador.

La nueva y revolucionaria apariencia que ha surgido en los ultimos tiempos es el ordenador. Ahora con poco mas que una simple Sound Blaster 16, los programas y un modesto PC se pueden obtener la mayoria de funcionalidades que antes solo estaban en carisimos equipos.

El sampler surgio de la necesidad de obtener sonidos realistas que los sintetizadores clasicos no obtenian. La tecnica precursora de los samplers fue la sintesis digital basada en formas de onda que consistia en generar los sonidos, no a partir de ondas simples, como el resto de sintetizadores que hacen servir ondas cuadradas, triangulares o sinosoidales, sino que permitia construir el periodo base de la forma de onda de forma digital.

Los sintetizadores de tabla de onda no se consideran propiamente samplers. El primer sampler promiamente dicho fue el Fairlight CMI (Computer Musical Instrument), a partir de ahi los samplers han ido evolucionando a lo largo de su corta historia añadiendo:

3.2. Fuentes de los sonidos.

¿De donde obtenemos los sonidos?

Lo mas casero es obtener los samples con un microfono y grabar sonidos reales. Si tienes un buen interprete a mano no lo dejes escapar sin que te grabe un par de samples. La ciudad es a veces un hervidero de ruidos, algunos muy espectaculares.

Pero a veces para obtener una buena calidad se necesitan buenos microfonos. Si no quieres meterte a caza sonidos tambien es facil digitalizar los sonidos directamente de una fuente electronica tal como una cadena de musica, la tele, un teclado o una guitarra electrica. Nada mas necesitas el cable adecuado y un poco de ojo con las impedancias. Por lo general una salida de un aparato que puedas escuchar con cascos la puedes conectar a la entrada de linia de la tarjeta de sonido sin problemas de quemar nada. Mejor quemar unos cascos cutres que una tarjeta de sonido cutre asi que prueba siempre primero con los cascos.

Otra fuente de samples son los CD's de audio. Hay programas especiales para rippear CD's. Esto es, obtener la informacion digital que hay en el CD de audio tal cual, sin que la targeta de sonido tenga que volver a digitalizarla con la consiguiente perdida de calidad. Estos programas se comentan mas adelante.

Tambien puedes crear tu los samples con programas de sintesis, o hacer un volcado MIDI de los samples de tu sintetizador. Tambien hay CD's muy majos con colecciones de samples ya hechos...

3.3. Aspectos legales

Venga de donde venga el sonido (sonidos reales, fuente electronica, CD's de Audio, colecciones de samples...) seguro que te puedes encontrar trabas legales.

Como premisa hay que tener en cuenta lo siguiente:
No se puede VENDER algo con samples de otro sin pagar derechos de copyright.

Esto no quiere decir que si lo distribuyes gratuitamente estes fuera de peligro pero como que no hay dinero de por medio tampoco iran a por ti. Eso si, una cosa es utilizar samples y otra plagiar.

Ahora bien, el control es muy dificil y siempre es posible usar simplemente samples minimalistas o disfrazarlos un poco. Es del todo iluso samplear una secuencia de notas y pretender que cuele pero una nota de un instrumento procesada y arreglada para montar una melodia diferente pues ya es menos descarado.

Ten cuidado si has firmado con una compañia pues normalmente hay una clausula que dice que no se hacen responsables de aquellos samples que no les comuniques. Si ellos los quieren colar, pues adelante, pero ¿como demuestras tu que le has comunicado el uso de dichos samples? En todo caso siempre es mejor un trato amistoso con la otra parte, que un costoso juicio o tener que retirar tu disco del mercado. Ademas, siempre hay gente dispuesta a ceder derechos si no son muy peseteros lo que haces les gusta. Y si no hay trato, seguro que encuentras otro sample que te valga.

Todo antes de un caro y costoso proceso de limpieza (sample clearing).

Existen organismos como la MCPS (Mechanical Copyrigth Protection Society) que, entre otras cosas, se encargan de facilitar el contacto entre sampleadores y sampleados. Mantienen una lista de autores a los cuales no les importa que les sampleen sin pagar nada. En España un organismo equivalente es la SGAE.

En cada pais, hay un plazo legal a partir de la muerte del autor a partir del cual su obra pasa a ser de dominio publico: 50 en Inglaterra, 76 en USAlandia, entre 70 y 80 en España... Asi que si quieres samplear a la Juanita Reina pues de aqui a un par de años, ya se podra.

Con los CD's de samples no te fies mucho de la etiqueta y mira el Legal Disclaimer. A veces aunque sean Copyright Free, no incluye el uso comercial.

Un mito muy falso es que se puede samplear de la television lo que sea. Nada mas lejos de la realidad: Tendras ke pagar al lokutor, al propietario del producto y a la kadena que lo distribuye. Y si se trata de una película, te puedes encontrar hasta 5 o 6 copyrigth que satisfacer.

Mas informacion en el manual LegalDOC.

3.4. Soportes digitales.

Si estamos trabajando con un ordenador el soporte de trabajo esta claro que sera un disco duro pues podemos editar facilmente los samples sobre el. Pero si vamos a grabar fuera del estudio, no nos podemos llevar el ordenador con nosotros y necesitamos un soporte intermedio para transportar los samples.

Este soporte puede ser analogico (una cinta) que, segun la calidad, puede introducir ruido adicional, y que ademas despues hay que hacer una conversion a digital para traspasarlo a disco duro.

A menudo se prefiere registrar directamente en un soporte digital. De esta forma, se muestrea directamente la senyal grabada sin ningun otro soporte intermedio y no es necesario digitalizarla posteriormente.

Tambien esta el problema de almacenar los samples en un soporte duradero que no pierda calidad con el tiempo. En el disco duro tendremos los samples con los que trabajamos pero, el resto, como ocupan mucho, mejor tenerlos en un soporte extraible a parte. Lo mismo para los masters finales.

Los soportes digitales mas comunes son los siguientes:

A) A-DAT

El A-DAT es un sistema ideado por Alexis que se empezo a usar en 1981. Permite grabar 8 pistas de audio digital sobre una misma cinta magnetica. El soporte es, normalmente, una cinta de video VHS que se encuentran a precio de consumo. Permite grabar 8 pistas a 24 bits y frecuencias de muestreo de 32 KHz, 44'1 KHz y 48KHz. Se usa mucho en estudios profesionales y algunos estudios caseros pues el coste es relativamente bajo. Es un sistema bastante escalable, pues, se diseño de forma modular y permite agrupar y sincronizar varias unidades, lo que multiplicar el numero de canales.

Al ser la reproduccion y grabacion mediante el contacto de una cabeza magnetica con la cinta, se produce desgaste de la cinta como en las platinas analogicas de los Music Cassettes. La diferencia es que al estar grabado digitalmente, el desgaste no tiene el mismo efecto en la calidad que en los MusicCassettes aunque si en la vida de la cinta.

El acceso es sequencial y por lo tanto, lento y aparatoso, pues tenemos que rebobinar la cinta para encontrar un punto en concreto. Por suerte, se nos permite situar puntos de referencia o 'cues' que permite al aparato localizar el punto de forma automatizada (aunque igual de lenta). En un principio, las unidades A-DAT se controlaban sincronamente con un modulo de llamado BRC que implementaba funcionalidades de transporte: Play, Pause, Stop, Rewind, Fordward, Marcar un punto de referencia, Posicionarse en un punto de referencia...

Tambien tiene la pega de que las cintas de video son muy voluminosas. Cuando utilizamos varias unidades para incrementar el numero de canales, necesitamos una cinta por cada 8 canales. Si ademas conservas cada toma y el master final, como hacen la mayoria de estudios, al final acabas teniendo una pared inmensa dedicada a almacenar cintas de A-DAT.

La herencia mas valiosa de este formato es el protocolo que utilizaban estas unidades para enviar audio digital del que se habla en el apartado de Conectores digitales.

B) Compact Disc

El CD es un sistema digital de almacenamiento que utiliza lectura optica desarrollado por Philips y Sony, principalmente. La lectura optica significa que se realiza mediante la reflexion de un laser en el soporte y por lo tanto no hay contacto con ningun cabezal ni desgaste. Permite almacenar aproximadamente 75 minutos de audio digital a 16 bits stereo muestreado a 44'1 KHz. Ademas de las letras y los creditos en canales auxiliares (Caracteristica, esta, no muy utilizada, cabe destacar). Se divide en pistas (canciones) que pueden llegar a ser hasta 99.

Tiene un codigo de proteccion y correccion de errores que lo hace tolerante a ralladas, sobretodo las que van en sentido radial. Las rayadas transversales son mas dañinas por lo que se recomienda limpiarlos siempre radialmente.

En el mismo soporte pueden convivir Audio y datos de ordenador. El formato de los datos de ordenador es comun a varias plataformas (PC, Amiga, Mac...) lo que le convierte en un medio ideal de traspasar informacion entre sistemas diferentes.

Los CD generalmente se fabrican por estampado y son medios de solo lectura pero se pueden grabar con unas unidades grabadores especiales. Aun asi, la poca flexibilidad del proceso de grabacion, asi como la imposibilidad de modificar lo ya grabado, los hacen utiles solo para hacer copias de seguridad (de samples y de masters realizados), y para distribuir maquetas.

El futuro del CD esta en el DVD, un soporte pensado para video pero que, en audio supone tener en un solo soporte hasta 30 horas de musica. Una revolucion que provoca al mismo tiempo la reticencia de las discograficas a promocionarlo.

C) Mini Disc

El Mini Disc es un soporte desarrollado en 1992 por Philips y Sony y comercializado por Sony. Se desarrollo con la pretension de ocupar el espacio de las cintas de Music Cassette con un soporte digital. Por lo tanto es un soporte que no ofrece tanta calidad como el CD pero que, en cambio, permite grabacion.

La tecnologia en la que se basa el MD es magneto-optica. Utiliza un material que solo genera magnetismo cuando le llega un haz de laser. La grabacion se realiza estableciendo un campo magnetico mientras se calienta con el laser una pequeña zona que quedara magnetizada (tecnologia termo magneto optica).

Utiliza la compresion ATRAC. Una compresion perceptual 5:1 basado en el analisis por enmascaramiento frecuencial (Ver Compresion Temporal) en tres bandas de frecuencia diferentes.

Contiene un buffer de 12 segundos que permite a los circuitos estabilizarse en caso de golpe brusco sin que se corte la reproduccion o grabacion. Esto lo hace perfecto para obtener grabaciones en sitios comprometidos como un concierto o un arbol.

D) Digital Compact Cassette

Este soporte lo empezo a desarrollar Philips en solitario en 1993 cuando penso que para substituir al Music Cassette hacia falta un soporte que fuera compatible con el. Asi, si te comprabas un reproductor de DCC podias seguir usando tus cintas de siempre.

El DCC es un soporte con el mismo formato que una cinta normal pero que graba digitalmente. Los lectores de DCC pueden leer sin problemas una cinta analogica aunque una platina analogica no pueda reproducir un DCC.

Permite grabar 8 pistas de audio simultaneas mas un canal auxiliar. La informacion que contiene la lee el reproductor a 786Kbits/s. Es poca la informacion para 8 canales pero es que utiliza una compresion mas sofisticada que el MD: la compresion PASC que se basa en un analisis por enmascaramiento frecuencial y temporal en 32 bandas frecuenciales. Ademas tambien elimina los sonidos por debajo de umbral de pression que nos son perceptibles.

3.5. Formatos de archivos de sonido.

Existen infinidad de formatos de archivos de audio digital. Cabe destacar dos: el WAVE RIFF (extension .WAV) usado en Windows y el AIFF usado en Machintosh. En todo caso, entre los diversos formatos, la gran diferencia es la cabezera que identifica algunos datos utiles como la longitud, la frecuencia de muestreo, los puntos de referencia... y, sobretodo, la codificacion.

Si, a un archivo, le quitamos la cabezera y los bytes auxiliares, nos queda una tira de bytes que representan la onda, lo que se le llama formato RAW, crudo o sin cabecera. Ahora bien, la manera en que la tira de bytes cruda representa la onda es la codificacion.

La codificacion mas simple es la PCM, en la cual, cada sample se representa por un numero proporcional a la amplitud. A pesar de ser la mas simple y la mas estandard, tenemos varias formas posibles de leerla y almacenarla segun:

En resumen,

Como se determina el formato y la codificacion

NOTA: A veces, forzando la lectura de un sample segun un tipo de codificacion que no le corresponde, se pueden obtener efectos de robotizacion y distorsiones muy estrañas que le pueden ser utiles a un musico.

3.6. Fuentes Electronicas: Cableado y conectores.

Para poder intercomunicar los distintos elementos de audio disponemos de varios tipos de conectores analógicos y digitales. Los conectores digitales permiten reducir perdidas en muchos casos:

Por otro lado, los analógicos son mas sencillos y asequibles. Los conectores digitales no se limitan a enviar señal sino que necesitan intercambiar información para establecer la comunicación. Por eso, mientras que las diferencias entre los conectores analógicos son principalmente físicas, cada tipo de conector digital suele tener asociado protocolo de comunicación propìo.

Aqui teneis una lista de los conectores analogicos y digitales mas comunes y sus caracteristicas:

Conectores analogicos

Conectores digitales

Falta colocar fotos de cada conector.

3.7. Microfonia y toma al aire.

Microfonos Dinamicos

Los microfonos dinamicos tienen una respuesta frecuencial tal que es plana para la mayoria de frecuencias audibles y en las frecuencias mas elevadas, en torno a los 5KHz, tiene un pico de respuesta y decrece de golpe.

Este tipo de microfono tiene varias ventajas.
:) Es mas barato.
:) Aguanta altas presiones -> Lo puedes usar para baterias y demas.
:) Augmenta los agudos, lo cual es ideal para resaltar la voz solista.

Por supuesto no es un microfono muy sensible, ni tampoco tiene una respuesta frecuencial totalmente plana. Asi que para aplicaciones muy puristas utilizaremos casi siempre un microfono de condensador.

Microfonos de Condensador

Los microfonos de condensador tienen una repuesta frecuencial totalmente plana lo cual les da una fidelidad casi absoluta. Lo malo que tienen es que son muy caros y que no soportan presiones por encima de los 120 dB. Hay que utilizarlos en entornos en los que los picos y las saturaciones esten controlados.

Otros microfonos, mas informacion sobre microfonia

Tambien existen otras tecnologias de microfono mas especificas: piezoelectricos, de carbon... pero estan fuera del alcance de este manual. Se puede encontrar mucha mas informacion sobre microfonia en la web www.recording.hostway.com

3.8. Extraccion digital de CD-Audio.

La mayoria de unidades CD-ROM disponen de un modo de extraccion directa de audio digital. Este modo permite traspasar al ordenador el audio digital como si fueran bytes de CD-ROM de datos. Este modo lo soportan la mayoria de unidades, excepto algunas Mitsumi antiguas, ya que esta marca, al principio no quiso habilitar este modo de funcionamiento para evitar la posible pirateria.

De todas formas, este modo de extraccion tiene un pequeño inconveniente. Los bytes de un CD-Audio se direccionan mediante un codigo SMPTE de 24 frames por segundo. Si haces las divisiones correspondientes veras que cada frame, agrupa a la vez un monton de bytes. Esto implica que no podemos saber, exactamente, qual es nuestra posicion, por lo que a veces se pierde la sincronia y como resultado la grabacion hace un pequeño salto hacia adelante o hacia atras.

Los programas de extraccion digital, implementan varios algorismos para corregir estos errores. La calidad de los programas de extraccion se basa principalmente en la eficiencia de dichos algorismos de correccion. Algunos de estos programas son: CD-Copy, Digital Audio Copy, Exact Audio Copy...

Los CD comerciales que contienen samples ya realizados, suelen estar pensados para utilizarse un reproductor de CD-Audio convencional conectado analogicamente al sampler. Si no estuvieran pensados de esta forma podrian venir directamente en formato WAV o AIFF que para trabajar en el ordenador es mucho mas practico y no haria falta utilizar un extractor digital.

Ademas tenemos un problema añadido en estos CD's: Los samples grabados en un CD-Audio estan agrupados juntos en tracks, con una separacion de uno o dos segundos entre sample y sample. Es tediosa la tarea de separar los samples una vez extraida una pista a WAV o de extraer sample a sample directamente.

Existe software que se dedica a identificar los intervalos en blanco y particionar el WAV resultante en varios.

Problemas con los drivers: los drivers ASPI para WIN95 ya no dan tantos problemas
CD de musica

4. Edicion basica

Todos los programas de edicion de ondas, desde los mas simples que suelen venir con la targeta de audio, a los mas sofisticados, permiten una serie de operaciones de edicion:

5. Efectos y mejora de calidad

5.1. Efectos basados en retardo

Los efectos utilizan se basan en aplicar un cierto retardo (delay en ingles) a una porcion de la señal que despues mezclan con la original de una manera determinada.

La mayoria de estos tambien permiten hacer que parte de la salida vuelva a entrar parcialmente en el proceso produciendo lo que se denomina realimentacion (feedback en ingles). Segun el grado de realimentacion, la salida puede llegar a saturarse por lo que no conviene incrementarla mucho.

5.1.1. Eco

El eco es un efecto sonoro que se produce cuando un sonido rebota contra una superficie lejana y llega por duplicado al receptor con un cierto retardo.

Este efecto se puede reproducir artificialmente, mezclando el sonido original consigo mismo pero retardado y levemente atenuado. Se modela facilmente, configurando para cada repeticion, el retardo y la atenuacion.

Ojo con este y otros efectos de retardo, a menudo conviene, tener un poco de silencio al final del sonido original para que el efecto no quede interrumpido de forma brusca pues el sample resultante suele ser mas largo que el original. No todos los editores te añaden el espacio que falta.

5.1.2. Reverberacion

Una reverberacion no es mas que un eco con un retardo tan pequeño que hace que las distintas repeticiones sean apenas perceptibles. Las reverberaciones se dan de forma natural en los sitios cerrados por la reflexion en las paredes. Cada recinto tiene una reverberacion caracteristica dependiendo de su geometria y de la absorcion de los materiales que hay en el.

La reverberacion es un recurso muy valioso para dar entidad a un sonido. Lo utilizan la mayoria de equipos en las fases finales de procesado. Es normal el uso de equipos reverberantes en los estudios de grabacion pues generalmente son pequeños y no tienen la reverberacion que se desearia.

Para el eco y la reverberacion, los parametros son similares, pero para hacer una reverberacion realista habria que configurar muchos otros parametros a parte del retardo y de las atenuaciones, pues generalmente, las superficies no absorben todas las frecuencias por igual y se tiene que hacer una atenuacion segun la frecuencia. Al ser tantos los parametros, frecuentemente los programas de edicion ya tienen algunas configuraciones hechas de entrada para simular la reverberacion de una catedral, un pabellon...

5.1.3. Flanging y Phasing

El Flanging consiste en mezclar la señal con una copia retardada levemente pero con un retardo variable en el tiempo.

Los parámetros a configurar son como mínimo el porcentaje de señal retardada, el margen de variación del retardo (entre varios unidades y varias decenas de milisegundos) , la frecuencia de variación de este retardo (normalmente entre algunas décimas y varios hertzios), y el porcentaje de realimentación.

Si el porcentaje de realimentacion es muy bajo, el efecto conseguido es mas discreto y se suele llamar phasing que se utiliza a menudo en los pedales de guitarra.

El sonido obtenido es bastante electronico, parecido al que obtenian de forma casera los musicos de la psicodelia, retardando de forma variable un magnetofono respecto a otro.

Flanger: Esquema

5.1.4. Chorus

El Chorus es un efecto que pretende hacer que un solo intrumento suene como varios a la vez. Se consigue mezclando la onda con ella misma varias veces pero retardada y desafinada levemente.

Se usa mucho para dar presencia a las voces de los cantantes.

Se puede configurar el numero de instancias y el retardo, atenuacion y afinacion relativa de cada una, aunque generalmente los editores ya tienen configurados estos parametros para que suene bien.

Este efecto suena mas bien discreto por lo que se suele ampliar con realimentacion y modulacion en amplitud de las voces.

5.2. Procesado de dominio dinamico

5.2.1. Distorsion en el dominio dinamico

El dominio dinamico de una señal equivale a la serie de valores que adopta esta. Por ejemplo, en una señal digital de 8 bits el dominio dinamico maximo podria ser de 127 a -126 pero un sonido en concreto podria ir simplemente de 20 a -20.

Una amplificacion, por ejemplo, implica un cambio en el dominio de la señal, si amplificamos la señal anterior con un factor de dos, pasariamos a un dominio dinamico de 40 a -40.

Lo que pasa en la amplificacion es que para cada valor, de la entrada tenemos un valor de salida que es siempre proporcional sigue la siguiente relacion entrada/salida:

Relacion entrada/salida de un amplificador

Cuando la relacion entre valor de entrada y valor de salida no es constante para todos los niveles de la señal diremos que se esta produciendo una distorsion en el dominio dinamico.

Relacion entrada/salida de una distorsion

La mayoria de amplificadores (y aparatos de digitalizacion) distorsionan cuando llegan a su saturacion (no dan mas de si) y se considera generalmente un elemento nocivo para el sonido. Aun asi, a veces se utiliza como elemento creativo, como la distorsion que producen los amplificadores para guitarra electrica.

Relacion entrada/salida de una distorsion por saturacion

Algunas herramientas informaticas, como el CoolEdit y el GoldWave permiten practicar distorsiones mediante la especificacion grafica de su funcion de transferencia.

Lo que se explica mas adelante son diversos tipos de distorsion en el dominio dinamico (Compresores, expansores, puertas de ruido..) que se utilizan para algunos casos concretos. Debido a su uso frecuente, los programas de edicion suelen permitir aplicarlas directamente, especificando los parametros que las definen.

5.2.2. Compresores y limitadores

La compresion es un control de nivel automatizado. Basicamente lo que hace es reducir el nivel de sonido cuando este es muy alto y amplificarlo cuando es muy bajo. Normalmente lo hace siguiendo una relacion entrada salida como sigue:

Relacion entrada/salida de un compresor tipico

Mediante la compresion se consigue un nivel de grabacion uniforme, ademas de evitar las distorsiones debidas a saturacion. Manejado correctamente, da a la grabacion un aire de profesionalidad. Es del todo aconsejable trabajando con voz pues le da una candencia muy maja, asi, se utiliza mucho en radiodifusion y en estudios de grabacion cuando trabajan con cantantes.

Pero, como se maneja un compresor? Veamos primero los controles que suelen llevar los compresores analogicos y despues lo aplicaremos al audio digita.

Este ultimo control se ve mas claramente si tenemos en cuenta el caso del audio digital. Supongamos que la senyal se codifica con 8 bits lo que da niveles de 127 a -126 la senyal es simetrica asi que en lo que sigue tendremos solo en cuenta la parte positiva de 0 a 127.

Imaginemos que ponemos el threshold a 107 y una relacion 1:2 (no en dB sino en niveles de cuantizacion). El nivel maximo que adoptaria la salida del compresor seria 117 lo que nos deja 10 niveles por arriba y 10 por abajo sin utilizar. La amplificacion ha de ser tal que maximize el nivel 117 a 127 para aprovechar mejor el dominio dinamico.

Frecuentemente existen otros controles que permiten hacer ajustes mas sutiles de la forma en que se aplica la compresion.

6.2.3. Expansion y Noise Gating

Un expansor tiene la fuhcion inversa a un compresor. Amplifica los niveles altos y disminuye los niveles bajos.

Relacion entrada/salida de un expansor

Es un efecto que se suele utilizar para hacer sonar una guitarra, bajo o bateria de forma mas seca y contundente.

La mayoria de parametros que se configuraban en la compresion se pueden apliar en la expansion, solo que, en vez, de reducir el nivel de los valores por encima del threshold, como hace el compresor, reduce el nivel de los valores por debajo, y por tanto el ratio se refiere a la parte por debajo del threshold.

Las puertas de ruido son expansores en los que la disminucion de nivel por debajo del threshold es total. Sirven para reducir el ruido que se produce en los intervalos de silencio.

Relacion entrada/salida de una puerta de ruido

El principal inconveniente de esta funcion de transferencia es que un desvanecimiento gradual de una nota al pasar por una puerta de sonido acabaria bruscamente cuando llegara por debajo del nivel de threshold. Esto se puede arreglar ajustando diversos parametros:

Se dice que esta funcion de transferencia elimina el ruido pues se encarga de enmudecer las señales pequeñas que son las que contienen mayor relacion señal ruido (Ver secciones anteriores) En las señales de nivel alto el ruido es en proporcion mas pequeño y en consequencia, menos percebible.

Las puertas de ruido se suelen utilizar con niveles de threshold mas bien bajos pero tambien se usan como efecto con niveles altos.

5.3. Filtrado frecuencial

Pendiente

6. Preparacion

Una vez obtenidos y tratados los samples, no se suelen utilizar tal cual, para hacer musica. Todos los procesos anteriores eran aplicables a cualquier aplicacion de audio como, por ejemplo, . Los procesos que se explican a continuacion van dirigidos mas concretamente a la programacion de instrumentos musicales: Optimizar el espacio en memoria, afinar, crear bucles y envolventes, montar instrumentos complejos con mas de un sample...

Parte de estas tecnicas ya se ven por encima en el tutorial de Trackers. Aqui se pretende detallar mas dichas tecnicas y ampliar horizontes mas alla de los trackers.

6.1. Optimizar el uso de la memoria

Uno de las principales limitaciones de la tecnica del sampling es la del espacio que albergan los samples en la memoria, en el disco duro o donde sea que se almacenen. Frecuentemente es necesario limitar ese espacio para lo cual se pueden aplicar diversos procedimientos.

6.1.1. Recorte, y eliminacion de silencios

Frecuentemente, cuando grabamos un sample, grabamos gran cantidad de silencio, por delante y por detras, es conveniente recortar este silencio. La funcion del editor que hace esto es Trim.

Tambien podemos recortar algo del sonido, cuando se desvanece la nota. Esta opcion ya quita algo de calidad al sample pero en muchos casos es mas que aceptable.

A veces, ya sea por recorte o por que estaba grabado asi, queda un corte brusco indeseado al inicio o al final del sample. Para eliminarlo lo mejor es hacer un fade out al final o un fade in al inicio, aunque sean muy cortos, eliminan el click.

6.1.2. Resampleado

Otra opcion es rebajar la calidad del sample. Resamplear a una frecuencia de muestreo inferior eliminara algunas frecuencias y podra dar problemas a la hora de hacer el pitch shifting pero el resultado puede ser muy aceptable sobretodo en bajos, bombos e instrumentos con pocos armonicos agudos.

Si estas muy limitado tambien puedes considerar bajar los bits de profundidad o otro parametro de calidad. Hace falta un poco de criterio para ver en que sitios bajar la calidad tendra menos consecuencias.

6.1.3. Compresion espacial

La compresion espacial es la solucion perfecta pero necesita ser soportada por el soft o el hard con el que trabajamos. La compresion sin perdidas es la ideal para obtener mayor calidad, pero si nos sigue premiando el espacio a veces vale la pena utilizar compresion con perdida.

Vamos a clasificar los metodos de compresion en cuatro grandes grupos desde el punto de vista del audio.

6.2. Afinacion (Tunning)

Los samplers tienen la capacidad de variar el tono de las muestras para obtener diversas notas a partir de una sola nota grabada. Esto lo hacen reproducciendo la muestra mas rapida para tonos agudos o mas lenta para tonos graves. Tambien hay algunos algoritmos mas o menos sofisticados para hacer time streeching que consiguen variar el tono de la muestra sin variar su duracion.

Sea cual sea la tecnica, el sampler necesita tener una referencia que ligue una nota y una frecuencia de reproduccion para la muestra, para calcular el resto de notas. Afinar un sample es controlar esta referencia.

Razones por las que variar la afinacion de un sample:

A continuacion, comentamos como afinar diversos tipos de samples:

Manten siempre los samples melodicos afinados de forma que cuando toques un C4 suene un C4 o como minimo un C de otra octava. Aunque, en un principio, usar un sample desafinado pueda sonarte bien como un elemento de discordancia, a la que añades canales, el resultado da mas sensacion de mala calidad que de otra cosa.

Es util saber que de octava a octava la frecuencia de reproduccion se dobla, y que, para cada semitono, como hay doce en una octava, se multiplica o divide por log12(2)=1,059463094359

Los samples obtenidos de instrumentos melodicos, por lo general, los ajustes de tono necesarios son de semitonos enteros, pues los instrumentos que grabamos suelen estar afinados solo que al igual tocamos una nota diferente a la que tomamos de referencia.

Los sonidos realistas y efectos que tengan que sonar como en un principio se grabo, afinalos para que todos suenen en su tono original para una misma nota. Por ejemplo que suenen todos naturales en C4. Con esto te evitas ir buscando cual es la nota que suena tal cual se grabo, siempre la C4 es la natural.

Depende del uso ke le des a los samples de percusion, los afinaras como los samples melodicos o lo haras como los sonidos realistas.

Las secuencias de bateria, es bueno afinarlos para que suenen a un tempo determinado con una determinada nota. De forma que, si juntas varios y los tocas con la misma nota, suenen sincronizados. Hay gente que prefiere trabajar con varios tempos normalizados y afina los loops al tempo normalizado que mas se acerque, para no desnaturalizar demasiado los sonidos.

De todas formas, conviene tener en algun sitio apuntado, tanto el tempo al cual esta afinado el loop como el tempo original para hacerte una idea de hasta que punto se desnaturalizara el sample. Cuando lo vayas a usar solo tienes que variar otra vez la frecuencia

Como ajustar el tempo de un loop de bateria ajustando su frecuencia de reproduccion?

6.3. Bucles (Loops)

Pendiente: Redactar y completar (Ver el documento sobre Trackers)

6.3.1. Concepto

La longitud de la nota suele controlarse controlando el tiempo que el sample está sonando. Si se intentan hacer notas demasiado largas, el sample se acabará antes de tiempo.

Es más, si se opta por agotar el tiempo del sample, tendremos que, para tonos más agudos, la duración de éste será menor que para tonos muy graves pues en los agudos se reproduciría más rápido.

Cuando uno no se puede permitir grabar un sample indeterminadamente largo se recurre a los loops.

Un loop es la reproducción repetitiva de una región de la muestra que permite hacerla durar el tiempo que se desee. De esta forma obtenemos más plasticidad en la duración de la nota ahorrando espacio.

Un loop tiene sentido en los intrumentos en los que se llega a una región estable en que el sonido se vuelve muy similar de forma que no se note la repeticion. Los organos y las cuerdas son instrumentos típicos que se benefician a menudo de esta técnica.

6.3.2. Ajuste del bucle

Para establecer un loop, hay que determinar los puntos de inicio y final de este. Ello ha de hacerse de forma muy cuidada para evitar los clicks mantener una sensación de continuidad. Para evitar los clicks hay que hacer que los samples en los puntos de loop sean continuos y tengan la misma pendiente.

TODO: Grafiqueta condiciones loop

En el tutorial sobre Trackers, puedes seguir un ejemplo de ajuste de loops.

A parte de los clicks, también iteresa mantener una sensación de continuidad que queda rota si hay alguna característica del sonido que varia o oscila con el tiempo. Estas características pueden ser la amplificación, la distribución de frecuencias, el timbre del sonido...

La clave esta en localizar las oscilaciones y hacerlas coincidir con el loop, y en compensar las variaciones progresivas con un editor de sonido. De todas formas, es comun que haya varios parámetros que oscilen y no sea posible encontrar un ciclo valido. Es lo que suele pasar con los acordes: la superposicion de frecuencias crea oscilaciones irregulares en el sample que cuesta mucho adaptar a un loop.

6.3.3. Direccion

Los bucles, al principio, siempre se reproducían para adelante. Es decir, cuando se llegaba al final de la región definida como bucle, se volvía al inicio de dicha región y otra vez a empezar.

Muchos samplers actuales permiten controlar la dirección en la que se reproduce el loop de forma que podemos configurar el loop para que valla siempre para adelante o que valla alternativamente para adelante y para atras. Este otro tipo de bucle (llamado Ping pong loop en contraposición al Forward Loop) permite que en el cambio de dirección esté asegurada de por sí la continuidad al ser la onda simétrica a la que se acaba de reproducir. Para evitar totalmente el click, solo hay que hacer que en los puntos de loop, la pendiente sea plana para que sea la misma tanto a la ida como a la vuelta.

TODO: Grafiqueta condiciones loop ping pong

Cabe decir que al reproducir la onda hacia atrás no siempre se obtiene un sonido similar y, a menudo, suena bastante raro. Esto a veces puede ser un recurso creativo más para el músico, así que algunos samplers permiten también el backward loop, que, a nivel de implementación en la máquina, no cuesta mucho más.

6.3.4. Pulsación y postpulsación

6.3.5. Otras consideraciones

Loops:
- Loop detuning (debido a loops cortos)
- Durante cuanto tiempo
- Tecnikas de autoloop: Buscar zeros, timbres, pendientes... Suffle
- Forzado de loop

6.4. Envolventes y ADSR's

Pendiente (Ver el documento sobre Trackers)

6.5. Multisamples. Regiones

6.5.1. Limitaciones con un unico sample por instrumento.

La tecnica del desplazamiento de tono que se usa en sampling (para obtener todos los tonos de un instrumento a partir de una sola grabacion), pierde en veracidad por una serie de inconvenientes:

La solucion a estos problemas pasa por no abusar del desplazamiento de tono y repartir, a lo largo de las octavas del instrumento, diversas grabaciones del instrumento con tonos diferentes. Para obtener la maxima calidad, se deberia utilizar una grabacion por tono, pero ello requeriria mucho espacio por lo que, en la mayoria de casos basta con menos.

6.5.2. Regiones.

La forma mas sencilla de combinar distintos samples para formar un instrumento complejo es definir lo que se suele llamar regiones. Es decir, una gama de notas consecutivas, en las que se toca un mismo sample.

Ejemplo de definicion de regiones

Casi siempre interesa definir para cada region, en que tono se empieza a tocar el sample. Si es un sample melodico, los siguientes tonos de la region seran los consecutivos y la mayoria de samplers asi lo configuran.

Pero existen otras aplicaciones muy practicas de las regiones. Aquellas que precisan lanzar agilmente, sin tener que cambiar de instrumento, un grupo de sonidos diferentes que no requieren desplazamiento de tono. Por ejemplo:

En estos casos, nos interesa definir las regiones con un solo tono, que sera el tono natural, para cualquier nota dentro de la region. La utilidad de esta tecnica reside en el hecho de que podemos lanzar uno o otro sample simplemente cambiando de nota.

6.5.3. Capas (Layering).

Volviendo a los instrumentos melodicos, la definicion de regiones aun tiene algunos defectos que a veces hacen que los instrumentos no suenen veridicos. Si tocamos una progresion de notas, en el momento que acaba una region y empieza otra, a menudo se nota demasiado el cambio de sample.

Una solucion algo costosa (en cuanto a memoria de nuestro sampler) es insertar mas regiones en medio. Si no disponemos de sonidos grabados para ello, una buena solucion suele ser generarlos nosotros a partir de mezclas progresivas de ambos sonidos. Es lo que se llama un fundido progresivo de samples. Creamos una serie de regiones intermedias y, a cada nueva region, le asignamos un nuevo sample resultado de mezclar los dos samples originales, con mas carga de uno o otro segun lo cerca que este de cada region original.

Como siempre, el usar mas sonidos grabados por instrumento ocupa mucha mas memoria. Por suerte, algunos samplers, utilizan otra tecnica, que, entre otras cosas nos soluciona esto. Dicha tecnica se llama layering y se basa en definir para cada instrumento una serie de capas. Por cada capa, puede sonar simultaneamente un sample para la misma nota. Si tenemos 3 capas definidas, quiere decir que cuando apretemos una tecla, sonaran hasta 3 samples a la vez.

Cada capa define sus propias regiones, cada region su sample. Como dentro de las regiones se nos permite definir los volumenes de cada nota, podemos hacer el fundido de forma automatica sin usar samples adicionales. (Pitch CrossFadding)

Claro que esta tecnica tambien tiene sus costes. Si nuestro sampler tiene, por ejemplo, una polifonia de 18 notas, (permite hacer sonar 18 notas a la vez), por cada nota que toquemos simultaneamente de un instrumento de 3 capas, se consumiran 3 notas de polifonia. En vez de 18 notas podremos tocar solo 6.

Otras aplicaciones del layering, a parte del fundido de samples por tono, es la simulacion de instrumentos con una parte melodica que usa desplazamiento de tono y otra percusiva que no lo usa. Era una de las cosas que, como ya comentamos, hacian que algunos instrumentos de percusion melodica, como el xilofono, sonasen irreales cuando desplazabamos el tono de ambas componentes a la vez.

6.5.3. Conmutado y fundido por velocidad.

A pesar de todos estos artificios, los instrumentos reales, tienen mucho mas juego del que puedan dar todas estas tecnicas. Segun como y donde pulses una cuerda de una guitarra sonara muy distinta, un instrumento de viento abarca miles de timbres segun la forma de soplar del instrumentista.

Todos estos timbres diferentes, se pueden dar para una misma nota, y, con las tecnicas que conocemos hasta ahora, solo podiamos diferenciar sonidos entre notas diferentes. ¿Como podemos simular los cambios de timbre segun la forma de tocar?

Una forma sencilla de diferenciar distintos timbres es la velocidad, es decir, la fuerza con la que se toca la nota. A menudo los samplers traducen la velocidad al volumen con el que se reproduce el sonido. Pero, si tienes a mano cualquier instrumento no electronico y lo haces sonar flojo y fuerte, comprovaras que no solo varia el volumen, sino tambien el propio sonido.

Esto se puede simular creando una capa para cada sonido diferente y activando una o otra para cada gama de valores de velocidad. Es lo que se denomina Conmutado por velocidad. (Velocity Switching)

Por ejemplo, queremos hacer un saxo, que cuando pase de una cierta velocidad suene como roto, como hacen los saxos de verdad cuando das un soplido repentino. Para ello, haremos una capa con un saxo 'normal' que sonara solo para velocidades MIDI del 1 al 50. Despues definiremos otra capa para velocidades 51 a 63 que contendra un sondido de saxo 'roto'.

A veces, el conmutado de samples por velocidad es demasiado brusco, y tenemos que buscar soluciones, para hacer el cambio mas sutil, muy parecidas a las que teneniamos en la division en regiones: Podemos insertar capas con mezclas de los dos samples, o podemos hacer un fundido progresivo de dos capas segun la velocidad (Velocity CrossFadding). Tambien nos surgen los mismos inconvenientes: Insertar capas con samples mezclados ocupa mas espacio y las tecnicas de fundido nos quitan polifonia.

En principio, se utiliza la velocidad, pues es un parametro que la mayoria de instrumentos MIDI profesionales envian de por si. Para hacer cosas mas realistas, se hacen servir otros parametros. Pero piensa que solo los samplers mas caros consiguen llegar a un punto de similitud aceptable, y con instrumentos que requieren horas y horas de programacion que dificilmente podra dedicar el musico comun para crear los suyos propios. Aunque hay quien se los curra aunque solo sea para hacer demos de los samplers que vende.

Siempre es un compromiso entre la calidad que queremos obtener y los recursos de tiempo y de maquina que tengamos (memoria, polifonia...).

6.5.4. Consejos para instrumentos multisample.

Aqui teneis algunos consejos a la hora de hacer multila

7. Trucos y consejos

- Reordena y conoce tu coleccion de samples. Aunque sean tuyos cuando tienes muchos...
- Haz backups. Seguro que has oido a gente quejarse de haver perdido su libreria de samples.
- Montate plantillas vacias de instrumento multisample para ahorrar tiempo.
- Si vas a loopear, no utilizes nunca samples en estereo, son imposibles.
- Un sample de 'mala calidad' o poko realista no tiene por ke no ser creativo.
- Utiliza equalizacion diferente para cada sample para que no se empotinguen en la mezcla.
- Mezcla con la percusion un instrumento melodico.
- Gana profundidad duplicando un sample, desafinando uno un poko, y repartiendolos en el panoramico
- Da la vuelta a los samples. Se consiguen efectos sorprendentes.
- Voces: Juntalas, tapando los espacios de cojer aire para crear desasosiego
- Loops de bateria: Retarda, avanza, redispara, invierte, offsetea, mezcla...
- Parte las secuencias de percusion y reordenalas aplicandoles diferentes filtros, efectos...
- Simular grooves's: Intentar imitar loops de bateria que tengas en tu coleccion con programacion y ves aprendiendo de las diferencias.

Apendice A: Conceptos basicos

Este apendice contiene conceptos que, en el resto del libro se dan por sabidos y que se incluyen aunque sea en un apendice para que ningun lector, del nivel que sea, se quede perdido.

A.1 Formas de onda

Una forma de onda (wave form) es una representacion de la evolucion a lo largo del tiempo de un sonido, o mejor dicho, de las variaciones en la presion del aire que producen el sonido. La grafica siguiente es un ejemplo.

Ejemplo de forma de onda

La misión de un microfono es generar una senyal eléctrica con la misma forma de onda que las variaciones de presion que le llegan. La funcion del altavoz es la inversa: convertir la señal electrica en variaciones de presion moviendo su membrana.

A.2 Espectro frecuencial y respuesta en frecuencia

Cualquier sonido se puede descomponer como suma de infinidad de senyales sinosoidales de diferentes frecuencias. La distribucion de la intensidad segun las frecuencias se llama espectro frecuencial. En muchos programas informaticos se refieren a esto mismo con el termino analisis o transformada de Fourier La transformada de Fourier es la herramientas matematica que se utiliza para calcular el espectro a partir de la senyal en el tiempo.

Todas las frecuencias de un sonido no se propagan de la misma forma por el medio, ni las reproduce igual un altavoz, ni las percibe igual un micro o el oido, ni las almacena igual un soporte. La respuesta frecuencial de algo se puede representar en un diagrama de Bode, que indica el grado de atenuacion, amplificacion o retraso de cada frecuencia. Seguro que lo has visto en la parte de atras de alguna cinta virgen de audio o en las especificaciones de un altavoz.

A.3 Codificacion binaria

La numeracion binaria es una forma de codificar los numeros segun una secuencia de unos y zeros. La numeracion convencional o decimal (de base 10) usa 10 digitos: del 0 al 9. Para contar contamos del 0 al 9 y, entonces, tenemos que usar un segundo digito para escribir el 10 i seguimos: 11 12... 99, 100, 101.... 999, 1000.... El sistema binario utiliza solo 2 digitos el 0 y el 1, asi que vamos a contar con ellos: 0, 1... i ahora? pues añadimos un uno al lado y empezamos de nuevo: 10, 11... otro uno 100, 101, 110, 111, 1000... Parece facil no?

Para pasar de una base a otra, tenemos que tener en cuenta que cada digito tiene un peso asociado: En el sistema decimal que nosotros usamos, como la base es 10 el primer digito vale 100=1, el segundo 101=10, el tercero 102=100... Con las bases 2 i 16 funciona igual. Para tener una referencia las potencias de dos valen: 1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024,,.

La ventaja de la codificacion binaria es que los unos y ceros son facilmente almacenables segun la presencia o la ausencia de algo: Carga electrica (memorias RAM), magnetismo (discos duros) o agujeros (CD).

Bibliografia, Links y Referencias

Agradecimientos

Manual realizado por Vokimon