Matemáticamente lo que hacemos es convertir una función continua, formada por un número infinito de puntos, en una función discreta, formada por un número finito de puntos, concretamente 44100 puntos por cada segundo de sonido. Observamos la misma onda de sonido del ejemplo anterior formada por los puntos mencionados:

En la imagen anterior, cada 1/44100 partes de segundo hay un punto. La coordenada “x” de cada punto representa el tiempo y la coordenada “y”  la intensidad de la corriente eléctrica (y por lo tanto, la posición del tímpano).

Las coordenadas “y” son números que se guardan en una matriz. La matriz tendrá 44100 filas por cada segundo de sonido y 2 columnas (una para el altavoz izquierdo y otra para el derecho). La coordenada “x” no se incluye en la matriz ya que por defecto en el formato de sonido WAV (es el formato en el cual se graba el sonido sin ser comprimido) se toma una muestra cada 1/44100 partes de segundo y así cuando se reproduce el sonido el “media player” (del tipo que sea) utiliza este intervalo de tiempo entre los puntos.