Cela se passe en deux temps. Dans un premier temps, créer une fichier texte de la forme  :

file large.mp3
outpoint 250.0

file small.mp3

file large.mp3

inpoint 250.0

Puis

ffmpeg -f concat -i list.txt -c copy combined.mp3

INPOINT :
Au point d'entrée du fichier. Lorsque le démultiplexeur ouvre le fichier, il recherche instantanément l'horodatage spécifié. La recherche est effectuée afin que tous les flux puissent être présentés avec succès au point d'entrée. Cette directive fonctionne mieux avec les codecs intra-trame, car pour les codecs non intra-trame, vous obtiendrez généralement des paquets supplémentaires avant le point d'entrée réel et le contenu décodé contiendra très probablement des trames avant le point d'entrée. Pour chaque fichier, les paquets avant le point d'entrée du fichier auront des horodatages inférieurs à l'horodatage de début calculé du fichier (négatif dans le cas du premier fichier), et la durée des fichiers (si elle n'est pas spécifiée par la directive de durée) sera réduite basé sur leur point d'entrée spécifié. En raison des paquets potentiels avant le point d'entrée spécifié, les horodatages des paquets peuvent se chevaucher entre deux fichiers concaténés.
 
OUTPOINT :
Point de sortie du fichier. Lorsque le démultiplexeur atteint l'horodatage de décodage spécifié dans l'un des flux, il le gère comme une condition de fin de fichier et ignore le courant et tous les paquets restants de tous les flux. Le point de sortie est exclusif, ce qui signifie que le démultiplexeur ne produira pas de paquets avec un horodatage de décodage supérieur ou égal au point de sortie. Cette directive fonctionne mieux avec les codecs et les formats intra-trame où tous les flux sont étroitement entrelacés. Pour les codecs non intra-trame, vous obtiendrez généralement des paquets supplémentaires avec un horodatage de présentation après le point Out. Par conséquent, le contenu décodé contiendra très probablement des trames après le point Out. Si vos flux ne sont pas étroitement imbriqués, vous risquez de ne pas obtenir tous les paquets de tous les flux avant le point Out et vous ne pourrez peut-être décoder que le premier flux jusqu'au point Out. La durée des fichiers (si elle n'est pas spécifiée par la directive duration) sera réduite en fonction de leur point de sortie spécifié.