Le problème n'est pas lié au framerate... enfin si, mais pas que

Déjà il est important de bien faire la différence entre deux choses que tu confonds dans ton explication : framerate et bitrate.
Le framerate n'est ni plus ni moins que le nombre d'images/s (Encore qu'utiliser la seconde comme base de temps n'est qu'une commodité). Et ce framerate, c'est toi qui le détermine sur ta caméra/smartphone/APN, enfin bref l'appareil avec lequel tu filmes.
En aucun cas, ce taux d'images/sec ne variera durant un enregistrement video : si tu décides de filmer en 1080 / 60 im/s, ce sera du 60 images/sec toute la durée de ton film.
Par contre, selon le format d'enregistrement choisi et si l'appareil peut le faire, le fichier obtenu pourra avoir un birtrate variable, c'est à dire un échantillonnage variable : par exemple, si une scène du film comporte peu de lumière ou bien une teinte de couleur assez uniforme à un moment donné, le bitrate diminuera (et donc le poids du fichier) car la scène nécessitera moins de détails et donc moins de "calcul", ainsi, l'échantillonnage pourra être réduit.
Le bitrate variable n'a absolument aucune influence sur un quelconque décalage son/image.
Le framerate, comme on l'a vu, est
fixe, donc question : qu'est ce qui peut bien provoquer un décalage son/image après un montage ?
La réponse est dans la question : c'est le soft de montage qui est en cause, enfin plus précisément
le paramétrage du soft de montage.
Imaginons que tu filmes un cover avec un smartphone capable de faire du 60 images/sec : si ta video fait 3 minutes, tu obtiens donc un fichier avec une succession de 10800 images (3 x 60 x 60) + une piste son "indépendante", le tout dans un container video.
Tu vas donc créer ton projet dans ton soft de montage, et logiquement ce dernier va te demander à quel framerate tu voudras travailler. C'est là que les ennuis peuvent commencer.
Si ton projet est basé sur un framerate identique, dans notre exemple, en 60 im/s, il n'y aura bien entendu aucun problème. Si tu choisis du 30 im/s (qui est en vérité du 29,97 pur être précis), il ne devrait logiquement pas y avoir de problème de décalage non plus, simplement peut-être un léger manque de fluidité par rapport à l'original typé "video", mais pas de décalage car le soft va "jeter" une image sur 2 pour arriver à 5400 images pour tes 3 minutes. Et comme il va le faire de manière uniforme, la piste son sera toujours synchro.
Le problème c'est si tu choisis un projet avec un framerate à 25 im/s par exemple. Là, le soft va devoir faire un choix car il ne sera plus face à un pourcentage fixe de réduction de frames comme dans l'exemple précédent (60 / 30 = 2 tout le long) mais à un calcul qui ne "tombera pas juste : le rush video qu'on lui importe fait 10800 images, mais le projet lui, il dit qu'il ne peut en contenir que 4500 (3 x 60 x 25). Que va donc faire ton soft ? Eh bien il va "jeter" aléatoirement une image par ci par là , avec à la clé une video avec une image parfois saccadée, mais SURTOUT, une piste son forcément décalée puisque cette brave piste son, elle, elle se fout royalement de ce qui peut se passer au niveau de la video. Résultat : décalage image / son inévitable, avec soit une impression de ralentissement, soit d'accélération (phénomène bien connu sur certains blu-ray initialement encodés dans un framerate dit "cinéma", mais lus sur des platines incapables de prendre en compte le "vrai" 24 im/s)
Et il ne faut pas croire que faire l'inverse sera mieux, bien au contraire.
Si ta video a été filmée en 25 im/s et que tu te dis "ah ben je vais mettre mon projet en 50 images/s , ca sera mieux, car 50 c'est un multiple de 25" , eh ben raté, ca sera pire, tout au moins au niveau video. Pourquoi ? Parce que cette fois-ci ce sera le soft de montage qui AJOUTERA 1 image toutes les 2 images. Résultat : image saccadée
tout le temps.
Pour éviter ce genre de problème, la meilleure solution est de filmer si possible avec le même framerate que celui qui sera déterminé dans le soft.
L'exportation a aussi une grande importance, notamment avec le format diffusion video : en effet, maintenant que tous les appareils de diffusion, de montage, etc, sont compatibles PAL et NTSC, on a tendance à s'en foutre un peu. C'est un erreur qui peut coûter cher. Il ne faut pas oublier qu'à la base, les différents framerates que l'on connait actuellement sont issus des modes de diffusion initiaux en PAL ou NTSC, sans oublier le "standard cinema".
En gros, exportation PAL = 25 ou 50 images/ s. Exportation NTSC = 30 ou 60 images / s. Pour le 24 im/s dédié "cinema", en général les caméras, smartphones et autres ne proposent quasiment plus ce format