А без нейросетей уже даже звук с видео склеить нельзя?