После девяти месяцев разработки доступен мультимедиа-пакет FFmpeg 4.2, включающий набор приложений и коллекцию библиотек для операций над различными мультимедиа-форматами (запись, преобразование и декодирование звуковых и видеоформатов). Пакет распространяется под лицензиями LGPL и GPL, разработка FFmpeg ведётся смежно с проектом MPlayer.
Из изменений, добавленных в FFmpeg 4.2, можно выделить:
- Добавлена возможность использования Clang для компиляции ядер CUDA;
- Реализована поддержка декодирования формата AV1 с использованием альтернативного декодировщика dav1d, развиваемого проектами VideoLAN и FFmpeg. Dav1d ориентирован на достижение максимально возможной производительности декодирования и обеспечение качественной работы в многопоточном режиме;
- Добавлены распаковщики медиаконтейнеров (demuxer) dhav, hcom и vividas, KUX и IFV;
- Добавлен кодировщик PCM-DVD;
- Добавлены декодировщики VP4, hymt, hcom, ARBC, agm и lscr;
- Обеспечена поддержка декодирования содержимого HEVC 4:4:4 с использованием движков аппаратного ускорения NVIDIA nvdec и cuviddec, а также используя API VDPAU (Video Decode and Presentation);
- В упаковщике медиаконтейнеров mov обеспечена запись треков без явного определения языка (ранее по умолчанию указывался английский язык);
- Новые фильтры:
- asr — автоматическое распознавание речи с использованием движка PocketSphinx;
- derain — удаляет дождь с видео, используя систему машинного обучения на базе нейронной сети RESCAN и готовые модели;
- freezedetect — определение отсутствия изменений на видео (неизменяющегося определённое время изображения);
- tpad — добавление добавочных наборов кадров в начало или конец видеопотока;
- dedot — сглаживание артефактов яркости и цвета (точечные блики и радуга) на видео;
- chromashift/rgbashift — сдвиг цветовых составляющих пикселей по горизонтали и вертикали;
- truehd_core — извлечения базового потока из TrueHD, отбрасывая метаданные ATMOS;
- anlmdn — подавление широкополосного шума в звуковом потоке при помощи алгоритма нелокального усреднения;
- maskfun — создание маски на основе поданного на вход видео;
- AV1 frame split — разделение кадров в потоке AV1;
- lagfun — замедление изменения цвета тёмных пикселей (увеличения времени отображения ярких вспышек);
- asoftclip — мягкая обрезка звука (постепенное затухание амплитуды вместо резкого обрыва сигнала);
- colorhold — удаление информации о всех цветах RGB кроме заданного;
- xmedian — выделение среднего пересечения пикселей для нескольких входных видео;
- showspatial — преобразование стереозвука в видео, отображающего пространственное взаимодействие между двумя звуковыми каналами;
- deesser — удаление искажений из-за некачественного микрофона или чрезмерного сжатия звука при записи голоса (устраняет эффект звука как в банке).
- В состав включён парсер для изображений в формате GIF;
- Добавлена поддержка субтитров в кодировке ARIB STD-B24 (профили A и C), используемых при потоковом вещании MPEG-2 TS. Поддержка реализована через применение библиотеки libaribb24;
- Удалена библиотека libndi-newtek.
Источник: http://www.opennet.ru/opennews/art.shtml?num=51227