к.т.н. Руцков М.В.

 

Дурная наследственность

 

Как и обещал, выдаю статью на техническую тему. Но всё ж не могу сдержаться, поэтому “пара ласковых” - в качестве вступления. Итак, довелось мне недавно прочитать завораживающую публикацию из одного солидного издания по безопасности. Что б не ходить вокруг, да около - сразу выдаю выдержку оттуда, дословно:

 В одном из подразделений военной разведки на советско-китайской границе произошло событие, которое по праву можно назвать днем рождения одного из самых динамично развивающихся сегодня направлений отрасли обеспечения безопасности”.

О как – уже интересно! Посмотрел далее и просто обомлел:

Время, напомним, было перестроечное. Не за горами – распад великой некогда державы. Массовый исход людей, секретных сведений, военного имущества и прочих ценностей за границу. Всё – на продажу! Государственные интересы у тогдашнего чиновника были где-то на двадцатом месте в его личной системе ценностей”.

Ну, и это ещё как-то можно выдержать, хотя попахивает неким нигилизмом! Апокалипсис – отнюдь! Вот так, по-простому – всех под одну гребёнку. Действительно – были уроды редкие, да и сейчас имеются. Как не стыдно - так хаять всё и вся! И вдруг – луч света в тёмном царстве, цитирую дословно:

“Через четыре месяца в часть приходит посылка, в которой лежало долгожданное заветное устройство – плата ввода видео с восемью оттенками цвета в компьютер через COM-порт. Вот так в руках лейтенанта Гришанина оказалась первая и единственная в мире компьютерная система CCTV”. 

Итак, описываемые события, развивались в 1989 году. Поэтому хочу обратиться к руководству издания: “Друзья – вы хоть сами понимаете, какую ересь публикуете!”. Можно конечно предположить – журналист напортачил, так на то у вас и выпускающие редакторы имеются. Неужели так трудно было проверить - иль хорошо заплатили? Когда, например, публикуются мои статьи – в другом издании по безопасности, то в силу моей “неуправляемости”, в плане выражения собственных взглядов, всегда присутствует классическая фраза: “Статья печатается в авторской редакции”. И всё – вся ответственность с издательства автоматически снимается. Ну, так и пишите тогда: “Статья заказная – за содержание редакция ответственности не несёт”, типа объявления об интиме. И вопросов ни у кого не будет. Это ж не шуточки – тираж в двадцать тысяч экземпляров (так заявлено было), каждый из которых морочит нормальным людям головы. А потом ненароком появится очередной релиз о том, что упомянутый лейтенант в 1991-ом первым в мире на Луну слетал – по “секретному заданию”!

В “те времена” существовало навалом всякого рода  “компьютерных систем CCTV”.  Наша компания, например, уже серийно выпускала целую линейку плат ввода изображений, а до того (когда  костяк будущей фирмы работал ещё в НИИ) был реализован ряд проектов по Системам Технического Зрения. Да что там далеко ходить, в 1981 году (почувствуйте 8-ми летнюю разницу) сам лично слепил фрэйм-граббер для Института Океанологии РАН им. П.П.Ширшова. И было там 256х256х4 бита (16 градаций серого) на двойном “корыте” для “Электроники-60”. Тогда ещё и IBM PC в помине не было, только в 1986 появились. Вот нравилась мне схемотехника – до сих пор помню откуда у 155ЛА3 или ТМ2 ноги растут.

Ладно, извините за резкость – просто думайте, что печатаете, товарищи СМИ-шники! Одно дело – пропиарить, и совсем другое – переврать историю! Вот это и есть один из элементов “дурной наследственности” – сказки рассказывать. Если  не унять сию “пургу” в зародыше – заметёт по самую макушку! А теперь займёмся уже техническим анализом на тему: “Как мы докатились до жизни такой, и куда нас несёт!”. Речь пойдёт о нашем любимом - “Цифровом охранном видеонаблюдении”. Сразу предупреждаю - это лишь моё субъективное мнение.

 

 

Поля и кадры

 

 Итак, досталось сие наследие цифровому видеонаблюдению от аналогового, которому в свою очередь - от телевидения! В те далёкие времена, при разработке телевизионного стандарта, учитывались многие факторы: ограниченность полосы пропускания каналов связи, совместимость ч/б сигнала с цветным, частота напряжения в силовой сети и конечно же - нейро-физиология зрения человека. Наш мозг устроен таким образом, что может воспринимать последовательность отдельных статических картинок как единый непрерывный процесс. Но при этом частота предъявления должна быть не менее "критической частоты мельканий". Для человека она составляет 48-50 Гц.

 Далее, ещё один нейро-физиологический факт говорит о том, что мы не различаем мелких деталей движущихся объектов.  Такая же история и с цветом - на мелких деталях он не воспринимается, даже на статике. Вот отсюда и появилась чересстрочная развёртка, как способ снижения ширины полосы спектра сигнала. Видео передаётся полями с частотой 50Гц. Каждое поле содержит в два раза меньше информации, чем полный кадр. Но этого вполне достаточно - всё равно не видно мелких деталей в движении, зато мельканий нет. И всё бы хорошо, если мы смотрим кино на диване! Но у нас-то - охранное видеонаблюдение с совсем другими задачами!

При просмотре художественного фильма нет необходимости вглядываться в мелочи - всё снято крупным планом при хорошем освещении. Главное чтоб ничего глаз не раздражало! А вот в охранном видеонаблюдении всё наоборот - полно мелких  слабоконтрастных деталей! И основная работа сводится к просмотру стоп-кадров. Сразу возникает естественный вопрос - а как этот стоп-кадр получается? Если просто из двух полей собрать, с соблюдением чересстрочности, то получим характерное двоение движущихся объектов. Тут уж вообще ничего не разберёшь. Поэтому стоп-кадр надо выращивать из одного поля путём дублирования строк с интерполяцией. И никакой деинтерлейсинг не поможет, но об этом чуть позже. Кстати, упование на “целительные свойства” этой процедуры - является одним из самых глубоких заблуждений! Сделать ничего нельзя - между полями интервал в 20 миллисекунд! Ну, какая ерунда - так мало! А вот и нет - например, при скорости 6 км/час объект за 20 мс смещается на 3.5 см. Соответственно получаем два носа и четыре глаза, а это ещё не самая высокая скорость! Да и перемещения не всегда линейны - поворот головы, например!

Тогда естественно возникает вопрос - зачем писать полный кадр 768х578 пиксел (европейский стандарт), если стоп-кадр всё равно выращивается из одного поля - 768х288. А может быть пойти ещё дальше – работать с четвертушками 384х288. Экономия дискового пространства ещё больше будет. А вот и нет - более высокое горизонтальное разрешение легко разменивается на общее. Например, проверено на практике,  что для распознавания автомобильных номеров, при работе с полями, ширина зоны захвата равна 3-ём метрам, а при использовании четвертушки - только 2-ум! Кроме того, надо опять учесть физиологию зрения - по горизонтали пространственная чувствительность выше, что обусловлено развитием стереозрения. Основными ориентирами для определения дистанции, древним людям служили деревья - в лесу они жили и охотились. Ну, это уже лирика. А вот наличие аналоговых мониторов с разрешением в 800 и более ТВ-линий - говорит само за себя. Вроде бы всё ясно. Так почему же так настойчиво пропагандируются системы с записью полного кадра - 768х576, или у "них" - 640x480?

Итак, для просмотра стоп-кадров полноформатная запись - 50 поле/с не даёт никаких преимуществ перед записью только чётными или только нечётными полями со скоростью - 25 поле/с. Хотя, нагрузка на систему по: ресурсам процессора,  дисковому пространству и сетевому трафику практически в два раза больше. Обычно сторонники полнокадровой записи проводят "бронебойную демонстрацию" - берут испытательную телевизионную таблицу и направляют на неё камеру, показывая потребителю более высокую разрешающую способность. А кому интересно рассматривать статический фон - вы возьмите, да дёрните таблицу, а потом покажите стоп-кадр из архива. Ведь в охранном видеонаблюдении важно видеть внедрение объекта и его действия в контролируемой зоне. А это в чистом виде - движение. Есть лишь один, но достаточно сомнительный аргумент в пользу записи со скоростью 50 поле/с. Это скорость протекания процессов. Однако для подавляющего числа приложений по безопасности вполне хватает и 6 поле/с! Тут же начинают вспоминать казино. Да, там 6 поле/с, может быть и маловато, а вот 25 поле/с - в самый раз. Так почему же всем поголовно подай полнокадровый режим - 768х576 пиксел (ещё и в цвете) со скоростью 25 кадр/с? Ладно бы для записи телеканалов – а вот зачем  это надо в охранном видеонаблюдении?

А это наследие "конкурентной гонки вооружения" - или "стахановщина"! Достаточно подробно это явление было описано мной 2 года назад в статье “Видеобум или Что день грядущий нам…”  Любой ценой превзойти конкурента! Поскольку преимущества технологии видеодетектирования в цифровых системах охранного видеонаблюдения ещё не достаточно понятны большинству пользователей, да и разработчикам тоже, то основной упор делается на достижении максимально возможных характеристик записи, как таковой! Всё начиналось с ограниченного числа мультиплексированных каналов видео, причём не с самым высоким разрешением. Однако компьютерные платформы стремительно развивались, что привело к достижению максимально возможных характеристик оцифровки стандартного телесигнала. Остался лишь один показатель, который "сорви-головы" готовы увеличивать до бесконечности - число real-time каналов на один системный блок! Уже отрапортовали о 64-ёх!!! А это - полная нелепость при современных тенденциях развития в сторону распределённых – децентрализованных систем. Наверное, в понимании тех самых “голов”, так проще убедить пользователей: "Вам нужны максимальные характеристики - вы их получите!!!". Абсолютный тупик!

 

 

Деинтерлейсинг

 

А это уже следствие  “дурной наследственности”. Деинтерлейсинг - что ж за зверь-то такой? А это - убийца "гребенки", причём безжалостный! И того не легче. Сколько ж мифов ходят-бродят об этой зверюшке. Давайте разбираться! Итак, как известно, Голливуд, да и остальная киноиндустрия, заваливает нас своей продукцией. Причём не только целлулоидными плёнками! До конца 20-го века основными носителями для просмотра сих творений на теликах, были видеокассеты, на которых всё это кино записывалось в стандарте ТВ-сигнала, т.е. наша любимая чересстрочная развёртка - 50 поле/с. Однако компьютерный прогресс стремительно прогрессировал и допрогрессировался до DVD-дисков, на которые уже можно было записывать 2-х часовые фильмы с более высоким качеством - спасибо MPEG-2-му! Про MPEG-1 даже и вспоминать не хочется – баловство. Всё бы хорошо - купил DVD-плеер, да смотри в "дурацкий ящик" - вот так телевизор окрестили. Ан нет, быстро смекнули, что и других, не менее "дурацких ящиков" навалом - компьютеры называются. Так что ж добру пропадать - надо и там поспешать. Налепили софта, губы раскатали и... - нарвались на ту самую "гребёнку"!

Суть следующая - чересстрочный ТВ-видеопоток пытаются воспроизвести на компьютерном мониторе с прогрессивной развёрткой, у которого ещё и частота регенерации значительно выше! Что получается? У телевизионного ЭЛТ-монитора нет кадровой памяти - приехало первое поле кадра (последовательно естественно, по мере прохода электронного луча), засветило люминофор и он, благодаря послесвечению - держит картинку, которая по экспоненте плавно угасает и мозг не напрягает! Затем второе поле пошло - красота. А на компьютерах всё гораздо быстрее - есть кадровый буфер, который со страшной скоростью вываливается на экран. В результате мы видим оба поля одновременно! Что-то типа кирпичной кладки - каждое поле смещено на 20 мс относительно друг друга, но торчит на экране все 40 мс! Этакое перекрытие - сначала 1-ое поле дружит со 2-ым, затем то же 2-ое - с новым 1-ым и т.д.! Значит движущийся объект "разъедется" - в нечётных строках он будет занимать одну позицию, а в чётных - другую. Вот отсюда и возникает "гребёнка". И как же с этим явлением  бороться? Знамо дело - деинтерлейсингом!

Самое простое, что придумали можно назвать - "глобально тупым деинтерлейсингом"! В изображениях просто срезаются высокие частоты - что-то типа "замыливания". Отличный результат - "гребёнка" размывается, все остальные детали - тоже! Муть конечно, зато глазу приятно - рези нет!!! Далее додумались до адаптивного деинтерлейсинга - "замыливаются" только зоны с активностью (в частном случае - движением). Красота ещё шибче - статический фон "блещет высоким разрешением", создавая иллюзию "высокого качества". Мне это напоминает мои школьные 60-ые - телевизоры тогда были "серыми" и чтобы народу жизнь такой же не казалась, кто-то, из ЦК наверное, придумал этакие плёнки. Снизу в них было зелёненькое, а сверху голубенькое, что посредине - не помню. Возьмёшь такую штучку, на кинескоп прилепишь - вроде телик цветной получается: небо голубеет, трава зеленеет!!! Однако, вернёмся к нашим .... - к нашему адаптивному деинтерлейсингу. С фоном-то всё хорошо, а вот фрагменты с движением - именно то, что нам и нужно в охранном видеонаблюдении, безжалостно "сглаживаются"! Дай бог, если эта процедура выполняется только при выводе на экран. Если сие сотворить на платах с аппаратной компрессией до записи - то потом костей не соберёшь, всё будет утеряно для стоп-кадрового просмотра! Ну и, наконец, "шибко умный деинтерлейсинг". Там такое "колдовство предикативное" идёт, что на экране появляется даже то, чего на самом деле и не было!

Итак - сухой остаток! Проблема - "гребёнка", появляющаяся при воспроизведении источника с чересстрочым ТВ-сигналом (а все аналоговые и даже некоторые цифровые камеры такие) на компьютерном мониторе с прогрессивной высокоскоростной развёрткой. Про 100-герцовые телевизоры пока говорить не будем, там своя песня. Есть три варианта решения:

1. Упереться рогом и, используя деинтерлейсинг, "скрашивать" картинку для глаза. То есть - тащить в охранное видеонаблюдение всё, что наработала мультимедийная индустрия для просмотра "Голливуда" на компьютере! Напряг для системных ресурсов самый высокий. Причём можно угробить деинтерлейсингом всю изначальную информацию для просмотра стоп-кадров.

2. Поставить специальный преобразователь чересстрочного потока - в стандартный ТВ-сигнал  и смотреть сие хозяйство на классическом аналоговом ТВ-мониторе. Кстати это подсознательная мечта любого охранника! Но для обыкновенного "unlimited Интернет-качальщика" - слишком большие расходы. Абсолютно разные мечты, да и категории!

3.  Решить задачу путём изменения самой постановки задачи - писать только полями! Деинтерлейсинг исчезает - как класс! Преимущества более чем очевидные - снижение нагрузки на процессор, системную память, периферийную шину, диски и сеть! Стоп-кадр не страдает.

Так почему ж такая упёртость в вариант "Number One"? Вот и пойми русскую душу! Видать песен дурных наслушались и других приучили! Хочу обратить особое внимание на тот факт, что деинтерлейсинг – это чисто мультимедийное изобретение, которое бездумно перетащили в охранное видеонаблюдение. Ведь так проще, да голову напрягать не надо. И как бы не совершенствовались алгоритмы в этом направлении, надо понять следующее – сам подход порочен! Выход только один – работать с полями или переходить на камеры с прогрессивной разверткой.

Думаете на этом  “дурная наследственность” исчерпывается? Да ничего подобного – “тащат” всё подряд! Но об этом уже в следующей статье. 

Об авторе: Руцков Михаил Вадимович, кандидат технических наук, директор   MegaPixel Ltd., e-mail mailto: megapixel@tochka.ru тел. (495) 412922

 

Rambler's Top100