к.т.н. Руцков М.В.

 

Народный НаноВидеоСервер III

 

Приступим к анализу альтернативных вариантов “наладонных” процессоров, в качестве кандидатов для использования в Народном НаноВидеоСервере. Итак, первый претендент – семейство процессоров Nexperia PNX1700 от компании Philips.

 

Два года назад на них возлагались большие надежды. В марте 2005-го был анонсирован процессор TM5250, а ещё через полгода  - TM5270. В общем-то, функциональной разницы между ними не было – никакой! Просто первый предполагалось реализовать по технологическим нормам в 0.13 микрон, а второй – 0.09. Однако ничего у них не получилось – сейчас на сайте компании имеем только TM5250.  Таким образом, за два года – ни шага вперёд. Да и “наладонники” на их основе как-то не встречаются. Но наш интерес – проанализировать мощность процессора в плане обработки. Вот основные характеристики чипа в сравнении с Pentium 4:  

 

CPU

CPU clock

SIMD

L2 cache

Memory

TM5250

500MHz

4

128K

200MHz - 32bit - 1.6 GB/s

P4 Prescott

3GHz

16

1M

800MHz - 64bit - 6.4 GB/s

 

 

Вы, конечно, спросите – а причём тут Pentium 4? Объясняю, нам надо сделать грубую прикидку – потянет ли TM5250 один канал по видедетекции иль нет. Причём этот анализ будет проведён исключительно для наших алгоритмов – мы ведь не знаем, как работают другие системы, хотя слегка и догадываемся. Отправной точкой можно считать тесты нашего 8-ми ствольного Вдеопроцессора MegaFrame-X. Таких в системный блок было установлено 2 штуки – 16-ть каналов реального времени. И выяснилось, что для данной конфигурации машины - это почти предел. А теперь сравним процессоры (приведённые в таблице) по скорости обработки. Напомню – наши алгоритмы ориентированы на SIMD-технологии.  Расшифровывается как -  Single Instruction Multiple Date. Этакий “тупой” параллелелизм – класс! В процессорах Intel - это MMX и разнообразные SSE штуковины. При таком подходе скорость обработки прямо пропорциональна частоте процессора и числу одновременно обрабатываемых операндов (байтовых) – типа “ширины”. Смотрим в таблицу – частота у Pentium в 6 раз больше, а ширина – аж в 4-ре круче. Уже получаем выигрыш в 24 раза. Но нельзя ещё забывать про размер L2 cache – 128К против 1М. Вот и получается – не тянет TM5250 даже полканала. Но ещё раз повторю – всё измерено в наших “попугаях”. Может быть, у кого-нибудь алгоритмы быстрее работают – типа межкадровой разницы, но тогда и видеодетекторы будут ещё те! А мы всё-таки пытаемся полосовую фильтрацию реализовать и другие прибамбасы. Это просчёт по скорости, по мощности потребления тоже не ахти – 2.5 ватта. А как с перспективами? Да никак! Два года ничего нового, но, кроме того, непонятно куда дальше грести – у  Philips нет процессорных решений, в частности, для персональных компьютеров. В отличие от них, Intel/Marvell будут тащить все свои наработки на мобильные платформы. О совместимости уж и не говорю – всю оптимизацию с нуля начинать надо!

А теперь займёмся компанией Texas Instruments, которая бросила смелый вызов экспансии архитектуры XScale от Intel. Но сначала хотелось бы сказать "пару ласковых" этому гиганту американской индустрии, в котором бюрократия доведена до абсурда. Мы целый год потеряли в бесконечной с ними переписке, пытаясь выяснить простой технический вопрос. Суть сводилась к следующему. Для нашего 8-ствольного ВидеоПрцессора MegaFrame-X мы выбрали чип видеодекодера TVP5040. Причём исключительно благодаря тому, что в нём был прописан параллельный интерфейс для закачки управления в регистры. Всё-таки у нас на плате их 8 стоит. Начинаем отлаживаться - интерфейс не работает! Мы им письмо - они нас в штаты, пишем туда - они в Европу. Но мы ведь русские люди - припёрли к стенке. Тогда они нам и говорят, мол, используйте последовательный интерфейс. Ну, сами понимаете - пришлось обматерить, по-английски естественно. Кончилось дело тем, что они сознались в содеянном, а вернее наоборот, тут же сняли всю документацию с сайта и предложили заменить всю купленную партию чипов на - что пожелаем. Ну, тогда мы пожелали TVP5145 - и, слава богу, всё заработало, хотя год улетел! Нам даже доброжелатели предлагали с ними судиться. Но мы слегка мозгами пораскинули и решили, что получится типа - "Бодался телёнок с дубом"! Вот такой штрих к портрету.    

Итак, есть у них такое направление - DaVinci™ Digital Media Processors. Глянешь в такую “простыню” чипов и характеристик к ним – глаза разбегаются, Аж 25 позиций, полученных методом комбинаторики из разных ядер, ускорителей и других довесков. А вот самого интересного параметра – потребляемая мощность, и нет! Нет его и в PDF-ах.  Как это понимать? А всё просто, когда сие является великим достижением, то выскакивает сразу. Например, видеодекодер TVP5150 с ультрамалым потреблением – 115 мВт в самом первом абзаце ТО. Делать нечего, пришлось идти другим путём – залезть в Интернет, да поискать. И вот что нашёл.

Компания Texas Instruments (TI) объявила о начале отгрузки тестовых образцов нового мультимедийного решения system-on-chip (SoC): TMS320DM6441, основанного на технологии DaVinci. Новый продукт рассчитан на воспроизведения аудио и видеоконтента высокого качества в компактных мобильных устройствах, включая портативные медиа-плейеры (PMP), потребительские средства видеонаблюдения, медицинские приборы, терминалы, web-камеры и другие цифровые аудио и видео решения.

Про потребляемую мощность ни гу-гу, хотя ясно, что для компактных мобильных устройств это не более одного ватта – не заряжать же аккумуляторы каждые 10 минут. Полез в “простыню” и вижу, что частота процессора чуть больше 500 МГц,  а L2 cache – всего 64 Кбайт. Облом!!! Потом нашёл ещё один интересный экземпляр.

Новый встраиваемый микропроцессор TMS320DM355 из семейства DaVinci™ компании Texas Instruments предназначен для обработки видеосигналов высокой четкости (HD) в мобильных устройствах.

Прибор кодирует и декодирует видеосигналы HD MPEG-4 SP 720p/30 fps и JPEG при 50 Мп/с (MegaPixel/s), отличается низкой стоимостью (менее $10) и малым потреблением. Подсистема обработки видеосигнала аналогична используемой в семействе DaVinci и содержит аппаратные средства предварительного просмотра (preview engine), гистограмму, средства для изменения размеров изображения (resizer) и OSD (on-screen display).

TMS320DM355 потребляет 400 мВт при декодировании HD MPEG-4. Это вдвое меньше, чем у современных приборов с аналогичными характеристиками. Потребление в дежурном режиме не превышает 1 мВт.

Ага, когда получилось малое энергопотребление, то отрапортовать можно. А что ж там в “простыне”. Да ничего хорошего – частота процессора всего 270 МГц, а L2 cache и вовсе отсутствует! Невольно глянул в самое начало “простыни” и аж заколдобился  - красавец  TMS320DM648. Частота 900 МГц,  L2 cache 512 Кбайт, PCI 32 бит/ 66 МГц… Стоп, какая такая PCI?  Нам она и даром не нужна. И действительно, чип-то для DVR-ов и плат с аппаратной компрессией предназначен. А таковые в основном произрастают на юго-востоке, причём многие используют более ранние DaVinci-чипы, на которых стоят… хе-хе – радиаторы!  Ну и последняя находка.     

Благодаря новой разработке компании Texas Instruments в ближайшем будущем смартфоны, коммуникаторы и прочие подобные устройства смогут обзавестись поддержкой HD-видео стандарта 720p (1280 х 720 пикселей). Проигрывание видео высокого разрешения станет возможным с помощью новых мощных процессоров OMAP третьего поколения. Новые продукты будут поставляться в компактных BGA-упаковках площадью 12 х 12 мм.

Флагманский процессор OMAP3430 является первым в отрасли продуктом такого класса, поддерживающим спецификацию OpenGL ES 2.0 и OpenVG, что позволит реализовать поддержку "продвинутых" 3D-игр. Также представлены менее мощные, но более дешевые модели OMAP 3420 и 3410. Все представители процессоров третьего поколения включают ядро ARM Cortex-A8 и производятся по 65-нм нормам. Отмечается, что производительность ARM Cortex-A8 в 3 раза превышает этот показатель широко распространенного сейчас ядра ARM11.

Ну, наконец-то компания свои ядра повыбрасывала и перешла полностью на Cortex-A8 от ARM. Правда добавила кучу своих акселераторов и других кусков типа Image Signal Processor. Конечно Cortex-A8 штука вроде неплохая, но производительность в 2000 DMIPS как-то не очень впечатляет.

 

 

Итак, что же можно сказать о гиганте американской индустрии. Да особо ничего – какая-то “разлапистость” наблюдается или стремление объять необъятное. Совершенно непонятно, что будет в перспективе – эксперименты по сращиванию ядер идут на ходу. И естественно, как и у Philips – нет багажа наработок по серверным и настольным процессорам. Правда у последней – “и труба пониже и дым пожиже”. Вопрос совместимости с платформой x86 тоже не решён. Математикам с программистами надо всё начинать практически с нуля – тяжёлый случай. Да и средства проектирования требуют серьёзных вложений – не всякая компания потянет такие затраты.

Ладно, а как поживает вечный конкурент IntelAMD? С совместимостью у них вроде всё должно было бы более-менее получиться. Ан нет - компания пошла своим историческим путём и родила семейство Alchemy для мобильных устройств. Причём процессоры были реализованы на базе архитектуры MIPS32, которая не имеет ничего общего с x86. В конце концов, компании AMD  это разонравилось и со словами “не получилось”, она запродала всё это хозяйство фирме RMI летом 2006-го. Посмотрим, как у них обстоят дела на данный момент – вот в частности.

 Снова «алхимия»: процессоры RMI Alchemy Au1210 и Au1250 оптимизированы для портативной электроники. Микросхема RMI Alchemy Au1250 Media Processor совместима по расположению выводов и программно с весьма успешной предшествующей моделью Au1200. Новинка обеспечивает декодирование видео в форматах MPEG 1, 2, 4wmv9, DivX и Xvid с разрешением до 720 x 480 пикселей. Однокристальное решение позволяет конструкторам проектировать универсальные проигрыватели без применения внешних компонентов для обработки данных.

По сравнению с предшественником, частота Au1250 повышена до 600 МГц, а энергопотребление снижено на 30% (в активном режиме) и на 60% (в режиме энергосбережения). Как утверждает разработчик, новый процессор является лидером отрасли по удельной производительности в расчете на единицу потребляемой мощности.

И действительно – из ТО следует, что энергопотребление на частоте 600МГц составляет 0.5 ватта. Однако на этом все прелести и заканчиваются – архитектура 32 бита против 64 бит Wireless MMX от Intel/Marvell. А если глянуть в блок-схему, то  L2 cache днём с огнём не найти!

 

 

Ну и для полного счастья нельзя не упомянуть такого монстра рынка КПК и смартфонов, как Samsung.  Вот штрих к портрету.

 Одна из сильнейших по ресурсам и мощностям производитель не выделяется своими решениями для Windows Mobile устройств. Единственная используемая платформа этой компании – Samsung S3C2442 и ее модификации. В частности, именно этот чип использует для всех новых моделей компания E-Ten. Интересно, что сама Samsung для своих моделей смартфонов и коммуникаторов выбирает решения других производителей: Marvell, Texas Instruments. Следующая платформа от Samsung – S3C6400. Отличия от предшественника сводятся к более высоким тактовым частотам процессора, а следовательно его производительности. Уровень интеграции при этом остается одинаковым, все дополнительные модули каждый производитель должен выбирать и интегрировать самостоятельно.

В общем, правая рука не знает, что делает левая. Короче ожидать какого-либо прогресса в архитектурном плане не приходится. Может быть, лень - типа и так покупают. Сами посмотрите на блок-схему -  L2 cache не наблюдается. Совместимостью тоже не пахнет

 

 Вот, собственно говоря, и всё. Выводы делайте сами. От себя лишь добавлю – серьёзным конкурентом Intel/Marvell можно считать лишь Texas Instruments. Да и то, если за системный ум возьмётся. Хотя пардон, мне ли делать со своего пригорка замечания колоссам – куда развиваться. Они решают свои задачи – мы для них со своим охранным видеонаблюдением лишь песчинка в огромном океане мультимедиа технологий! Эх, хотел ведь концептуальные выводы сделать – типа, зачем аж три статьи про Народный НаноВидеоСервер накатал. В чём смысл? Отвечу словами товарища Саахова: “Э-э, нет, торопиться не надо, торопиться не надо!”. В следующем номере – обязательно!

Об авторе: Руцков Михаил Вадимович, кандидат технических наук, директор  MegaPixel Ltd., e-mail mailto: megapixel@tochka.ru тел. (495) 4129422

Rambler's Top100