что такое сигнальный процессор

Особенности сигнальных процессоров

Микропроцессоры — это универсальные цифровые микросхемы, в которых вычислительный блок под управлением программы может выполнять различные действия. В результате все микропроцессоры позволяют обменять свое предельное быстродействие на сложность реализуемого алгоритма. Место микропроцессоров в классификации цифровых устройств приведено на рисунке 1.

что такое сигнальный процессор. Смотреть фото что такое сигнальный процессор. Смотреть картинку что такое сигнальный процессор. Картинка про что такое сигнальный процессор. Фото что такое сигнальный процессор
Рисунок 1. Классификация микропроцессоров

Однако при создании цифровых устройств на микропроцессорах особенности решаемой задачи накладываются на архитектуру конкретного класса микропроцессоров. Рассмотрим основные задачи, которые приходится решать при обработке сигналов (вне зависимости от аналоговой или цифровой реализации схемы):

Последние три пункта из перечисленных видов цифровой обработки сигналов осуществляются на низкой частоте, поэтому обычно для их реализации требуется небольшая часть производительности процессора. Наибольшая производительность требуется при обработке высокочастотных сигналов. Это обусловлено малым временем между соседними отсчетами сигнала. За один и тот же промежуток времени требуется большее количество простых операций.

Теперь рассмотрим две первые задачи. При суммировании сигналов для выполнения операции требуется одна команда двоичного суммирования. Операция переноса спектра входного сигнала на заданную частоту требует операцию умножения и операцию формирования очередного отсчета синусоидальной функции. Это означает, что данная операция потребует большей производительности процессора по сравнению с предыдущей операцией обработки сигналов. Теперь сравним операцию суммирования и операцию умножения. При умножении двух чисел требуется вычислить несколько частных произведений и просуммировать их. Аппаратный умножитель позволяет выполнять операцию умножения за один машинный цикл процессора, поэтому наличие аппаратного умножителя является неотъемлемой чертой сигнальных процессоров.

Теперь проанализируем процесс фильтрации сигналов. При реализации частотных фильтров во временной области приходится осуществлять операцию свёртки. Типовая схема цифрового фильтра приведена на рисунке 2.

что такое сигнальный процессор. Смотреть фото что такое сигнальный процессор. Смотреть картинку что такое сигнальный процессор. Картинка про что такое сигнальный процессор. Фото что такое сигнальный процессор
Рисунок 2. Типовая схема цифрового фильтра

Из рисунка явно прослеживается последовательность одинаковых участков алгоритма. Многократно приходится умножать цифровой отсчет сигнала на коэфициент фильтра и суммировать результат с предыдущей суммой. При этом следует отметить такую особенность сумматора, как большая разрядность. Для 16-разрядного сигнального процессора разрядность чисел на выходе умножителя будет равна тридцатидвум разрядам. При суммировании нескольких чисел тоже увеличивается разрядность результата. При суммировании 256 одинаковых чисел значение результата увеличится в 256 раз, что соответствует увеличению разрядности числа на восемь разрядов (2 8 =256). Поэтому разрядность сумматора в 16-разрядном сигнальном процессоре будет равна сорока разрядам (32+8=40).

В результате мы сформировали еще одно требование к сигнальному процессору. Сигнальный процессор должен содержать в своем составе не просто аппаратный умножитель, а умножитель-накопитель данных (MAC). Причем операция умножения-накопления должна выполняться за один машинный цикл микропроцессора. Хотелось бы отметить тот факт, что операция умножения-накопления является составной частью не только алгоритма фильтрации, но и быстрого преобразования Фурье (половина базового алгоритма «бабочка»)

Теперь поговорим еще об одном методе увеличения быстродействия сигнального процессора. В обычном процессоре применяется одношинная структура операционного блока процессора. В сигнальном процессоре применяется как минимум трехшинные структуры операционного блока процессора. Это позволяет одновременно подавать на вход арифметико-логического устройства или умножителя-накопителя два операнда и записывать результат в оперативное запоминающее устройство.

Еще одной важной особенностью микропроцессоров является способ организации циклического выполнения программы (операция умножения-накопления MAC при реализации цифрового фильтра или операция «бабочка» при реализации быстрого преобразования Фурье должны повторяться заданное количество раз). В вычислительном микропроцессоре для организации цикла используется особая переменная — параметр цикла. В конце цикла эта переменная сравнивается с заданным значением (обычно с нулем) и осуществляется переход на начало цикла. В результате алгоритм фильтрации будет выглядеть следующим образом:

В сигнальных процессорах организация цикла и формирование очередного адреса коэффициента и отсчета фильтра осуществляется аппаратно, поэтому не требует дополнительного времени. Все указанные особенности позволяют увеличить быстродействие сигнального процессора, не увеличивая его тактовую частоту, в результате алгоритмическое быстродействие сигнального процессора при выполнении операций обработки сигналов многократно превосходит быстродействие вычислительного микропроцессора. Перечислим отличительные свойства сигнального процессора:

Понравился материал? Поделись с друзьями!

Вместе со статьей «Особенности сигнальных процессоров» читают:

Источник

Микропроцессор или DSP? А может, и тот, и другой?

В статье подробно рассматривается извечная проблема: что лучше выбрать, когда требуется цифровая обработка сигнала – высокопроизводительный микропроцессор или DSP? Подробно рассматриваются все аспекты проблемы, включая трудоемкость разработки и стоимость компонентов. Статья написана с точки зрения разработчика и представляет безусловный интерес для инженеров-проектировщиков микропроцессорных систем.

Разработчики систем цифровой обработки сигналов имеют широкий выбор процессоров для решения своих задач. Наряду с микропроцессорами общего назначения, традиционными специализированными сигнальными процессорами DSP, все большее распространение получают гибридные процессоры. Среди них можно выделить собственно гибридные процессоры, т.е. процессоры, имеющие характерные особенности архитектуры как процессоров общего назначения, так и сигнальных процессоров, а также процессоры с расширениями DSP (DSP enhanced processors) — процессоры общего назначения, с точки зрения архитектуры, но дополненные специализированными блоками или сопроцессорами DSP, и многоядерные системы. Некоторое представление о таком разнообразии дает рисунок 1, на котором различные семейства процессоров распределены в соответствии с их производительностью и оптимизацией для обработки сигналов. Нетрудно найти процессор под любую задачу — гораздо сложнее выбрать оптимальный вариант.

что такое сигнальный процессор. Смотреть фото что такое сигнальный процессор. Смотреть картинку что такое сигнальный процессор. Картинка про что такое сигнальный процессор. Фото что такое сигнальный процессор

Алгоритмы DSP имеют характерные особенности, определяющие архитектуру специализированных процессоров; они приведены в таблице 1 [1]. Большие объемы вычислений требуют параллелизации вычислительных блоков, а также аппаратной реализации основных функций. Соответственно изменяется и система команд — вводится основная операция умножения с накоплением, реализуемая за один цикл. Требования к высокой точности вычислений приводят к использованию многоразрядных регистров аккумуляторов, защитных разрядов и аппаратной реализации арифметики с насыщением. Для обеспечения высокой пропускной способности памяти и предсказуемости параметров доступа к данным используются гарвардская архитектура с параллелизацией доступа к памяти, специфические способы адресации (кольцевой буфер). Чтобы справиться с потоком данных в реальном времени, необходима статическая память с механизмом прямого доступа. Локальность времени исполнения обеспечивается аппаратной реализацией циклов и потоковой обработкой прерываний.

Особенности алгоритмов DSP

Особенности DSP

Большие объемы вычислений

Параллельно работающие вычислительные блоки, аппаратное ускорение основных функций DSP

Высокая точность вычислений

Многоразрядные регистры аккумулятора, охранные биты, аппаратная реализация арифметики с насыщением

Высокая пропускная способность памяти

Гарвардская архитектура, поддержка параллельных передач данных

Предсказуемость параметров доступа к данным

Специализированные способы адресации

Локальность времени выполнения

Аппаратная реализация циклов, потоковая обработка прерываний

Блок умножения или умножения с накоплением, выполняющий операцию за 1 цикл, команда умножения с накоплением

Статическая память без кэша, но с прямым доступом

Ограничения реального времени

Минимум динамических архитектурных особенностей, встроенная память (ОЗУ) вместо кэша

16-разрядные типы данных, округление, арифметика с насыщением

При выборе процессора для системы цифровой обработки сигнала целесообразно рассматривать следующие факторы:
– производительность;
– трудоемкость разработки;
– доступность, переносимость кода;
– совместимость, поддержка производителем процессоров;
– стоимость;
– размер;
– потребляемая мощность.

Быстродействие процессора определяется тремя факторами: пропускной способностью канала обработки данных, скоростью доступа к памяти и ограничениями реального времени. Скорость обработки данных определяется доступными вычислительными ресурсами и возможностью одновременной работы. Быстродействие подсистемы памяти определяется ее архитектурой (гарвардская или фон-Неймановская), схемотехникой (статическая/динамическая), наличием кэшей и механизмов прямого доступа к памяти. Возможность работы в реальном времени ограничивается недетерминированностью операций и динамическими свойствами процессора. Основные особенности каналов обработки данных в сигнальных процессорах и процессорах общего назначения приведены в таблице 2 для систем начального уровня и в таблице 3 — для высокопроизводительных систем.

Сигнальный процессор начального уровня

Микропроцессор начального уровня

Специализированные аппаратные блоки выполняют все основные арифметические операции за 1 цикл

Умножение и многоразрядные сдвиги, как правило, требуют более 1 цикла

Обычно 16-разрядный, поддерживает и целочисленные, и нецелочисленные операции

32-разрядный, возможны только целые числа

Аппаратная поддержка управления точностью вычислений: «сторожевые» биты, насыщение, режимы округления

Насыщение, округление, как правило, требуют дополнительного цикла

Ограниченный набор битовых операций

Возможен расширенный набор битовых операций

Производительный сигнальный процессор

Производительный микропроцессор

До 8 арифметических модулей

Как правило, от 1 до 3 арифметических модулей

Наличие специализированных арифметических устройств: блок умножения с накоплением, декодер Витерби

Универсальные математические устройства: блок целочисленной арифметики, устройство вычислений с плавающей запятой

Поддержка различных разрядностей данных

Поддержка различных разрядностей данных

Набор битовых операций может варьироваться от очень ограниченного до разнообразного

Возможен расширенный набор битовых операций

Аппаратная обработка округлений и математики с насыщением

Насыщение и округление, как правило, требуют дополнительного цикла

Для обработки больших потоков данных уместна концепция SIMD (Single Instruction — Multiple Data), т.е. использование одного потока команд для операций над несколькими потоками данных. В процессорах общего назначения такая обработка данных встречается только в высокопроизводительных семействах, например, PowerPC 74xx обеспечивает одновременное выполнение операций над четырьмя 32-разрядными числами с плавающей запятой или четырьмя 32-разрядными; восемью 16-разрядными или шестнадцатью 8-разрядными целыми числами. В DSP же инструкции, поддерживающие выполнение по принципу SIMD, встречаются и в самых простых моделях, пусть и в ограниченном варианте, например, только сложение двух пар 16-разрядных целых чисел. В высокопроизводительных DSP и гибридных процессорах возможности SIMD развиты не хуже, чем в мощных процессорах общего назначения.
В процессорах общего назначения используется как фон-Неймановская архитектура памяти (в системах начального уровня), так и гарвардская, как правило, в более мощных устройствах. В DSP использование гарвардской архитектуры характерно для моделей всех уровней производительности. Такая архитектура позволяет за один цикл обращения к памяти извлекать одновременно инструкцию и операнд, а в высокопроизводительных процессорах — несколько инструкций (до 8 в современных DSP и до 4 в процессорах общего назначения) и несколько слов данных от 16 до 64 бит (либо одно слово максимальной разрядности). Кэширование данных используется преимущественно в процессорах общего назначения, для DSP же характерно применение прямого доступа к памяти.
Большинство задач DSP подразумевает обработку данных в реальном времени. Процессор должен успеть выполнить требуемые операции над одной выборкой данных в потоке, прежде чем поступит следующая выборка. Помимо собственно вычислительной производительности на возможность работы в режиме реального времени оказывает влияние детерминированность и предсказуемость системы в целом. Недетерминированность приводит к неравномерной нагрузке процессора, затрудняет оптимизацию и отладку. Причины возникновения недетерминированности — многозадачность, алгоритм, изменяющийся в зависимости от данных, динамические особенности архитектуры (суперскалярность, предсказание ветвлений, зависимые от данных времена выполнения инструкций).
Динамические конструктивные особенности в большей мере характерны для процессоров общего назначения. Как правило, системы DSP строятся таким образом, чтобы избежать самой необходимости таких особенностей. В DSP начального уровня они не применяются, в производительных процессорах чаще всего используется кэширование, редко — суперскалярное выполнение и предсказание ветвлений. В процессорах общего назначения динамические особенности архитектуры, напротив, используются очень широко. В производительных системах обычно применяется суперскалярное выполнение инструкций с предсказанием ветвлений, динамическое кэширование применяется и на процессорах начального уровня. Рассмотрим перечисленные особенности более подробно.
Кэширование работает по принципу уменьшения среднего времени доступа — оно эффективно для большинства приложений, но время доступа может варьироваться достаточно широко. В то же время многие приложения, в т.ч. приложения жесткого реального времени, чувствительны как раз к максимальному, а не среднему времени доступа. Последовательность доступа к данным в системах DSP, как правило, хорошо предсказуема. Таким образом, прямой доступ к памяти может быть эффективнее кэшей. Некоторые типы кэш-памяти предоставляют возможность предварительной выборки данных. В некоторых DSP кэш может быть отключен или переконфигурирован для частичного использования как статического ОЗУ.
Предсказание ветвлений очень точно работает в большинстве приложений, в т.ч. и в приложениях обработки сигнала, где большинство ветвлений является частью цикла со счетчиком. Но сложные алгоритмы предсказания ветвлений вводят временную неопределенность. Сложно предсказать, является ли прогноз точным в конкретный момент времени.
Основные методы обеспечения высокой производительности путем одновременного выполнения нескольких инструкций — это суперскалярность и архитектура VLIW (Very Long Instruction Word) — очень длинное командное слово. В суперскалярных процессорах есть несколько вычислительных модулей, но задача распределения работы между ними решается аппаратно. Это очень усложняет дизайн процессора и может быть чревато ошибками. В процессорах VLIW задача распределения решается во время компиляции, и в инструкциях явно указано, какое вычислительное устройство должно выполнять ту или иную команду.
Суперскалярность используется в большинстве высокопроизводительных процессоров общего назначения. Ее характерные особенности:
– высокая аппаратная сложность, потребляемая мощность, большая площадь кристалла;
– сложная модель поведения, непостоянство временных параметров;
– высокая производительность при совместимости на уровне программного кода;
– низкая сложность сопутствующего программного обеспечения (компилятора).
Архитектура VLIW используется преимущественно в высокопроизводительных DSP:
– сниженная аппаратная сложность;
– отсутствие динамических особенностей поведения;
– не всегда совместимый програм­мный код;
– повышенная сложность сопутствующего программного обеспечения.

Разработка программ для процессоров общего назначения является, как правило, менее трудоемкой. Сложность вызывает реализация SIMD-вычислений (в любых типах процессоров) — компилятор не всегда оказывается эффективным. С точки зрения поддержки, для DSP доступны библиотеки и инструменты DSP, в то время как для процессоров общего назначения — библиотеки и инструменты. Особенности наборов команд процессоров общего назначения и сигнальных процессоров приведены в таблицах 4 и 5. Что характерно, у простых DSP система команд более сложная, ориентированная на специфические операции, используемые при обработке сигналов.

Сигнальный процессор начального уровня

Микропроцессор начального уровня

Источник

Многоядерный DSP TMS320C6678. Обзор архитектуры процессора

Данная статья открывает серию публикаций, посвященных многоядерным цифровым сигнальным процессорам TMS320C6678. В статье дается общее представление об архитектуре процессора. Статья отражает лекционно-практический материал, предлагаемый слушателям в рамках курсов повышения квалификации по программе «Многоядерные процессоры цифровой обработки сигналов C66x фирмы Texas Instruments», проводимых в Рязанском государственном радиотехническом университете.

Цифровые сигнальные процессоры TMS320C66xх строятся по архитектуре KeyStone и представляют собой высокопроизводительные многоядерные сигнальные процессоры, работающие как с фиксированной, так и с плавающей точкой. Архитектура KeyStone – это разработанный фирмой Texas Instruments принцип изготовления многоядерных систем на кристалле, позволяющий организовывать эффективную совместную работу большого числа ядер DSP- и RISC-типов, акселераторов и устройств периферии с обеспечением достаточной пропускной способности внутренних и внешних каналов пересылки данных, основой чего являются аппаратные компоненты: Multicore Navigator (контроллер обмена данными по внутренним интерфейсам), TeraNet (внутренняя шина пересылки данных), Multicore Shared Memory Controller (контроллер доступа к общей памяти) и HyperLink (интерфейс с внешними устройствами на внутрикристальной скорости).

Архитектура процессора TMS320C6678 [2], наиболее высокопроизводительного процессора в семействе TMS320C66xх, изображена на Рисунке 1. Архитектура может быть разбита на следующие основные компоненты:

Рисунок 1. Общая архитектура процессора TMS320C6678

Процессор TMS320C6678 работает на тактовой частоте 1.25 ГГц. В основе функционирования процессора лежит набор операционных ядер С66х CorePack, количество и состав которых зависят от конкретной модели процессора. ЦСП TMS320C6678 включает в свой состав 8 ядер DSP-типа. Ядро является базовым вычислительным элементом и включает в свой состав вычислительные блоки, наборы регистров, программный автомат, память программ и данных. Память, входящая в состав ядра, называется локальной.

Кроме локальной памяти, есть память общая для всех ядер – общая память многоядерного процессора (Multicore Shared Memory – MSM). Доступ к общей памяти осуществляется через подсистему управления памятью (Memory Subsystem), которая также включает интерфейс внешней памяти EMIF для обмена данными между процессором и внешними микросхемами памяти.

Сетевой сопроцессор повышает эффективность работы процессора в составе различного рода телекоммуникационных устройств, реализуя аппаратно типовые для данной сферы задачи обработки данных. В основе работы сопроцессора лежат акселератор пакетной передачи данных (Packet Accelerator) и акселератор защиты информации (Security Accelerator). В спецификации на процессор перечислен набор протоколов и стандартов, поддерживаемых данными акселераторами.

Периферийные устройства включают:

Основой функционирования многоядерного процессора TMS320C66xх с позиции высокоскоростного обмена данными между всеми многочисленными компонентами процессора, а также внешними модулями, служит внутренняя шина TeraNet.

В следующей статье будет подробно рассмотрена архитектура операционного ядра C66x.

1. Multicore Programming Guide / SPRAB27B — August 2012;
2. TMS320C6678 Multicore Fixed and Floating-Point Digital Signal Processor Data Manual / SPRS691C — February 2012.

Источник

ОБЗОР DSP-ПРОЦЕССОРОВ

В статье сравниваются DSP-процессоры компаний Analog Devices, Freescale и Texas Instruments. Обзор охватывает недорогие DSP с фиксированной точкой, высокопроизводительные DSP с фиксированной точкой, а также DSP с плавающей точкой. Приводятся количественные оценки производительности, полученные по методике BDTImark2000.

Тенденции развития DSP-процессоров меняются: если недавно производители предлагали процессоры общего назначения, то сегодня многие семейства DSP-процессоров ориентированы в основном на конкретные приложения. На рынке присутствуют три основных производителя DSP-процессоров: Analog Devices, Freescale и Texas Instruments. В статье рассмотрены наиболее широкоиспользуемые семейства процессоров этих производителей. Процессоры сгруппированы в три категории: недорогие с фиксированной точкой, высокопроизводительные с фиксированной точкой и процессоры с плавающей точкой. Это очень примерная классификация, и многие процессоры было бы разумно поместить в две категории — мы будем отмечать те случаи, где это имеет место.

Два производителя — Freescale и TI, предлагают множество недорогих процессоров с фиксированной точкой. ADI также выпускает семейство недорогих процессоров с фиксированной точкой ADSP-21xx, но сегодня это семейство вытеснено Blackfin и практически не развивается. Как правило, процессоры этой группы не отличаются производительностью: они работают на скромных тактовых частотах (не более 350 МГц); в их состав обычно входит один блок умножения с накоплением — MAC. Хотя пропускная способность блока MAC не основной показатель производительности DSP-процессора, эта величина все еще является важным параметром при сравнении возможностей различных процессоров.
Сегодня многие современные встраиваемые процессоры (ВП) значительно быстрее недорогих DSP с фиксированной точкой. Но в приложениях, где требуется цифровая обработка сигналов, современные ВП обычно уступают таким DSP как по ценовым показателям, так и по энергопотреблению. Им, как правило, недостаёт специализированной интегрированной периферии и средств, необходимых для разработки приложений, ориентированных на обработку сигналов и управление механизмами. Существует множество встраиваемых приложений, где скорость не является самым важным параметром, например управление двигателями. Для этих приложений недорогие DSP-процессоры с фиксированной точкой часто являются наилучшим выбором, поскольку они имеют более низкую цену, пониженное энергопотребление, а также обладают специализированной периферией и доступными средствами разработки.
Freescale DSP563xx. На данный момент процессоры семейства DSP563xx являются единственными широкораспространёнными 24-разрядными процессорами с фиксированной точкой. Основные сферы применения — аудио-приложения с высокой точностью звуковоспроизведения, где большая разрядность слова данных даёт лучшее значение тембра по сравнению с 16-разрядными микросхемами с фиксированной точкой. DSP563xx — это продолжение 24-разрядных DSP560xx, выпущенных в конце 1980 гг. 24-битное слово данных было в то время необычным явлением, впрочем как и сейчас. Это помогло внедрить семейство 5600x и 563xx во множестве схем аудио, это основная причина, по которой семейство и по сей день ориентировано на звуковое оборудование.
Самые быстрые представители семейства DSP563xx работают на частоте 275 МГц при напряжении питания 1,6 В, их стоимость от 4 до 5 долл.2 В отличие от большинства DSP с фиксированной точкой, процессоры 563xx часто сопоставимы с 32-разрядными процессорами с плавающей точкой, которые также обеспечивают высокое качество звука. Однако процессоры с плавающей точкой обычно гораздо дороже и потреб­ляют больше энергии.
Freescale DSP5685x. Эти процессоры часто применяются в автоэлектронике для управления электродвигателями и в импульсных источниках питания. Они попадают в категорию цифровых сигнальных контроллеров (Digital Signal Controller (DSC)) в том смысле, что объединяют атрибуты традиционных DSP с микроконтроллерами и имеют подходящую периферию для схем управления, например такую, как ШИМ. Термин «цифровой сигнальный контроллер» является довольно новым, но он уже введен в употребление. Представители семейства DSP5685x работают на частотах до 120 МГц и стоят от 3 до 20 долл. Компания Freescale также предлагает родственное семейство кристаллов MC56F83xx, которые построены на базе того же ядра, что и DSP5685x, но, помимо всего прочего, содержат также Flash память и работают на максимальной частоте до 60 МГц.
Texas Instruments TMS320C28x. Это 32-разрядные DSP с фиксированной точкой. C28x позиционируются как DSC. В состав семейства входят микросхемы с флэш-памятью и периферией, ориентированной на решение задач управления (например, CAN-интерфейс и ШИМ). 32-битное слово данных — необычное явление для такого класса DSP-процессоров. Это важная особенность, поскольку приложения, связанные с реализацией управления, могут требовать высокой точности и широкого динамического диапазона, но при этом быть слишком чувствительными к цене для того, чтобы использовать 32-разрядные микросхемы с плавающей точкой. Процессоры C28x применяются при управлении двигателями и в цифровых источниках питания.
C28x работают на частотах до 150 МГц, это одни из самых быстрых доступных DSС. Их цена варьируется от 3 до 14 долл. Компания TI также предлагает более дешёвые решения, обладающие меньшей производительностью и ориентированные на схемы управления, это TMS320C24x, которые используют 16-битное слово с фиксированной точкой и работают на частотах до 40 МГц.
Texas Instruments TMS320C55x. Процессоры выпускаются с 2000 г. C55x имеют два блока MAC (у предшественника C54x, а также в других процессорах из ниши недорогих DSP только один блок) и параллельно выполняют до двух инструкций за такт. Их максимальная тактовая частота 160 Мгц. Процессоры TMS320C55x позиционируются как процессоры для широкой области применений, в частности для тех приложений, которые требуют низкой цены, умеренной производительности DSP и малого энергопотребления. Это портативные аудиоплееры и другие потребительские товары.
Как и другие семейства процессоров данного класса, процессоры C55x по сути, являются традиционными DSP общего назначения, но они единственные в данной группе, которые могут выполнять две инструкции за такт. Это позволяет получать среднюю производительность при низкой цене от 4 до 17 долл. и малом энергопотреблении.
Компания TI также предлагает усовершенствованный вариант ядра C55x под названием C55x+, который работает на более высоких частотах (до 500 МГц) и имеет расширенную микроархитектуру. Ядро C55x+ доступно только в специализированных чипах для беспроводных телефонов и не предназначено для широкого круга применений. Оценки, проведенные по критерию BDTImark2000, показывают, что ядро C55x+ имеет значительно более высокую DSP-производительность, чем C55x.

В этой нише конкурируют три основных семейства — BF5xx (Blackfin) от ADI, MSC81xx и MSC71xx от Freescale и TMS320C64x компании TI. Все они представляют собой 16-разрядные процессоры и являются более новыми и более мощными устройствами, чем процессоры из группы недорогих DSP. Все они исполняют несколько инструкций за такт, используют технологию VLIW (Very Long Instruction Word — очень длинное командное слово) и поддерживают одновременное выполнение нескольких MAC-операций в одном цикле. Следует отметить, что, хотя мы и выделяем только три семейства в данную группу, но существует также множество начинающих компаний, предлагающих высокопроизводительные DSP-процессоры с фиксированной точкой. Это многоядерные устройства, имеющие архитектуру с массовым параллелизмом.
Analog Devices ADSP-BF5xx. Это семейство сочетает в себе характеристики DSP с малым энергопотреблением и свойства, традиционно связанные с микропроцессорами общего назначения. Они используются в приложениях, где требуется выполнение функций как DSP, так и процессоров общего назначения: автоэлектроника, в приложениях, требующих мощных мультимедийных средств обработки, и других, требующих интенсивных вычислений.
Процессоры Blackfin имеют «Микросигнальную архитектуру», разработанную совместно Intel и ADI: два тракта обработки данных и ограниченная VLIW-архитектура, которая может выполнять до трёх инструкций за один такт и реализовать два 16-разрядных умножения за такт. Цены на эти процессоры варьируются от 5 до 32 долл. Поскольку в семействе присутствуют и недорогие чипы, Blackfin можно также отнести к семейству недорогих DSP, хотя их производительность значительно выше, чем у других DSP этой группы. Blackfin содержит и многоядерные чипы.
Процессоры ADSP-BF5xx имеют сложные специфические схемы управления питанием для обеспечения устойчивости при переключении режимов работы. Процессоры Blackfin не такие производительные, как два других представителя данной категории, но являются более эффективными с точки зрения потребляемой мощности. Они могут применяються не только в стационарных высокопроизводительных приложениях, но и в мобильных устройствах с пониженным энергопотреблением. Процессоры Blackfin выделяются в ряду современных архитектур, поскольку они содержат специализированную аппаратную часть и инструкции для ускорения двухмерной обработки изображений и видеоданных. Эти возможности являются значительным шагом вперёд в архитектуре DSP-процессоров, поскольку изначально они были разработаны для обработки одномерных сигналов в системах связи и аудиоаппаратуре.
Freescale MSC81xx и MSC71xx. В состав семейств MSC81xx и MSC71xx входят кристаллы, реализованные на базе трёх ядер StarCore: SC140, SC1400 и SC3400. Процессоры с ядром SC140 были выпущены в 1999 г. и, вместе с TMS320C62x, это были одни из первых процессоров на базе VLIW-архитектуры. Ядро SC140 содержит четыре модуля MAC, которые могут выполнять до 6 инструкций за цикл. Два других ядра (SC1400 и SC3400) очень похожи на SC140, но при их изготовлении используются другие технологии, а некоторые особенности архитектуры позволяют достигать большей производительности.
Наиболее производительным является ядро SC3400, которое на данный момент доступно только в составе процессора MSC8144. Этот процессор содержит четыре ядра SC3400, работающих на частоте 1 ГГц. Микросхема используется в приложениях c многоканальной инфраструктурой: базовые станции беспроводной связи, оборудование для цифровой передачи звука, маршрутизаторы, устройства видеонаб­людения и другие.
Ядро SC140 используется в различных одно- и четырёхядерных процессорах MSC81xx, самый быстрый из которых работает на частоте 500 МГц. MSC81xx применяются в коммуникационных приложениях, таких, как маршрутизаторы, используемые в сетях технологии VoIP, устройств обеспечения видеоконференций и в базовых станциях беспроводных сетей. Ядро SC1400 используется в одноядерных чипах MSC71xx, которые могут работать на частотах до 300 МГц. Эти чипы применяются при проектировании недорогих устройств, таких, как, например, дешёвые приложения для IP-телефонии. Цены на эти приборы варьируются от 13 до 84 долл. для процессоров семейств MSC71xx/81xx и от 180 до 220 долл. для MSC8144.
Texas Instruments TMS320C64x. TMS320C64x, первые представители которого были выпущены в 2000 г., являются расширением и заменой семейства TMS320C62x. Микросхемы семейства TMS320C64x применяются в приложениях, требующих высокой производительности: в беспроводной связи, в двух- и трёхмерные графических приложениях, видеоприложениях, радарных и сонарных системах. Совсем недавно TI объявили о выпуске многоядерных DSP на базе C64x, предназначенных для связи. Самые быстрые представители семейства TMS320C64x работают на частотах до 1 ГГц, напряжение питания ядра 1,2 В. Цена на одноядерные микросхемы варьируется от 15 до 208 долл.
Процессоры TMS320C64x имеют восемь блоков управления (execution unit), включая два умножителя и четыре АЛУ, таким образом обеспечивая выполнение до восьми инструкций за цикл. Процессоры семейства C64x также поддерживают инструкции SIMD, которые позволяют им одновременно выполнять четыре 16-битных умножения. Более ранние C62x выполняли только два умножения. В 2005 г. TI представили модернизированную версию архитектуры C64x, а именно C64x+, которая поддерживала ряд дополнительных инструкций и могла выполнять до 8 операций умножения 16-битных цикл параллельно.
Представители C64x+ работают при тактовой частоте 1 ГГц и за счёт дополнительных инструкций могут достигать заметно более высокой производительности, чем С64х. В отличие от C55x+, процессоры C64x+ доступны в DSP общего назначения. Кроме того, TI используют архитектуру C64x/C64x+ в различных специализированных микросхемах. Например, DSP для видеоприложений DaVinci и прикладные OMAP3430-процессоры, которые совмещают ядро CPU ARM Cortex-A8 с DSP C64x+.
На рисунке 1 приведена оценка производительности по тестовой методике BDTImark2000 для DSP из групп недорогих и высокопроизводительных процессоров с фиксированной точкой.

что такое сигнальный процессор. Смотреть фото что такое сигнальный процессор. Смотреть картинку что такое сигнальный процессор. Картинка про что такое сигнальный процессор. Фото что такое сигнальный процессор

Производительность процессора измеряется с помощью программного модуля BDTI DSP Kernel Benchmark. Более высокая оценка BDTImark соответствует более производительному процессору.
На рисунке 2 показано соотношение цена/производительность для некоторых DSP с фиксированной точкой в единицах BDTImark/долл (чем выше оценка, тем лучше).

что такое сигнальный процессор. Смотреть фото что такое сигнальный процессор. Смотреть картинку что такое сигнальный процессор. Картинка про что такое сигнальный процессор. Фото что такое сигнальный процессор

Заметим, что некоторые более дорогие высокопроизводительные процессоры имеют лучшее соотношение цена/производительность, чем недорогие чипы. Однако производительность процессоров может оказаться ненужной для приложений, главным критерием для которых является цена.

Наиболее распространены три семейства DSP с плавающей точкой: SHARC и TigerSHARC от ADI и TMS320C67x от TI. Традиционно процессоры ADI имеют ориентацию на использование в многопроцессорных системах, и заказчики ADI зачастую реализуют целые массивы процессоров SHARC для приложений, требующих высокой производительности, например, радиолокации и медицинских приборов.
Из-за схемотехнической сложности DSP с плавающей точкой обычно работают на более низких частотах, чем высокопроизводительные с фиксированной точкой, кроме того, их энергопотребление довольно велико. Основным преимуществом этих процессоров является возможность обеспечения лучшего динамического диапазона и, соответственно, более простого использования с точки зрения программного обеспечения. Гораздо проще писать программу обработки сигнала, если не надо заботиться о масштабировании сигнала.
Традиционно DSP-процессоры с плавающей точкой всегда были более дорогими, чем DSP с фиксированной точкой, но ценовое соотношение изменилось за последние годы. Как ADI, так и TI предлагают недорогие процессоры с плавающей точкой по цене от 5 до 10 долл., которые сопоставимы по цене с недорогими DSP с фиксированной точкой. Это позволило использовать DSP с плавающей точкой в таких приложениях, как потребительская аудиоаппаратура и автомобилестроение.
Analog Devices TigerSHARC. Вы­­сокопроизводительная архитек­тура TigerSHARC с плавающей точкой реализована в семействе процессоров ADSP-TSxx. TigerSHARC — это мощная (и дорогая) архитектура, которая совмещает технологии VLIW и SIMD, поддерживая параллельное выполнение до 4 операций умножения 32-разрядных чисел с плавающей точкой, что вдвое больше, чем у двух других обсуждаемых здесь DSP. Процессоры этого семейства также работают на более высоких частотах: до 600 МГц. Цена варьируется от 130 до 150 долл. ADI не объявляли о выходе новых чипов на базе TigerSHARC уже несколько лет, что наводит на мысль о том, что это семейство устарело. Недавно ADI в интервью BDTI отмечали, что они планируют выпустить новые TigerSHARC-продукты, но они не говорили, когда это произойдёт.
Процессоры ADSP-TS20x работают с данными различной разрядности и поддерживают формат как с фиксированной, так и с плавающей точкой; такая гибкость в отношении типов данных является необычным свойством. По этой причине данное семейство может быть также классифицировано и как высокопроизводительный чип с фиксированной точкой. Процессоры TigerSHARC отличаются и тем, что содержат память DRAM на кристалле.
Analog Devices ADSP-21xxx SHARC. Представители ADSP-21xxx SHARC от ADI являются менее дорогими процессорами: цены варьируются в пределах от 5 до 30 долл. Впервые ADI выпустили SHARC в 1994 г., основываясь на более ранних ADSP-21020. Изначально SHARC был SISD-машиной (одна инструкция — одни данные) и был усовершенствован для обеспечения возможностей SIMD (одна инструкция — несколько данных) в 1998-м. Возможности SIMD (которые включают второй, дублирующий путь для данных и новые инструкции) удвоили пропускную способность MAC-модуля более ранних устройств, от одной операции MAC за цикл до двух. Процессоры SHARC работают на частотах до 400 МГц.
SHARC изначально получили широкое распространение в медицинских и военных приложениях (радиолокация), но ранее ADI ориентировали свою линию продуктов SHARC в основном на аудиоприложения. Некоторые представители семейства имеют интегрированный интерфейс SDRAM, а некоторые — память ROM на кристалле, в которую предварительно помещаются аудиокодеки и программы последующей обработки.
Texas Instruments TMS320C67x. TMS320C67x — вариант оригинального VLIW DSP с фиксированной точкой, а именно TMS320C62x. Набор инструкций C67x совмещает инструкции для операций с фиксированной точкой оригинального C62x. TI изначально позиционировали C67x как средство для быстрой разработки новых приложений, которые в дальнейшем могут быть легко переносимы на недорогие и высокопроизводительные C62x (ныне C64x). В последние годы TI перестали делать акцент на совместимость C67x/C62x, возможно из-за того, что перенос из формата с плавающей точкой в формат с фиксированной точкой, как правило, требует тщательного числового анализа и изменения алгоритмов, таким образом, приводя к необходимости переработки значительной части кода несмотря на совместимость процессоров.
Семейство C67x построено на базе той же восьмитактной VLIW-архитектуры, что и C62x, но с добавлением ряда инструкций и аппаратуры для поддержки операций с плавающей точкой. C67x могут выполнять две 32-разрядные MAC-операции с плавающей точкой одновременно и работать на частотах до 300 МГц. Как и ADI свои SHARC, так и TI в последние годы ориентируют DSP с плавающей точкой на профессиональные, high-end аудиоприложения. Как и в случае с C64x/C54x+, TI также предлагают расширенную версию ядра C67x+. Ядро имеет расширенный набор регистров, специфические для аудио-обработки инструкции и работает на более высоких частотах (до 350 МГц). Эти ядра используются в чипах TMS320C672x и предназначены для приложений, требующих более высокой производительности, не достижимой с C67x.
На рисунке 3 показаны BDTImark2000- оценки для трёх DSP с плавающей точкой.

что такое сигнальный процессор. Смотреть фото что такое сигнальный процессор. Смотреть картинку что такое сигнальный процессор. Картинка про что такое сигнальный процессор. Фото что такое сигнальный процессор

В таблице 1 сведены все микросхемы, обсуждаемые в данной статье.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *