Статьи

NVIDIA Tegra 3: пятый элемент для Супермена

Евгений Лебеденко / 25.11.2011 / 09:27

Даже самые заядлые скептики не могут сегодня оспорить непреложный факт: 2011-й стал годом бурного развития новой вычислительной платформы потребительского уровня. Планшетное племя во главе с первым iPad, заявившее в 2010-м о своем намерении покорить рынок, встречает конец текущего года в огромнейшем эволюционном разнообразии (признак живучести популяции) и с показателями продаж, которым завидуют недавние фавориты прилавков — нетбуки.

Пока «яблочный» планшет (в его второй инкарнации) остается царем горы, но ему частенько приходится оглядываться. Потому что в его алюминиевый затылок все сильнее дышат Android-конкуренты — быстрые, отзывчивые и недорогие. А ведь еще в конце прошлого года на планшетной беговой дорожке было пустынно. iPad в одиночку ставил маркетинговые рекорды, а робкие первенцы конкурентов даже близко не могли предоставить потребителю ничего привлекательного.

Все изменилось с появлением вычислительного допинга, который наряду с планшетообразной версией Android 3.0 и позволил массе топ-моделей занять достойное место в гонке за покупателя. Имя этому допингу — NVIDIA Tegra 2, двухъядерная SoC (система на чипе) производства компании NVIDIA Corporation. Оснащенная двумя производительными процессорными ядрами архитектуры ARM Cortex-A9 и не менее мощным графическим ускорителем GeForce GPU, микросхема Tegra 2 стала пламенным мотором большинства планшетов, успешно покоряющих планку отличных продаж.

2011 год можно смело называть годом Tegra 2, благодаря которой был сформирован рынок производительных Android-планшетов и смартфонов.

Сделав ставку на Tegra 2, Android-производители не прогадали. Архитектурно чип получился очень удачным. Две его головы, в подтверждение известной пословицы, оказались лучше одной в предыдущих моделях шестисотой серии, предоставив владельцам планшетов на основе Tegra 2 отличные возможности производительного веб-серфинга, достойных игр, круглосуточной социальной активности и качественного решения сложных мультимедийных задач. Сделанные по 40-нм технологическому процессу чипы Tegra 2 пережили четыре модификации, подняв тактовую частоту своей работы с 1 до 1,2 гигагерца.

Казалось бы, перед перспективной платформой открыт весь мир — только успевай завоевывать.

Но править бал нынешнему фавориту Android-планшетов осталось недолго. Следующий год приносит во вселенную этих цифровых девайсов нового лидера.

Имея прямо-таки суперменовское корпоративное имя Kal-El, новая система на чипе в миру получила скромное название NVIDIA Tegra 3. А скромничать, между прочим, ей вовсе не стоит. Поскольку архитектурные идеи, заложенные в эту микросхему, являются поистине суперменовскими, способными перевернуть устоявшееся представление потребителя о мобильных гаджетах как всего лишь частичной замене мощи и функциональности «взрослых» персональных компьютеров.

3-4-5, вышла Tegra погулять

Магия цифр в новом поколении SoC NVIDIA Tegra так и норовит сбить с толку. Если «двойка» в названии Tegra 2 четко ассоциировалась как со вторым поколением чипов NVIDIA, так и с революционной двухъядерной архитектурой, то цифра «3» в потребительском названии проекта Kal-El говорит лишь о том, что эта микросхема является третьей в модельном ряду. Компания-производитель при этом везде, где только можно, старается напомнить, что Tegra 3 — первое на рынке мобильных процессорных систем Quad Core решение. И что четыре ядра (в соответствии с волшебной формулой, выведенной Gillette) «бреют» пользовательские задачи в два раза (а местами — и на порядок) лучше двух ядер Tegra 2.

Но вот что удивительно: цифра «4» в популярной нынче у владельцев персональных компьютеров, а теперь и у владельцев мобильных девайсов мантре «Quad Core» применительно к Tegra 3 ничего не значит. Все дело в том, что четырехъядерная архитектура нового чипа NVIDIA является... пятиядерной! А значит цифра «5» — еще одно магическое число крепыша Kal-El. Но почему же производитель не выбрал ее в качестве рекламного пряника? Ведь, как ни крути (смотри выше волшебную формулу Gillette), «пять» значительно привлекательнее «четырех». Здесь стоит разобраться как в тонкостях многопроцессорности, так и в особенностях технологических процессов производства кремниевых чипов.

Скептики от мира информационных технологий, слыша очередную рекламу чипостроителей об увеличении числа ядер, начинают вовсю трубить о хитром маркетинговом заговоре. Мол, кроме магии чисел вроде указания лошадиных сил в рекламе авто, увеличение числа процессоров ничего не дает.

Стоит их разочаровать. Дает. Особенно в нынешнее информационно насыщенное время, где простенькая с виду веб-страничка может содержать одновременно и флэш-ролик (причем не один), и динамически формируемый контент на базе ActiveX/Java Script/Ajax и прочих популярных технологий, и анимированную графику, и другие добавляющие привлекательности фишки. А что, если страница эта открывается в браузере мобильного девайса, в котором, помимо веб-браузера, крутится еще куча фоновых процессов?

Одна и та же веб-страница с разной степенью эффективности обрабатывается одно- и двухъядерным процессором.

Единственное ядро центрального процессора такого гаджета просто разрывается между обработкой всех этих сложных вычислений. И путей решения всего два: бесконечно увеличивать рабочую частоту процессора, что пагубно скажется и на температурном режиме, и на времени автономной работы, или... распределить задачи между чуть менее быстрыми, но работающими в тесном контакте ядрами.

Именно так организованы современные мобильные двухъядерные решения, предложенные различными чипостроителями. Распределяя задачи между ядрами своих чипов, а также умело балансируя их загрузку, они добились нужного потребительского эффекта — визуально ощутимого прироста «шустрости» мобильных устройств. И следующий шаг в этом направлении, удвоение числа ядер, вроде бы очевиден. Ведь именно по этому пути пошли разработчики «взрослых» процессоров.

График загруженности процессорных ядер при обработке четырех вкладок браузера не врет: в процессе участвуют все четыре ядра.

Однако в мобильном мире не все так просто. Если персональный компьютер (пусть даже и ноутбук) обладает солидным запасом энергии для подпитки четырех процессорных ядер, то тощие батарейки мобильных девайсов имеют весьма ограниченную емкость. Но проблема не только в этом. Обычно, нажав кнопку питания, пользователь не выключает девайс, а переводит его в так называемый режим активного ожидания (Active Standby). И в этом режиме устройство не спит. Да, его экран выключен, но внутри постоянно трудятся десятки процессов. Обновление статусов социальных сервисов, периодическая проверка почты, работа компонентов операционной системы. Жизнь в Active Standby, конечно, не кипит, но и не замирает.

В, казалось бы, экономном режиме Active Standby на самом деле трудятся десятки фоновых процессов.

И именно этот, казалось бы, незаметный в сравнении с каким-нибудь кровавым 3D-шутером процесс и стал камнем преткновения, с которым столкнулись разработчики четырехъядерного Kal-El. Шустрым процессорным ядрам было без разницы, где одинаково плотно потреблять энергию: в ходе активной работы пользователя или в режиме Active Standby. Процесс их производства, именуемый «быстрым» (fast), оптимизирован на достижение высокой производительности. А там, где производительность, там высокие частоты работы и повышенное напряжение питания. И в случае режима Active Standby такие шустрые ядра показывают не самое лучшее энергопотребление.

Их ахиллесовой пятой при этом являются высокие паразитные токи, такие как тепловой и канальный ток, ток термогенерации и ток утечки. Величина последнего, кстати, линейно возрастает с увеличением напряжения питания, которое так нужно ядрам, сделанным по fast-технологическому процессу. Итак, обратной стороной медали скоростной четырехъядерности является весьма низкая энергоэффективность. И ладно бы она проявлялась только при просмотре видео или в геймерском процессе. В режиме Active Standby эта нехорошая характеристика не менее активно «съедает» аккумулятор, чем в действительно активном режиме.

А какому потребителю нужен гаджет, который после полудня ждущего (с точки зрения пользователя) режима разряжается до нуля? Вдоволь побившись над этой проблемой, инженеры NVIDIA нашли весьма неожиданное решение, которое назвали vSMP (Variable Simmetric MultiProcessing — изменяемая симметричная многопроцессорность). В отличие от традиционной технологии SMP, ноу-хау NVIDIA может показывать впечатляющую производительность и обеспечивать при этом низкое энергопотребление. Возможным это стало благодаря тому, что на помощь шустрым четырем ядрам пришло пятое тихоходное ядро, сделанное по совершенно иному технологическому процессу.

Четверо в Tegra, не считая компаньона

Все пять ядер NVIDIA Tegra 3 сделаны в соответствии с референс-дизайном ARM Cortex-A9 MPCore и поддерживают набор инструкций ARMv7.

Четырехъядерная архитектура Tegra 3 на самом деле является пятиядерной.

Вот только пятое ядро, которое инженеры NVIDIA назвали «ядро-компаньон» (Core companion), в отличие от четырех своих SMP-собратьев, сделанных по fast-технологическому процессу, разработано по другому технологическому процессу, именуемому low power silicon process.

Его отличительной особенностью является сознательное снижение напряжения питания и частоты ядра, приводящее к существенному уменьшению токов утечки. Поэтому такое ARM Cortex-A9 ядро на той же самой батарейке продержится значительно дольше, хоть и будет работать менее производительно.

Быстрые и низковольные процессорные ядра по-разному расходуют энергию при наращивании производительности.

А разве нужна большая производительность в режиме Active Standby? Или в случае воспроизведения музыки и декодирования простенького видео? Такое ядро непригодно для выполнения сложных вычислительных задач. Увеличение нагрузки приводит к слишком завышенному энергопотреблению.

Использование разных технологических процессов для разных ядер приводит к гибридному графику производительности процессора.

Поэтому для активной пользовательской работы предусмотрены четыре быстрых ядра, оптимизированные по показателю производительность/энергопотребление. Эта четверка, кстати, тоже не скопом набрасывается на решение задач, а подключает к этому процессу нужное количество ядер по мере необходимости.

Подключение ядер в Tegra 3 зависит от класса решаемых задач.

Двумя главными достижениями технологов NVIDIA при создании архитектуры vSMP являются: реализация в одном чипе ядер, сделанных по совершенно разным технологическим процессам, и уникальный для подобных четырехъядерных решений механизм балансировки загрузки ядер, обеспечивающий постоянную пиковую (для определенного класса задач) производительность при экономном расходовании энергии.

Кроме этих решений, vSMP-архитектура может похвастаться возможностью одновременного обращения к кэш-памяти второго уровня (L2) как основных ядер, так и неспешного ядра-компаньона, а также прозрачным представлением для мобильной операционной системы всей этой сложной многопроцессорной кухни. В этом смысле Tegra 3 существенно отличается от предшественницы Tegra 2, реализующей традиционную SMP-архитектуру.

Удивительно, но благодаря vSMP пятиядерная Tegra 3 более экономична, чем двухъядерная Tegra 2.

Применение низковольтного процессора-компаньона в проекте Kal-El сродни использованию электродвигателя в современных гибридных авто: далеко и быстро на нем не уедешь, но в рутине городских пробок он явно экономичнее двигателей внутреннего сгорания. Но так ли хороша новая архитектура, как ее расписывают маркетологи NVIDIA? Может, скептики правы — и vSMP всего лишь маркетинговый трюк вроде пятого лезвия, которое бреет «еще чище»?

Tegra 3 в цифрах и графиках

Для ответа на вопрос о правдивости заявлений инженеров NVIDIA существуют сравнительные оценки и масса синтетических и натуральных (на базе реально используемых программ) тестов, позволяющих вычертить графики и гистограммы производительности новой процессорной платформы.

Прежде чем отдать свое детище разработчикам девайсов, NVIDIA с кучей независимых экспертов тестировала Tegra 3 с помощью таких общепризнанных тестов, как CoreMark (тестирование функциональности процессорных ядер), Linpack/Lapack ( библиотек подпрограмм для решения систем уравнений, с помощью которых оценивается эффективность SMP-архитектуры), Moonbat (JavaScript-тест, оценивающий производительность системы в режиме веб-серфинга).

Кроме этой «синтетики», Tegra 3 проверялась и реальными программами, такими как видеоконвертер HandBrake video transcoder, Photaf 3D Panorama, а также кучей игр, которые, как известно, не по-детски нагружают процессоры.

Сравнивалась Tegra 3 при этом честно: сама с собой, но в одноядерном режиме, со своей двухъядерной предшественницей Tegra 2, с платформами-конкурентами: TI OMAP 4 и Qualcomm 8660.

Tegra 3 и конкуренты.

Конечно, хотелось бы увидеть сравнительную оценку мощи Tegra 3 с явным конкурентом, новинкой линейки Exynos от компании Samsung, модели Exynos 4412& Dtlm. По слухам, именно этот четырехъядерный чип будет стоять в таких флагманах, как Samsung Galaxy S III и Apple iPhone 5. Но пока тестовой битвы этих Quad Core платформ не случилось. Скорее всего, она состоится в следующем году.

NVIDIA Tegra 3, конечно же, поражает воображение нынешних гаджетовладельцев практически пятикратным увеличением производительности. Но супермен Kal-El — всего лишь очередной шаг на широкой дороге продуктовой линейки Tegra. Если верить разработчику, уже в следующем году нас ожидает встреча с двумя Tegra-чипами: GREY (Дориан?) и WAYNE (Бэтмен?), которые будут в десять раз шустрее старушки Tegra 2. Планируемый на 2013 год Росомаха-чип LOGAN покажет уже пятидесятикратный прирост производительности, а чип Железный человек STARK, что запланирован 2014 год, так и вовсе невероятный 75-кратный прирост. Это станет возможным благодаря переходу на новый 28-нм технологический процесс и, вероятно, новому референс-дизайну ядер от компании ARM.

План развития платформы Tegra очень напоминает семейство супергероев.

Пока же мир гаджетоманов замер в ожидании появления на рынке супермен-девайсов с пятиголовой Tegra 3 на борту. Первая ласточка уже анонсирована. А новая инкарнация весьма успешного планшета ASUS Eee Transformer, именуемая Prime, даже успела поступить в продажу. Будем надеяться, что уникальные инженерные решения NVIDIA, заложенные в архитектуру Tegra 3, послужат не только удовлетворению потребителей, но и подстегнут конкурентов к новым разработкам.

blog comments powered by Disqus
Обратная связь
Имя
E-mail
Сообщение:

Отправить