Новые архитектуры и технологии Intel, часть II: Tukwila, Larrabee, AVX
В предыдущей публикации речь шла о ключевых особенностях микроархитектуры Intel нового поколения с кодовым названием Nehalem, а также о первых шестиядерных процессорах Intel с кодовым названием Dunnington. Сегодня же речь пойдёт о не менее интересных новинках - многоядерном GPGPU-процессоре Larrabee.
Tukwila - следующий виток эволюции Itanium
Во второй половине этого года компания Intel планирует выпустить процессоры для серверов и рабочих станций с кодовым обозначением Tukwila, которые станут первыми четырёхъядерными представителями продуктовой линейки Itanium. Кроме того, чипы нового поколения установят своеобразный рекорд, так как станут первыми микропроцессорами в отрасли, объединяющими около двух миллиардов транзисторов.
Для любителей подробностей отметим, что, собственно, на четыре ядра приходится "всего" 450 млн транзисторов, остальные распределяются между системным интерфейсом - около 157 млн; подсистемой ввода/вывода - 39 млн; кэш-памятью - 1,42 млрд транзисторов. Кстати, кэш не случайно включает львиную долю транзисторов, ведь его общая емкость будет достигать 30 Мб. При таком огромном количестве полупроводниковых элементов габариты корпуса "процессоров-миллиардеров" составят 21,5х32,5 мм (почти 700 мм2).
В Intel уверяют, что Tukwila опередит по производительности современные двухъядерные Montvale (серия Itanium 9100) более чем в два раза. Точной информации о тактовых частотах процессоров Tukwila пока нет, но на февральской конференции ISSCC 2008 (International Solid State Circuits Conference) представители Intel говорили о покорении рубежа 2 ГГц, в то время как частоты современных двухъядерных процессоров Itanium не превышают 1,66 ГГц. Что касается уровня TDP, то, по последним данным, для Tukwila его значение составит 130 Вт. Для сравнения, тепловой пакет двухъядерных Itanium (Montvale) составляет 104 Вт.
Следует отметить, что повышения энергоэффективности удалось достичь во многом благодаря переходу на более прецизионный техпроцесс. На данный момент процессоры Itanium выпускаются по 90-нм нормам, в то время как Tukwila смогут использовать все преимущества 65-нм производственной технологии. Также снижению энергопотребления способствовали изменения на схемном уровне, которые позволили снизить рабочие напряжения питания. Приведём ориентировочные показатели потребляемого напряжения и мощности питания для ключевых компонентов процессоров Tukwila:
Среди ключевых особенностей Tukwila можно отметить новую высокоскоростную системную шину QuickPath Interconnect, о которой мы рассказывали в предыдущей части; два интегрированных контроллера памяти; реализацию одновременной обработки двух потоков (технология Simultaneous Multi-Threading). Наряду с этим ожидается наличие поддержки высокоуровневых функций обеспечения надежности, готовности и удобства обслуживания (RAS, Reliability, Availability and Serviceability), в частности, функции DDDC (Double Device Data Correction), которая позволит памяти продолжать работу даже в случае серьезных аппаратных ошибок на двух последовательных модулях в динамическом ОЗУ, а также сохранение частоты появления программных ошибок (SER, Soft Error Rate) на прежнем уровне, несмотря на трехкратное увеличение количества логических элементов.
К сожалению, никаких данных о конкретных моделях и, тем более, ориентировочных ценах, пока нет.
Intel AVX - набор векторных команд для CPU нового поколения
В нынешнем году компания Intel представит свою новую процессорную микроархитектуру Nehalem. Через два года, согласно так называемой модели развития тик-так, в команде Intel произойдет очередная замена - место Nehalem займёт архитектура Sandy Bridge, ранее известная как Gesher. Несмотря на то, что её имя уже довольно продолжительное время "светится" на презентационных слайдах Intel, данных о ней пока совсем мало.
Недавно Патрик Гелсингер (Patrick Gelsinger) вкратце рассказал о новом наборе векторных команд AVX (Advanced Vector Extension), которые будут впервые внедрены в 32-нм процессорах с микроархитектурой Sandy Bridge. По утверждению представителя Intel, использование команд AVX позволит повысить быстродействие в операциях с плавающей запятой, мультимедийных задачах и приложениях с высокой степенью загрузки процессора. Кроме того, новые векторные расширения помогут увеличить энергоэффективность процессоров.
Одной из ключевых особенностей AVX является увеличение разрядности регистров с 128 до 256 бит, что, по заявлению Intel, позволит удвоить максимальное количество выполняемых операций с плавающей запятой за секунду (FLOPs) в два раза. Также отмечаются усовершенствованные методы перегруппировки данных, которые помогут ускорить их обработку, и поддержка трёхоперандных команд с так называемым неразрушающим синтаксисом (non-destructive syntax), что даст такие преимущества, как более эффективное использование регистровой памяти, а также уменьшение объема программного кода.
Larrabee - архитектура для визуальных вычислений
Весомая часть проведённого компанией Intel в конце марта пресс-брифинга была посвящена новой архитектуре для визуальных вычислений, известной нам под кодовым обозначением Larrabee. Но прежде, чем приступить к её описанию, стоит познакомиться с самой концепцией Visual Computing, которая переопределяет традиционное понимание компьютерной графики.
Как поясняет Патрик Гелсингер, технологии следующего поколения, которые позволят создавать еще более реалистичные игры, воспроизводить изображения, видео и звук высокой четкости, существенно повысят требования к вычислительной мощи ПК. Например, применение методов глобального освещения, таких как трассировка лучей, используемых для более точной передачи теней и световых эффектов. Новый уровень требований к вычислительным возможностям выдвигает использование поведенческого реализма в программных приложениях, например, просчёта "физики" в играх.
Также Intel предвещает появление совершенно новых уровней интерактивности. Например, игровые контроллеры следующего поколения смогут "понимать" движения человека и наделять виртуальных персонажей его характером. В медицинской отрасли будут активно внедряться системы интерактивных процедур под управлением компьютера, назначаемых после поступления информации о состоянии пациента в режиме реального времени.
Для всего этого потребуется мощная вычислительная платформа нового уровня, включающая многоядерный процессор, чипсет, графическую подсистему, а также программное обеспечение и соответствующие пакеты для разработчиков (SDK, Software Development Kit).
Продолжая инвестировать значительные средства в развитие концепции Visual Computing, компания Intel разрабатывает архитектуру Larrabee, которая представляет собой следующий виток эволюции визуальных вычислений. Как отмечается, первая демонстрация продукта на базе новой архитектуры состоится ближе к концу текущего года.
Концепция Larrabee включает высокопроизводительный SIMD (Single Instruction Multiple Data) векторный процессор (VPU, Vector Processing Unit), а также новый набор векторных инструкций, в число которых входят команды для работы с целочисленными и вещественными операндами, векторные операции с памятью, условные команды. Кроме того, Larrabee предусматривает использование новой схемы анализа когерентности кэш-памяти - важной функции, играющей одну из ключевых ролей в многоядерных системах.
Отмечается возможность программирования для решения широкого круга вычислительных задач (задач общего назначения), то есть, по сути, Larrabee можно отнести к процессорам класса GPGPU (General Purpose Graphical Processor Unit), хотя сама компания в своих официальных заявлениях этот термин не использует. Отметим, что идея GPGPU уже реализована в продуктах ключевых разработчиков графических ускорителей, например, AMD продвигает на рынок свою технологию Stream Computing, а NVIDIA имеет в своём арсенале аппаратно-программную архитектуру CUDA.
К сожалению, представители Intel не раскрыли особенностей аппаратной реализации Larrabee, поэтому, вкратце напомним основные, известные на сегодняшний день данные, озвученные на предыдущих презентациях компании.
Для производства Larrabee будет использоваться 45-нм техпроцесс. Чипы габаритами 49,5х49,5 мм будут включать от 16 до 24 ядер, способных обрабатывать одновременно четыре потока. Предполагается, что тактовые частоты будут находиться в пределах от 1,7 до 2,5 ГГц (по некоторым данным, до 2 ГГц), при этом уровень TDP составит не менее 150 Вт.
Каждое ядро будет иметь 32 Кб кэша первого уровня с латентностью в один такт, а также кэш L2 емкостью 256 Кб и латентностью 10 тактов. Кроме того, чип будет включать два контроллера памяти и блоки выборки текстур. Правда, на "упрощенном" презентационном слайде, приведённом ниже, все эти компоненты не изображаются. Производительность GPGPU-процессоров в операциях с плавающих запятой будет измеряться терафлопсами.
Впрочем, каким бы мощным и функциональным не было "железо", без эффективного программного обеспечения оно превращается в груду металлолома. Прекрасно понимая это, в Intel стараются уделять должное внимание разработке инструментов для программистов. Помимо традиционных пакетов MPI Library, Thread Checker, Thread Profiler и других, Intel представит для Larrabee дополнительные программные инструменты. Новая архитектура будет поддерживать современные API DirectX и OpenGL.
Послесловие
Область исследований компании Intel настолько обширна, что подробно рассмотреть абсолютно все современные разработки гиганта полупроводниковой отрасли в рамках одной статьи не представляется возможным. Нам ещё предстоит подробно ознакомиться с рядом последних разработок компании, вроде процессоров класса "система на чипе" под кодовым именем Tolapai; недавно анонсированных миниатюрных чипов Atom; новыми технологиями виртуализации; решениями для встраиваемых систем.