Характеристики 65-нанометрового технологического процесса - Характеристика процессоров различных архитектур

В 65-нанометровом производстве применяется целый ряд передовых технологий. Например, самые маленькие в мире серийно изготавливаемые КМОП-транзисторы с длиной затвора 35 нм, что приблизительно на 30% меньше, чем при производстве по 90-нанометровой технологии. Толщина оксидного слоя затвора уменьшена до 1,2 нм (менее пяти атомарных слоев) (рис.4), а расстояние между стоком и истоком составляет всего 220 нм.

фотография транзистора, выполненного по 65-нанометровому технологическому процессу

Рис. 4. Фотография транзистора, выполненного по 65-нанометровому технологическому процессу

В 65-нанометровом технологическом процессе используется на один слой межсоединений больше, чем в 90-нанометровом процессе (рис. 95). По оценкам Intel, применять в данном случае большее количество слоев межсоединений экономически невыгодно.

восемь слоев кристалла процессора в 65-нанометровом технологическом процессе

Рис. 5. Восемь слоев кристалла процессора в 65-нанометровом технологическом процессе

Интересно отметить, что толщина оксидного слоя затвора в новом 65-нанометровом технологическом процессе осталась такой же, как и в 90-нанометровом процессе. Фактически это означает ее намеренное увеличение, поскольку она должна была бы уменьшиться в 0,7 раза. Увеличение толщины оксидного слой затвора сделано специально для борьбы с токами утечки (при этом уменьшается подзатворная емкость).

В результате использования улучшенной технологии напряженного кремния удалось оптимизировать рабочий ток транзисторов. При фиксированном уровне тока утечки рабочий ток транзистора в 65-нанометровой технологии выше на 30%, тогда как прежде это улучшение составляло 10-20% в зависимости от типа транзистора и уровня тока утечек. В транзисторах, созданных по 65-нанометровой технологии, объем утечки уменьшен в четыре раза по сравнению с транзисторами на базе 90-нанометровой производственной технологии. В результате транзисторы на базе 65-нанометровой производственной технологии обеспечивают более высокую производительность без повышения утечки (большая утечка электрического тока приводит к выделению большого количества тепла).

Кроме того, корпорация Intel включила в микросхемы SRAM на базе 65-нанометровой производственной технологии так называемые транзисторы сна (sleep transistors), которые отключают подачу тока на большие блоки памяти SRAM, когда те не используются, что значительно снижает энергопотребление микросхемы. Эта функция особенно хорошо подходит для устройств с питанием от батареи, например для мобильных ПК.

Количество транзисторов сна в микросхеме памяти -- это менее 1% от суммарной площади всех ячеек памяти, а эффект от их использования -- троекратное снижение тока утечки кристалла

9. 45 нм против 65 нм

Ядро Wolfdale существенно меньше ядра Conroe, площадь кристалла составляет всего 107 ммІ, в отличие от 143 мм2 у предшественника. Это означает, что 45-нм процессору Wolfdale с 6 Мбайт кэша требуется всего 74% от площади кристалла 65-нм Conroe с кэшем на 4 Мбайт. Хотя Intel указала тепловой пакет 65 Вт для всех трех версий (от 2,66 до 3,16 ГГц), мы обнаружили, что реальное энергопотребление намного ниже максимального, указанного в тепловом пакете. По информации Intel, переход с 65 на 45 нм провести очень легко, при этом можно использовать две трети установленного парка машин и утилит.

При снижении размера кристалла число транзисторов, напротив, увеличилось на 40%, с 291 млн. до 410 млн. В основном, такой прирост связан с увеличением размера кэша L2. По информации Intel, гафниевые транзисторы с High-k переключается на 20% быстрее и требуют для этого на 30% меньше энергии. Кроме некоторых изменений в ядре, включая быстрый делитель Radix 16, улучшенную поддержку виртуализации и 128-битный shuffle-блок, Intel добавила новый набор инструкций SSE4.

SSE расшифровывается как "Streaming SIMD Extensions (потоковые расширения SIMD)", где SIMD обозначает "single instruction, multiple data (одна инструкция, много данных)". Новый набор содержит 47 инструкций, все из которых направлены на ускорение создания и обработки цифрового контента: фотографий, видео и аудио. Конечно, набор SSE4 должен поддерживаться приложениями, чтобы обеспечить прирост производительности, однако другие модификации, вместе с увеличенным кэшем L2, тоже влияют на производительность практически во всех наших тестах.

С выходом Penryn Intel добавила еще одну функцию: состояние "Deep Power Down". Это еще одно C-состояние, в которое может переходить процессор для экономии энергии. Если для экономии энергии кэш L2 обычно освобождается, то состояние "Deep Power Down" позволяет полностью обрезать питание к кэшу L2 и отдельным ядрам, когда оно не требуется. После возобновления работы ядра система восстанавливает последнее архитектурное состояние.

К сожалению, функция "Deep Power Down" активна только на мобильных процессорах Core 2 на ядре Penryn, а не на ядрах Wolfdale для настольных ПК. Однако этот подход не очень хорошо согласуется с вкладом Intel в усилия индустрии по снижению энергопотребления и числа выбрасываемых в атмосферу отходов. Но, поскольку переход в более глубокие C-состояния требует энергию сам по себе, "Deep Power Down" может и не иметь смысла в настольном окружении, где активно больше приложений и сервисов.

Наконец, Intel уже предложил технологию "Dynamic Acceleration Technology" (DAT) для 65- и 45-нм мобильных процессоров. Хотя в настольных процессорах E8000 эта технология не использовалась, она позволяла процессору работать с одним ядром на повышенной тактовой частоте, если второе ядро из-за бездействия находится в состоянии C3 или более глубоком состоянии сна. Преимущество от DAT получат однопоточные приложения, которые будут лучше работать на высоких тактовых частотах.

У процессоров Core 2 произошло еще одно небольшое изменение: частота в режиме бездействия. Если минимальный множитель Enhanced SpeedStep по-прежнему остался x6, то тактовая частота в режиме бездействия составляет уже не 1 600 МГц, как у процессоров с FSB1066, а 2 000 МГц (333 МГц x6). Так было с моделями Core 2 Duo E6x50, но, на самом деле, подобный подход вряд ли сильно повредит, поскольку ядро стало более эффективным по энергопотреблению. Core 2 Duo E8200 работает на частоте 2,66 ГГц, E8400 - на 3,0 ГГц, а модель E8500 - на 3,16 ГГц. Если внимательно посмотрите на частоты, то можно увидеть, что Intel вновь ввела дробные множители, поскольку для частоты 3,16 ГГц на FSB 333 МГц требуется множитель x9,5. Все три модели поддерживают последние технологии Intel в области процессоров, включая поддержку 64-битных операционных систем (4 Гбайт памяти и больше требуют 64-битной ОС), бит XD, Enhanced SpeedStep и Virtualization Technology. Все процессоры построены на микроархитектуре Core 2 с кэшем L2 на 6 Мбайт.

Сегодня нет двуядерных процессоров Extreme Edition, зато есть четырехъядерный QX9650 Core 2 Extreme. Intel давно предлагает модели Extreme Edition для энтузиастов, которые могут свободно их разгонять. Для этого процессоры Extreme Edition имеют разблокированный множитель, который позволяет увеличить частоту 3,16-ГГц процессора до 3,33, 3,5 или 3,66 ГГц, изменяя только множитель с x9,5 до x10, x10,5, x11 или даже еще большего.

Линейка E8000 работает с впечатляюще низкой температурой. Процессоры на несколько процентов смогли улучшить производительность в нашем тестовом пакете, причем система охлаждения на тестовых системах даже останавливалась, когда процессоры Wolfdale переходили в режим бездействия. Это означает, что в режиме бездействия тепловыделение Core 2 Wolfdale на 2,0 ГГц (вероятно, и в самом глубоком доступном C-состоянии сна) достаточно низкое, чтобы тепло отводилось радиатором без вентилятора. На максимальной штатной тактовой частоте 3,16 ГГц тоже были получены очень низкие температуры. По сравнению с 65-нм Core 2 Conroe, 45-нм ядро Core 2 Wolfdale работает на 6-8 градусов холоднее. Если бы был доступен C-режим "Deep Power Down", то процессор явно бы потреблял меньше энергии, чем чипсет. Конечно, средний пользователь вряд ли заметит от этого ощутимый эффект, поскольку на проценты прироста производительности обращают внимания больше. В любом случае, системы на Wolfdale лучше адаптированы к высоким уровням производительности, когда они требуются, но при этом температура оказывается меньше, а, значит, и компьютер работает тише.

Но что предлагают пользователям 45 нм процессоры Penryn, кроме новых транзисторов? В первую очередь -- это возросшая на 50% кэш-память второго уровня. В младших моделях ее объем составит 3 Мбайт, в двухъядерных чипах -- 6 Мбайт, а в четырехъядерных -- 12 Мбайт. Второе преимущество перехода на более тонкие производственные нормы -- снижение тепловыделения, а также как следствие рост частотного потенциала. Итог -- частота новых Core 2 Quad в будущем может достигнуть 3.4-3.6 ГГц, а системная шина -- 1600 МГц.

Не были забыты игровые приложения, а также другие программы. По утверждениям Intel разница в производительности между 45 и 65 нм процессорами, имеющие практически идентичные характеристики) составляет от 5% до 10%. При этом стоимость схожих моделей остается прежней. Константин Пикинер, капитан команды Virus. pro, участвовавшей во многих игровых соревнованиях и выходившей оттуда победителем, показал возможности новых четырехъядерных чипов Intel на примере игры Crysis.

Возможности Nehalem:

С динамическое управление ядрами процессора, вычислительными потоками, кэш-памятью, интерфейсами и питанием;

С возможность обработки 4 команд за один тактовый цикл в микроархитектуре Intel Core (способность микроархитектуры Intel Core регулярно обрабатывать до 4 команд за один тактовый цикл, по сравнению со способностью других процессоров обрабатывать 3 команды за тактовый цикл или менее);

С параллельная обработка потоков (технология Intel Hyper-Threading), обеспечивающая повышение производительности и сокращение энергопотребления;

С расширение архитектуры с инновационными наборами команд Intel SSE4 и ATA;

С высокопроизводительная многоуровневая общая кэш-память;

С высокая пропускная способность памяти и системная производительность;

С динамическое управление питанием с повышением производительности;

С масштабируемость производительности: от 1 до 16 (и более) потоков и от 1 до 8 (и более) ядер процессоров;

С масштабируемые настраиваемые внутрисистемные соединения и интегрированные контроллеры памяти;

С высокопроизводительный интегрированный графический процессор для клиентских платформ.

Технологический процесс Intel с разрешением 45 нм предполагает формирование транзисторов с металлическим затвором и оксидом гафния в качестве подзатворного диэлектрика (HfO2 - материал с высокой диэлектрической проницаемостью). В рамках 65-нм процесса Intel толщину традиционного подзатворного диэлектрика SiO2 удалось снизить до 1,2 нм (примерно пять моноатомных слоев). Однако дальнейшее его утончение приводит к чрезмерному возрастанию токов утечки через подзатворный диэлектрик со всеми нежелательными последствиями, в том числе - к паразитному нагреву. Проблему решает использование диэлектриков с высокой диэлектрической проницаемостью, что позволяет увеличить толщину подзатворного диэлектрика, сохраняя управляющее напряжение таким же, как и у транзистора с SiO2 под затвором. В качестве материала для таких диэлектриков используют соединения гафния - оксид или силицид. Однако при этом возникает новая проблема - на оксиде гафния невозможно сформировать поликремниевый затвор. Да и с металлическими затворами поверх этого материала все непросто. Поэтому немало сил было потрачено на разработку структуры металлических затворов, которые можно формировать поверх диэлектрика на основе соединений гафния.

По словам автора одноименного закона и одного из основателей Intel Гордона Мура, "Применение диэлектриков с высокой диэлектрической проницаемостью вкупе с металлами в затворах - это крупнейшее изменение в технологии транзисторов с тех пор, как в конце 1960-х годов были предложены поликремниевые затворы". Эта технология позволяет радикально снизить токи утечки транзисторов, что открывает перед разработчиками и производителями захватывающие перспективы. Благодаря новой технологии можно примерно вдвое увеличить плотность транзисторов на кристалле по сравнению с 65-нм процессом. Необходимая для переключения 45-нм транзистора мощность снижена примерно на 30%. Применение медных межсоединений и новых подзатворных диэлектриков повысит производительность и снизит энергопотребление. Все это позволяет увеличить быстродействие процессоров, создавать более интегрированные СБИС, что неизбежно скажется на архитектуре процессоров и компьютеров: снизит их размеры, энергопотребление, уровень шумов и цену.

Похожие статьи




Характеристики 65-нанометрового технологического процесса - Характеристика процессоров различных архитектур

Предыдущая | Следующая