Архітектура K8L на 65 нм SOI техпроцессе в чотириядерних процесорах вже в другому кварталі 2007 року?

Не секрет, що практично вся інформація, подана компаніями на офіційних прес-конференціях, не є несподіваною для тих, хто уважно стежить за ІТ-новинами і проникаючою в мережу неофіційною інформацією. Однак офіційна позиція цінна тим, що вона не тільки прив'язує майбутні проекти до певного строку, але і, як не дивно, відрізняється від «витоків» лаконічністю. Справа в тому, що чутки, якими нас щедро пригощають якісь тайванські і англійські сайти, як правило, представляють лише можливі шляхи розвитку. А реальні плани будуються на виборі з цих «можливих шляхів» найбільш вдалого, точніше - технічно реалізується. І за нинішніми високо конкурентним часів офіційні плани оприлюднюються практично відразу, після того, як «технологи» визначаться зі своїми можливостями і дадуть відмашку «маркетологам».

На початку вересня своїми, більш ніж свіжими, планами з представниками московської ІТ-журналістики поділилася компанія AMD.

«Офіційну частину» провів П'єр Брансвік, віце-президент з продажів і маркетингу в СНД, Східній Європі і Туреччині, судячи по регулярному присутності на прес-заходах, вже міцно влаштувався в Москві. До речі, «генеральська» посаду для співробітника, що займається «нашим» регіоном, побічно, але цілком об'єктивно, демонструє, що AMD вважає цей регіон стратегічно важливим.

Очевидно, що на сьогодні, основне завдання людей «від маркетингу» в AMD - продемонструвати, що, незважаючи на вихід конкуруючого продукту з більш ефективної архітектурою, компанія живе і розвивається. І не збирається не тільки поступатися завойовану частку ринку, але і уповільнювати темпи зростання. До чого є маса економічних, і, як виявилося пізніше по ходу презентації, також і технологічних причин.

Звичайно, придбання надійних позицій на вельми консервативному серверному ринку можна вважати одним з основних досягнень минулих трьох років.

Перехід компанії Dell на використання процесорів від AMD важливий і в плані залучення ще одного великого замовника (особливо, з урахуванням можливого доведення частки комп'ютерів Dell на AMD-процесорах до 50%). Але в ще більшому ступені це, вже давно очікуване, подія зараз важливо як «політичний» приклад для «тих, хто сумнівається». Цікаво, що практично в ті ж терміни активне впровадження Opteron в свою серверну лінійку допустила компанія IBM. Давній технологічний партнер AMD, за деякими, вже незначущим, причин, в сегменті багатопроцесорних серверів залишався вірним Intel.

Набагато менш очікуване (так, простіше кажучи - зовсім несподіване!) Подія літа - почалося приєднання компанії ATI, теж грає свою політичну роль. Тоді як з практичною стороною справи - впливом «спільної творчості» на характеристики кінцевих продуктів нам доведеться почекати. На сьогодні є лише контрпродуктивно наслідок - відсутність підтримки технології CrossFire в чіпсетах 965-ого сімейства від Intel. Перші інженерні зразки плат на цьому чіпсеті мали таку підтримку, але, через проблеми у функціонуванні, вимагали доведення, участь в якій з боку ATI «про всяк випадок» було заморожено.

А оскільки NVIDIA не стала різко міняти пріоритети, а продовжує діяти самостійно, підтримка SLI в интеловских чіпсетах також поки не з'являється. Більш того, і з чіпсетами сімейства nForce 500 від самої NVIDIA справи йдуть не дуже гладко - з'явилися було в анонсах моделі, до сих пір недоступні (а деякі виробники навіть прибрали їх згадки з офіційних сайтів). Причини затримки в постачаннях, як водиться, не коментуються. Але, помноживши ситуацію на маленький вибір і високу вартість плат хоча б з одним графічним портом під Core 2 Duo, в даний конкретний момент, настільна AMD-платформа більшою мірою гідна називатися придбанням для всіх «нормальних людей», тоді як Intel - для окремих «ентузіастів». Що вельми незвично.

Слайд виробничих потужностей AMD як і раніше уміщає всі фабрики, де виробляються процесори архітектури AMD64 (якщо не брати до уваги спільного виробництва на Chartered Semiconductors, який вже працює в повну силу). Відносної новиною є намір переобладнати «стару» Fab 30 для виробництва за нормами 65 нм і більш тонких впровадження нових технологічних процесів. Про ще більш масштабних проектах в США, представники європейського підрозділу, ймовірно, з патріотичних міркувань, не поширюються.

Доповідь продовжив Джузеппе Амато - технічний директор відділу продажів і маркетингу в Європі, на Близькому Сході і Африці.

І відразу поділився ключовими особливостями архітектури, які готуються до випуску в 2007 році чотириядерних процесорів, серед яких:

інтеграція чотирьох ядер на один кристал, що випускається за нормами 65 нм SOI техпроцессора, зі збереженням теплового пакету, характерного для нинішніх двоядерних процесорів;
незалежне динамічне управління частотою і напругою для кожного ядра;
інтегрований контролер пам'яті (двоканальної DDR2-667 / 800) і архітектура Direct Connect для безпосереднього з'єднання процесорів в багатопроцесорної системі.

Але, мабуть, найбільш цікава для аналізу конкурентоспроможності інформація стосується нововведень, що плануються (вже офіційно) в мікроархітектурі чотириядерних процесорів.

Дуже схожу картинку все, що цікавляться темою, вже зустрічали в якості ілюстрації змін, запланованих в ядрі, відомому під кодовою назвою K8L. Таким чином, практично всі вони (принаймні, з тих, що, так чи інакше, озвучувалися і згадувалися) повинні увійти вже в перше покоління чотириядерних процесорів, запланованих до випуску (а точніше - товарної доступності) у другому кварталі 2007 року! А це означає, що AMD має намір перенести вихід свого «відповіді на Intel Core 2» на більш ранній термін навіть щодо найбільш оптимістичних прогнозів (середина 2007 року), що були раніше. Першими на нове ядро перейдуть процесори Opteron і Athlon 64 FX. І це, безсумнівно, найбільш важлива новина.

Кеш-пам'ять в чотириядерних процесорах буде організована в три рівня. І, як особливо (і неодноразово) підкреслюється, упор буде зроблений не на збільшення обсягу, а підвищення ефективності звернення. Чи означає це, що асоціативність кеша L1 зросте, а шина між L1 і L2 рівнями розшириться до 256 біт? З високою ймовірністю - так (в іншому випадку, чому ж домагатися обіцяного, якщо не цими, технічно відносно нескладними і давно напрошується удосконаленнями?).

Популярне розподіл на «ексклюзивну» і «інклюзивну» модель організації кеш-пам'яті поступово втрачає актуальність (вірніше, і раніше існувало більше двох способів організації, а наочною популяризації поділу ми зобов'язані маркетологам AMD, вперше які повідомили про переваги «ексклюзивності» стосовно до процесорів на ядрі K7). На практиці для дво- і багатоядерних процесорів з об'єднаним (тим чи іншим чином) кешем прагнути до чисто ексклюзивної моделі було б дивно. У трирівневої кеш-пам'яті, зв'язка L1 і L2, швидше за все, успадкує ексклюзивний принцип (дані кеш-пам'яті одного рівня доповнюють дані, що зберігаються в іншому, причому певний блок даних може в кожен момент часу знаходитися лише в одному з кешей, що дозволяє говорити про ефективне складання їх обсягів). А L3, крім своїх «ексклюзивних» даних, зможе утримувати і блоки з кешей більш високих рівнів. Проте, вимоги обов'язкового збереження в ньому даних, що знаходяться на інших рівнях, як у процесорах з чисто інклюзивним кешем, не буде. Такий принцип можна назвати «Не інклюзивним» чи «не ексклюзивним», як вам більше подобається.

В цілому задум виглядає переконливо. І AMD, маючи в своєму розпорядженні інтегрований контролер пам'яті, дійсно, немає ніякого сенсу вдаватися до механічного нарощування обсягів внутрішнього кеша. Більш універсальний шлях полягає в прискоренні обміну даними з усім масивом зовнішньої пам'яті, тим більше що потенціал DDR2 на сьогодні ще повністю не розкритий. А як показали дослідження на нашому сайті , Швидкості, на яких сучасна оперативна пам'ять готова обмінюватися даними з процесором, цілком можна порівняти зі швидкостями обміну всередині процесора. Кеш в такому випадку, має сенс мінімізувати в обсязі, але зробити його максимально швидким.

Управління частотою і напругою живлення буде реалізовано для деяких ядер. Алгоритм управління зможе допускати роботу кожного ядра зі своєю частотою, залежно від того, наскільки ресурсоємності, прив'язана до нього в даний момент, завдання.

Прогнози на 2007 і 2008 рік щодо серверного сегмента не зазнали особливих змін в порівнянні з аналогічним «цебітовскім» слайдом. Втім, одне доповнення вельми цікаво - архітектура Direct Connect до 2008 року буде оновлено до другої версії, і одне з нововведень називається Probe Filter. Справа в тому, що, незважаючи на плановане збільшення пропускної здатності шини Hyper-Transport для версії 3.0 до 10,4 Гбайт / c в кожному напрямку, в тих випадках, коли вона використовується для з'єднання між собою процесорів (а не підключення периферії), з ростом числа процесорів, внутрішній трафік може перетворити її в вузьке місце всієї системи. А з планованим появою четвертого HT-каналу у старших моделей Opteron, AMD спрощує (і заохочує) завдання побудови 8-процесорних конфігурацій. Зазначений «фільтр» повинен розвантажити цю шину за рахунок пересилки між кеш-пам'ятями процесорів лише необхідної інформації! Технічні деталі поки не розголошуються, і серверні гуру можуть придумати свої способи реалізації (щоб згодом порівняти з оригіналом).

Принциповим, на думку представників AMD, відмінністю її чотириядерних процесорів, від, які готуються до випуску вже в четвертому кварталі 2006 року, процесорів Intel на ядрі Kentsfiled / Clovertown, є «природна» чотирьохядерним - всі чотири ядра поміщаються на одному кристалі і мають загальну кеш пам'ять. Тоді як Intel лише «склеює» два кристала з існуючого нині двоядерного сімейства Conroe / Woodcrest, щоб прискорити вихід свого продукту. Оскільки взаємодіяти процесорам в такому випадку доводиться через зовнішню шину і чіпсет, такий підхід нагадує використовувався в Pentium D, і, звичайно, не викликає захоплення витонченістю технічного рішення. Також Intel доведеться знизити частоту шини з 1333 до 1066 МГц, що теж не можна назвати прогресом. З іншого боку, кінцевим споживачам, як правило, байдуже, наскільки красиво, з інженерної точки зору, реалізована начинка придбаної техніки, тому вирішальне слово матимуть тести продуктивності готових продуктів.

Але побічним явищем «склеювання» ядер буде цілком природне збільшення енергоспоживання, яке точно можна порівнювати прямо зараз, оскільки величини TDP для процесорів і інших компонентів платформи (чіпсетів, пам'яті) вже відомі. Переходячи до теми енергоспоживання, доповідач зазначив два моменти:

практичне значення для споживача (володіє значним серверним парком і прагне заощадити на електроенергії) цей показник має лише при порівнянні споживання всієї платформи, а не вибірково процесорів. І в такому порівнянні, виявляється, що навіть платформа на нинішньому двоядерному Opteron (90 нм SOI) виграє у Xeon-Woodcrest (65 нм), оскільки не потребує зовнішнього контролері пам'яті і використовує DDR2-пам'ять, істотно більш економічну, в порівнянні з першим поколінням FBDIMM;
при переході на чотириядерні процесори, перевага AMD-платформи збільшиться, оскільки Intel, по згаданих причин, змушена буде розширити теплової пакет щодо двоядерного сімейства, а у AMD він залишиться незмінним (хоч, і відзначимо, по абсолютній величині для середніх моделей в лінійці, що перевищує «интеловский»).

Цікаво, що оцінки AMD грунтуються на досить консервативних даних, реальне споживання перших интеловских четирех'ядерніков, що вже демонструється незалежними тестами, практично вдвічі вище двоядерних прототипів, і досягає рівня «екстремальних» моделей колишнього Netburst-сімейства. Для тих, хто планує з часом оновити процесори, на купленій зараз платформі під Intel Conroe / Woodcrest, ця обставина може створити цілком певні труднощі, якщо перетворювачі харчування на вашій платі виявляться недостатньо потужними. Втім, та ж практика показує, що запустити нові процесори, вдається, іноді, і на досить старих платах, але оптимальним вибором є спеціально оптимізовані для них. І Intel, зацікавлена в збуті своїх товарів, серед яких значаться не тільки процесори, звичайно, не пропустить нагоди запропонувати споживачам спочатку оновлені версії плат, а потім і чіпсетів, спеціально для нової платформи.

У заключній частині, Джузеппе Амато приділив увагу ідеологічному питання - як «багатоядерність» буде впливати на «многопроцессорность».

Кількість ядер у процесорів зростає, і, на перший погляд, в чотирьохядерних епоху, пари-трійки двопроцесорних серверів, повинно вистачати для «обслуговування» вельми великих проектів. Дорогі 4 і 8-процесорні системи остаточно «ховаються» в область наукових обчислень і моделювання, а для бізнесу досить систем «простіше»? Не зовсім так.

У многопроцессорного сервера в порівнянні з декількома двухпроцессорними, при спочатку більш високу вартість, нижче витрати на експлуатацію та управління. На практиці часто можна обійтися меншим загальною кількістю фізичних процесорів.

Така «пам'ятка покупцеві» ще раз демонструє, що для різних класів задач існують свої найкращі схеми організації серверів (на базі одно-, дво- і багатопроцесорних) конфігурацій.

Частина 2. Комплексна методика оцінки продуктивності і енергоспоживання

Чи означає це, що асоціативність кеша L1 зросте, а шина між L1 і L2 рівнями розшириться до 256 біт?
В іншому випадку, чому ж домагатися обіцяного, якщо не цими, технічно відносно нескладними і давно напрошується удосконаленнями?
Дорогі 4 і 8-процесорні системи остаточно «ховаються» в область наукових обчислень і моделювання, а для бізнесу досить систем «простіше»?