В продолжение темы о русской электронике...

Автор unihorn, 23.03.2007 23:58:02

« назад - далее »

0 Пользователи и 3 гостей просматривают эту тему.

zyxman

ЦитироватьСудя по даташиту есть компилятор С:
Это не даташит, а скорее рекламный проспект - как тут любят говорить "веселые картинки", причем нехорошие картинки - ведь купить девайс все равно еще нельзя.
Причем что еще странно - компилятор Си якобы есть, но скачать его нигде нельзя - такой секретный военный компилятор :lol:
Хотя скорей всего это означает, что с компилятором Си какие-то проблемы, что они его пока не могут показать - может он просто не дает реального распараллеливания, или валится на компиляции, а может лицензионные проблемы, а может у них Си по ДСП проходит :wink: , а может и еще что-то или несколько проблем сразу.

Вообще я лично уже тут говорил и продолжаю настаивать, что стандартный Си не даст серьезного распараллеливания - нужно либо вставлять в Си подпорки (я себе представляю этот кошмар), либо брать более высокоуровневый язык, специально заточенный на массовое распараллеливание, например, Эрланг или Оберон.
ЦитироватьКроме того, в тему зафлужения шины:
Multicellular architecture patented by MultiClet Corp. in contrast to traditional von-Neumann architecture doesn't operate with rank-order commands, but with statements which consist of commands. Operations within the statements are launched without memory involvement.
Мы говорили про зафлуживание внутренней шины, а тут говорится что оно не обращается к внешней памяти.

Вообще никто не спорит что идея красивая. Но пока это только идея - ну вот вы представьте себе, что сейчас народ всё бросит и начнет винды с офисами и  фотошопами переписывать на этом ассемблере :lol:

- Знаете, есть американская пословица - "кто придумал получает доллар, кто сделал 10 долларов, кто продал - 100 долларов".
- Я сам буду страшно рад если появится в продаже что-то действительно радикально новое, но пока не увижу обзора от какого-нибудь thg или Arstechnika или хотя-бы foronix, не могу считать что оно есть, а полной реальностью оно для меня станет, когда я увижу что могу пойти и купить девайс в магазине.
"Демократия, это когда царь умный, а также добрый и честный по отношению к своим холопам".
--
Удача - подготовленный успех!

dmdimon

странно, второго поста нет... Zyxman, все эти обзоры есть на synputer - оно так называлось до введения ТМ "мультиклет". В том числе утверждения о существовании ANSI C - компайлера.
Кроме того, у них на сайте есть дока с очень внятным авторским описанием. Ссылка была в том посте, что пропал - и дома, так что поройте сами. Очень интересно и впечатляюще, в частности - там действительно распараллеливание всего происходит автоматически и динамически. имхо что-то типа _каждая_ команда процессора - это тред с семафорами и данными - и все это прямо в железе. Плюс там насчет интерконнекта было - что-то про их патентованный супергрид если правильно помню.
push the human race forward

zyxman

ЦитироватьОчень интересно и впечатляюще, в частности - там действительно распараллеливание всего происходит автоматически и динамически. имхо что-то типа _каждая_ команда процессора - это тред с семафорами и данными - и все это прямо в железе.
Вы бы английский поучили, чтоли.. И заодно низкоуровневое программирование..
- Чем использовать имхо, можно просто прочитать в документации, что у них исполняются САМЫЕ ОБЫЧНЫЕ ассемблерные команды, но только добавлены команды, оформляющие начало/конец независимой группы команд (они ее зовут параграфом) и естественно в железе поддержка этого по сути трида.
То есть в принципе, если не использовать эти самые параграфы, это будет работать как самый обычный фон-Нейман.
Или другими словами, это просто такой альтернативный подход к супескалярности - современные суперскаляры пытаются делать опережающее исполнение программы, а если ветка выполняется зря (в общем случае заранее неизвестно, будет ли данная ветка исполняться вообше), то данные просто уничтожаются; тут-же они не пытаются делать опережающее исполнение а явно указывают КОМПИЛЯТОРОМ, что вот данная ветка кода независимая.

И вот конкретно, как порубить программу на независимые параграфы, это на самом деле проблема проблем - если-бы она была легкорешаема, то никто бы с современными суперсложными суперскалярами не заморачивался.
"Демократия, это когда царь умный, а также добрый и честный по отношению к своим холопам".
--
Удача - подготовленный успех!

Татарин

ЦитироватьТо есть в принципе, если не использовать эти самые параграфы, это будет работать как самый обычный фон-Нейман.
Нет. Даже так не будет. Упускается вторая фишка системы: упрощение передачи результатов от команды к команде.

ЦитироватьИли другими словами, это просто такой альтернативный подход к супескалярности
Если так натягивать, то любой процессор - альтернативная трактовка машины Тюринга.

ЦитироватьИ вот конкретно, как порубить программу на независимые параграфы, это на самом деле проблема проблем
Мешаете в кучу коней, людей и залпы орудий. Есть существенная разница между проблемой распараллеливания произвольного алгоритма (действительно, очень большим вопросом, уровня P=NP, а то и покруче) и проблемой выделения участка кода, где _последовательно_ выполняемые команды могут быть выделены в параграф.
В этом-то и красота идеи: "третий путь". Ребята действительно нащупали новое.
И если уж сравнивать с существующими архитектурами, то это, конечно, не суперскаляр, а VLIW, VLIW с переменным числом команд в слове.
Раз уж задача наиоптимального распределения команд по словам оказалась такой сложной, тут решили облегчить компилятору жизнь,  сделали слово VLIW переменной длины и убрали ограничение на независимость команд в слове друг от друга.
Получился тот самый "параграф".

Красиво. Красиво же, черт побери! :)

dmdimon

ЦитироватьВы бы английский поучили, чтоли.. И заодно низкоуровневое программирование..
смешно. По каким признакам вы оценили мое владение английским и ассемблером?
http://www.multiclet.com/index.php?option=com_content&view=article&id=112&Itemid=74&lang=ru
Архитектурные особенности
 
1. От фон-неймановской модели мультиклеточная архитектура отличается непосредственным указанием информационных связей между операциями и, соответственно, снятием требования упорядоченного размещения описаний операций в программе.
Эта неупорядоченность делает ненужными все те методы (суперскалярность, широкое командное слово, суперконвейер, предсказание переходов и т.п.), которые резко усложняли процессы проектирования процессора и инструментальных программных средств.
2. От известных не-фон-неймановских архитектур она отличается использованием традиционных императивных языков программирования, последовательным способом выборки команд, использованием для указания информационных связей не адресов команд, а значений динамически формируемых тегов, а также механизмом исполнения команд - не только по «готовности данных», но и по «готовности потребителей ее результата».
3. Система команд клетки, основана на промежуточном представлении компилируемой программы после синтаксического анализа (триадах) и, фактически, является аппаратной реализацией входного языка программирования.
4. Неупорядоченность триад обеспечивает, при необходимости, получение после каждой компиляции индивидуального объектного кода для каждого процессора. Это, а также замкнутость подмножеств триад, резко ограничивают возможности незаметного и несанкционированного вмешательства извне в работу системного программного обеспечения.
5. Триады обеспечивают возможность одновременного чтения и исполнения нескольких команд без анализа их очередности выполнения и информационной связности т.е. обеспечивают «естественную» реализацию параллелизма.
6. Полносвязная интеллектуальная коммутационная среда, работающая в режиме «широковещательной» рассылки, не вносит каких-либо топологических ограничений на межклеточный обмен данными и, следовательно, обеспечивает эффективную реализацию любого класса задач, а также эффективное масштабирование процессора.
7. Откомпилированная программа может быть выполнена на любом количестве клеток. При этом возможно динамическое изменение их количества, что обеспечивает реализацию методологии постепенной деградации процессора при отказах его клеток. Подобная независимость кода от используемых ресурсов создает также основу решения проблем непрерывной самоадаптации процессора к потоку задач и его самовосстановления после сбоев или после подключения новых ресурсов.


курим пункты 1-3 и 5

Кроме того курим MCP_concept_rus
http://www.multiclet.com/docs/ru/MCP_concept_rus.doc

в частности стр. 12-13

и затем на стр. 34:
...
Машинный язык процессора является развитием языка триад.

кстати, там-же:
процесс компиляции с языка высокого уровня, фактически, ограничивается начальной машинно-независимой («front-end») фазой, что позволяет резко сократить затраты на разработку компиляторов;
исчезает понятие «программирование на ассемблере», поскольку язык процессора не наглядный и поэтому практически «не программируемый»
push the human race forward

zyxman

Цитировать
ЦитироватьВы бы английский поучили, чтоли.. И заодно низкоуровневое программирование..
смешно. По каким признакам вы оценили мое владение английским и ассемблером?
http://www.multiclet.com/index.php?option=com_content&view=article&id=112&Itemid=74&lang=ru
Архитектурные особенности
...
кстати, там-же:
процесс компиляции с языка высокого уровня, фактически, ограничивается начальной машинно-независимой («front-end») фазой, что позволяет резко сократить затраты на разработку компиляторов;
исчезает понятие «программирование на ассемблере», поскольку язык процессора не наглядный и поэтому практически «не программируемый»
Вы конкретно документацию на их ассемблер и систему команд курили?
А хоть какие-то цифры и нормальные научные обоснования вышеописанных преимуществ видели?
- А то что вы тут привели есть типичнейший маркетинговый булшит, с таким весомым совковым уклоном в "уникальные технологии, не имеющие аналогов в мире" и на грани религии.
"Демократия, это когда царь умный, а также добрый и честный по отношению к своим холопам".
--
Удача - подготовленный успех!

zyxman

ЦитироватьИ если уж сравнивать с существующими архитектурами, то это, конечно, не суперскаляр, а VLIW, VLIW с переменным числом команд в слове.
Нет там никакого VLIW, не выдумывайте.
Я честно перелопатил весь их псевдотеоритический булшит, из которого принцип не понятен, а видна только необоснованная "бездна возможностей", а потом просто открыл документацию на ассемблер и попробовал посоставлять простенькие програмки, и я никакой разницы с типичными ассемблерами не увидел, кроме  вот тех самых тегов, оформляющих начало/конец независимой группы команд.
"Демократия, это когда царь умный, а также добрый и честный по отношению к своим холопам".
--
Удача - подготовленный успех!

goran d

Цитировать
ЦитироватьИ если уж сравнивать с существующими архитектурами, то это, конечно, не суперскаляр, а VLIW, VLIW с переменным числом команд в слове.
Нет там никакого VLIW, не выдумывайте.
Я честно перелопатил весь их псевдотеоритический булшит, из которого принцип не понятен, а видна только необоснованная "бездна возможностей", а потом просто открыл документацию на ассемблер и попробовал посоставлять простенькие програмки, и я никакой разницы с типичными ассемблерами не увидел, кроме  вот тех самых тегов, оформляющих начало/конец независимой группы команд.

Ети теги - ни чуть не уникальные. В Итаниумах в каждом слове есть 5 битов которые указывают в том числе и то являетса ли следующее слово зависимым или нет.

zyxman

ЦитироватьЕти теги - ни чуть не уникальные. В Итаниумах в каждом слове есть 5 битов которые указывают в том числе и то являетса ли следующее слово зависимым или нет.
Спасибо, очень хорошее уточнение - у меня в голове крутилось что такое там есть, но никак не мог красиво сформулировать.
Только я добавлю, что как раз в том числе и в этом и состоит проблематичность написания компилятора для Итаниума.

И получается вообще как обычно - Интел не смог "а мы сможем, потому что..." (с)

PS И вообще как-то некрасиво - при всей моей нелюбви к Интел, Итаниум еще не настолько дохлый, чтобы его не упомянуть среди предшественников, пытавшихся реализовать такую идею в описании очередной отечественной "уникальной технологии"..
Вобщем нам еще учиться и учиться цивилизации.
"Демократия, это когда царь умный, а также добрый и честный по отношению к своим холопам".
--
Удача - подготовленный успех!

Татарин

Цитировать
ЦитироватьИ если уж сравнивать с существующими архитектурами, то это, конечно, не суперскаляр, а VLIW, VLIW с переменным числом команд в слове.
Нет там никакого VLIW, не выдумывайте.
Конечно, нет. VLIW - просто наиболее близкое к тому, что они придумали.
А суперскаляр там на том же расстоянии, как и машина Тюринга.

ЦитироватьЯ честно перелопатил весь их псевдотеоритический булшит, из которого принцип не понятен, а потом просто открыл документацию на ассемблер и попробовал посоставлять простенькие програмки, и я никакой разницы с типичными ассемблерами не увидел, кроме  вот тех самых тегов, оформляющих начало/конец независимой группы команд.
Значит, Вы ничего не поняли в идее и ассемблере. Бывает. Но это же Ваша проблема. Почему Вы своё непонимание пытаетесь представить как проблемы процессора? :)

Я-то понял. При привычке читать документацию, там всё достаточно просто и внятно расписано.

Татарин

ЦитироватьТолько я добавлю, что как раз в том числе и в этом и состоит проблематичность написания компилятора для Итаниума.
И именно эту проблему обошли.
Чего Вы, видимо, так и не поняли, раз суть идеи "крутилась в голове, но сформулировать не смог". Может, идею стОит сначала понять, а уж затем о(б)суждать? :)
По-моему, это правильный способ действий.

ЦитироватьИ получается вообще как обычно - Интел не смог "а мы сможем, потому что..." (с)
Да, так обычно и бывает. Какие-то идеи имеют косяки, и эти косяки исправляют какие-то новые идеи. А к чему это?

ЦитироватьPS И вообще как-то некрасиво - при всей моей нелюбви к Интел, Итаниум еще не настолько дохлый, чтобы его не упомянуть среди предшественников,
VLIW ни разу не предшественник. А Итаниум - даже не первая попытка реализации VLIW.

Цитироватьпытавшихся реализовать такую идею в описании очередной отечественной "уникальной технологии"..
Вы падаете в сугубый бред. Как, ну как Вы можете не понимая ничего ни в архитектуре Itanium'а или Мультиклета, ни в разницах между ними, кого-то упрекать?
Ну как так вообще можно?
Вас самих это не раздражает?

ЦитироватьВобщем нам еще учиться и учиться цивилизации.
О, да.
Вам цивилизации ещё учиться и учиться. :)

Как и русскому языку. "В общем" - пишется раздельно.

zyxman

Цитировать
ЦитироватьТолько я добавлю, что как раз в том числе и в этом и состоит проблематичность написания компилятора для Итаниума.
И именно эту проблему обошли.
Чего Вы, видимо, так и не поняли, раз суть идеи "крутилась в голове, но сформулировать не смог". Может, идею стОит сначала понять, а уж затем о(б)суждать? :)
По-моему, это правильный способ действий.
Способ-то правильный, но вы сами уверены, что поняли, почему Интел сделал именно так а не иначе? - Почему Интел не пошел вот именно путем мультиклета?
- Ну это же абсолютно логично - взять уже готовый, имеющийся дизайн суперскаляра и добавить ему информацию от компилятора о независимости частей кода - и пожалуйста - можно суперскалярность поднимать до невиданных высот.
- Не задумывались, что Интел такой вариант прорабатывал, и там обнаружил какие-то принципиально неустранимые косяки?
"Демократия, это когда царь умный, а также добрый и честный по отношению к своим холопам".
--
Удача - подготовленный успех!

Татарин

Цитировать- Ну это же абсолютно логично - взять уже готовый, имеющийся дизайн суперскаляра и добавить ему информацию от компилятора о независимости частей кода - и пожалуйста - можно суперскалярность поднимать до невиданных высот.
Ну мы же оба понимаем, что у любых двух произвольно взятых нынешних процессорных архитектур можно найти схожие моменты. И, конечно, люди   (с мозгами, в смысле) перед тем, как создать что-то новое, изучают удачи и неудачи предшественников. Идея о том, что компилятор будет подсказывать процессору о зависимостях и порядке исполнения - это ни разу не суперскаляр. Это вот то самое принципиальнейшее отличие двух веток.

Оно же - сходство с VLIW.

Принципиальные отличия от VLIW тоже очевидны (и назывались):
- отсутсвует само "сверхдлинное слово" команд как таковое (суть VLIW, изложеная даже в сокращении). Куда меньше ограничений накладывается на компилятор, а значит - его проще писать и в большинстве случаев он будет эффективней;
- идея с этим их "коммутатором" для промежуточных результатов вместо сложной системы переименовывания регистров упрощает железо и ускоряет работу.

На мой ламерский взгляд очень красиво расшиты главные бутылочные горлышки предыдущих архитектур, при полной совместимости с традиционной парадигмой программирования. С архитектурой будут отлично работать все классические императивные языки - от С до С#.

Тут можно было б сослаться на чертей в деталях, которые делают идею не столь выгодной. Но пока то, что они говорят о железе, воодушевляет: довольно маленький расход энергии на операцию говорит о том, что система на практике получилась достаточно "лёгкой".
Значит (с известными оговорками), наращивание мощности и частот - вопрос времени.

Цитировать- Не задумывались, что Интел такой вариант прорабатывал, и там обнаружил какие-то принципиально неустранимые косяки?
Очевидно!

Если Интел не реализовал какой-то вариант, который прорабатывал, это значит, что он не нашёл там профита. Но. Тут нет никакой связи с утверждением "Интел уже рассматривал архитектуру Мультиклета" или, тем более, утверждением "Мультиклет имеет неустранимые косяки, котогрые деляют его принципиально хуже суперскаляра" :)

Фактически, Вы утверждаете забавную вещь: никаких новых  выгодных подходов за пределами Интела выдумать нельзя, потому что
а) до них можно было додуматься (раз додумались - это очевидно);
б) а значит, :) Интел до них уже додумался и отказался из каких-то соображений. :)

Ну смешно же. :)

goran d

ЦитироватьИдея о том, что компилятор будет подсказывать процессору о зависимостях и порядке исполнения - это ни разу не суперскаляр. Это вот то самое принципиальнейшее отличие двух веток.

Даже если компилятор подсказывает процессору о зависимостях, ето все равно есть ничто иное как суперскаляр. Только без вне-очередного выполнения инструкций. Кроме того процессору все равно придетса делать некую хардуерную проверку зависимостей, иначе неправильный код может сделать короткое замыкание если 2 инструкции пишут в 1 реестр.

zyxman

ЦитироватьФактически, Вы утверждаете забавную вещь: никаких новых  выгодных подходов за пределами Интела выдумать нельзя, потому что
а) до них можно было додуматься (раз додумались - это очевидно);
б) а значит, :) Интел до них уже додумался и отказался из каких-то соображений. :)

Ну смешно же. :)
Я утверждаю, что этот путь совершенно очевиден для любого процессоростроителя.
И также я утверждаю, что на пути к Итаниуму наверняка то что мы рассматриваем было промежуточным звеном.
Вот ход мысли:
1. у нас есть суперскаляр, главная проблема которого, что не смотря на все сложности, используемые, чтобы уменьшить потери от опережающего исполнения, всё равно коэффициент умножения у суперскаляров мал.
2. Надо еще и еще мегагерцев.
3. В процессе поиска путей добавки приходим к тому, что мы на этапе компиляции теряем информацию, которую можно было-бы использовать для увеличения коэффициента умножения, либо для упрощения суперскаляра.

4. Вот оно решение (между прочим применялось и применяется процессоростроителями уже лет 30 точно) - прицепить к командам или к группам комманд теги, указывающие на независимость комманд или групп комманд.

Вот теперь попробуйте сами посчитать НА ПАЛЬЦАХ, какая разница между тегом прицепляемым прямо на комманду и тегом группы команд?
- Напишите сами, где выигрыш на паре ситуаций (подсказываю: ситуации отличаются средней длиной блока независимых или зависимых команд).

И второй вопрос: вот у нас допустим есть готовая программа. Как зависит возможность распараллеливания программы (сколько ядер загрузит программа) от средней длины блока независимых/зависимых команд? Считаем, что время задержки обмена информацией между ядрами несущественно малое.

И прошу прощения, но еще третий вопрос: какая пропускная способность шины потребуется, чтобы загрузить работой 1, 2, 4, 8, N ядер?
"Демократия, это когда царь умный, а также добрый и честный по отношению к своим холопам".
--
Удача - подготовленный успех!

Вадим Семенов

Цитировать
ЦитироватьСудя по даташиту есть компилятор С:
Это не даташит, а скорее рекламный проспект - как тут любят говорить "веселые картинки", причем нехорошие картинки - ведь купить девайс все равно еще нельзя.
Причем что еще странно - компилятор Си якобы есть, но скачать его нигде нельзя - такой секретный военный компилятор :lol:
Хотя скорей всего это означает, что с компилятором Си какие-то проблемы, что они его пока не могут показать - может он просто не дает реального распараллеливания, или валится на компиляции, а может лицензионные проблемы, а может у них Си по ДСП проходит :wink: , а может и еще что-то или несколько проблем сразу.

Так сделаноунас известный желтый (пропагандитский) сайт. Цитировать его признак дурного тона и несолидности собеседника. Всерьез его воспринимать невозможно. Если там написано "начались перевозки новым видом транспорта новых грузов" на деле может оказаться "зоотехник петр смастерил тележку и вывез из свинарника первую тонну навоза".

Во всяком случае в чем достижение пока совершенно непонятно. Что вообще хоть что-то спроектировали? Дак это давно не фокус. Давно уже существуют библиотеки компонентов, созданные конторами, которые могет приобресть любой желающий, во всяком случае на такое далеко не выдающееся быстродействие как 100MHz. А далее из них слепить свою "систему на кристале" (примерно как раньше их мелкосхем в индивидуальных корпусах) и заказать владельцу библиотеки испечь чип. Компоненты есть вплоть до тех самых микропроцессорных ядер, коих там заявлено 4. Разработчик ядер наверняка и какие-то средства программирования предоставляет, может быть тот же компилятор С. Слепить их 4 штуки задача уровня студенческой дипломной работы, если не курсовой.

Сами чип испекли? Да, вроде какие-то фабрики на сколько-то там нанометров за рубежом покупали. Однако сомнительно, что владелец библиотеки компонентов это позволил бы, да и внутреннее устройство компонентов скорее всего не разглашается. Во всяком случае буквы на корпусе у сего девайса какие-то нерусские. Вобщем, если отбросить пропагандисткую шелуху для чайников, в чем суть достижения пока совершенно непонятно.

Для инфррмации:

ЦитироватьСегодня активное развитие получила индустрия полупроводниковых виртуальных компонентов, или IP-блоков (Intellectual Property — «интеллектуальная собственность»). Как следствие, на рынке вместо крупных вертикально интегрированных компаний с полным циклом разработки и производства микросхем появились отдельные полупроводниковые производства, связанные с ними сервисы тестирования и корпусирования микросхем, интегрирующие компании — разработчики микросхем, не имеющие собственного производства (fabless), и компании — разработчики IP-блоков.

Если раньше интегратор проектировал электронное устройство на печатной плате из множества физических компонентов, то сейчас речь идет о системах на кристалле, где те же компоненты интегрированы непосредственно в кремний. Эти компоненты на этапе поставки интегратору являются виртуальными, а не физическими. Такие компоненты получили в индустрии название ядра полупроводникового интеллектуального продукта (Semiconductor Intellectual Property, SIP).

Среди продуктов SIP-индустрии можно выделить несколько классов.

- Базовые SIP-библиотеки нижнего уровня, состоящие из стандартных логических элементов низкого уровня, триггеров, защелок, элементов ввода/вывода данных с чипа и буферов памяти. Эти элементы выполнены топологически как ячейки фиксированной высоты и переменной ширины, что является ключевым свойством для поддержки автоматической трассировки межсоединений между линейками таких элементов на кристалле. Топология этих ячеек выполняется полностью заказной, чтобы уменьшить задержки сигнала и площадь на кристалле. Базовые библиотеки предоставляются как поставщиками индустрии, так и большинством кремниевых фабрик, предоставляющих «технологические библиотеки», в которых один и тот же логический элемент низкого уровня может иметь несколько вариантов исполнений.

- SIP-модули памяти SRAM, неразрушаемая память типа Flash, EEPROM, динамические модули памяти DRAM и 1T-SRAM.

- Интерфейсные или стандартные SIP-модули, которые реализуют спецификации общепринятых стандартов для коммуникаций, такие как USB-1,2,3, PCI, IEEE1394 (Firewire), IrDA, Bluetooth or 802.11 и др.

- Процессорные SIP-ядра, включая обычные микропроцессоры, процессоры обработки сигналов, графические и видеопроцессоры, а также специализированные ядра.

- Аналоговые блоки, которые обычно предоставляются только в «твердой» форме, ориентированной на конкретный технологический процесс на выбранной кремниевой фабрике.

- Вычислительные платформы, которые могут состоять из модульных вычислителей, реконфигурируемых FPGA-блоков и специализированных процессорных блоков.

Полностью: http://www.osp.ru/os/2012/03/13015149/
Гипотеза о боге дает ни с чем не сравнимую возможность абсолютно все понять, абсолютно ничего не узнавая.
А. и Б. Стругацкие "Пикник на обочине".

Татарин

ЦитироватьЯ утверждаю, что этот путь совершенно очевиден для любого процессоростроителя.
В смысле, архитектура мультиклета - очевидна? :) Хм. Сильное утверждение.
Вас не затруднит тогда показать ссылки на публикации по теме НЕ этой конторы?
Вот, скажем, по VLIWи EPIC  публикации были задолго до PA8000/PA9000 и Итаниума.

ЦитироватьИ также я утверждаю, что на пути к Итаниуму наверняка то что мы рассматриваем было промежуточным звеном.
? Я не рассматриваю мультиклек как "промежуточное звено" на пути к Итаниуму. Это просто не так с любой точки зрения - технической, исторической и даже с точки зрения простой логики.

Цитировать4. Вот оно решение (между прочим применялось и применяется процессоростроителями уже лет 30 точно) - прицепить к командам или к группам комманд теги, указывающие на независимость комманд или групп комманд.
Именно так и пришли к VLIW и Итаниуму.

ЦитироватьВот теперь попробуйте сами посчитать НА ПАЛЬЦАХ, какая разница между тегом прицепляемым прямо на комманду и тегом группы команд?
Мы ходим по кругу. Эта разница и преимущества над VLIW уже указазывались неоднократно. Вы эту разницу просто трёте и раз из разу начинаете "я не понял"/"покажите" с вариациями. Давайте возьмём конкнретное моё утверждение и обсудим его. Например: в отличие от VLIW теги позволяют куда более гибко формировать блоки команд, что упрощает компилятор и увеличивает количество "удачных" для процессора случаев.

Цитировать- Напишите сами, где выигрыш на паре ситуаций (подсказываю: ситуации отличаются средней длиной блока независимых или зависимых команд).
Разве это не очевидно?
Во-первых, мы выигрываем тупо на размере тега. Если у нас как в итанике 3 команды на слово и всегда на каждое слово имеем описание команд (некий частичный функциональный аналог тега), то в случае длинных последовательностей команд мультиклета мы выигрываем уже на этом.

Во-вторых, очевидно, что если последовательность команд не кратна 3, мы теряем на nop-ах (мы теряем не только память, мы теряем скорость). Так или иначе во VLIW мы должны выравниваться.

В-третьих, мы жестко привязаны к числу команд в слове, следовательно - числу FU. В мультиклете - нет.


ЦитироватьИ второй вопрос: вот у нас допустим есть готовая программа. Как зависит возможность распараллеливания программы (сколько ядер загрузит программа) от средней длины блока независимых/зависимых команд?
Тут у Вас возникает какая-то каша. Вы же сами чуть выше просили собеседника ознакомиться с основами и общепринятой терминологией. Причём тут какие-то ядра?
Клетки в мультиклете - это ни разу не ядра, они не выбирают команды самостоятельно. В общепринятых терминах это просто своеобразные FU - исполнительные устройства, если по-русски.
Точно так же, как и в интел-корах-с-номером исполнительные устройства - части ядра, которым даются готовые к исполнению команды. Уже выбраные команды, готовые к исполнению - это очень важно.

Давайте, Вы переформулируете свои вопросы в общепринятых терминах?
Потому что когда Вы спрашиваете:
ЦитироватьИ прошу прощения, но еще третий вопрос: какая пропускная способность шины потребуется, чтобы загрузить работой 1, 2, 4, 8, N ядер?
- я не могу понять - идёт ли речь о шине процессор-память, внутренней шине команд или же о шине коммутатора, который обеспечивает обмен данными между ИУ?

Татарин

ЦитироватьТак сделаноунас известный желтый (пропагандитский) сайт. Цитировать его признак дурного тона и несолидности собеседника.
Сделаноунас - просто набор перепечаток самых разных источников.
Как и любой агрегатор воспринимать его можно по-разному, но ничего "жёлтого" или "пропагандисткого" там нет.
признак дурного тона - навязывать всем своё своеобразное мнение, выдавая его за абсолютную истину (что, кстати, и является признаком "желтизны").

ЦитироватьВо всяком случае в чем достижение пока совершенно непонятно.
Непонятно ВАМ. ВАМ лично - непонятно. Это ВАШИ проблемы, решайте их самостоятельно. Причём тут мужики-то? :)

Достижение в том, что разработана весьма забавная оригинальная архитектура, которая обещает решение некоторых проблем индустрии.

А всё остальное Вами сказаное - и есть пропагандисткая шелуха в стиле "я ничего не понимаю, но мнение своё выскажу".
Это неправильно.

zyxman

Цитировать
ЦитироватьЯ утверждаю, что этот путь совершенно очевиден для любого процессоростроителя.
В смысле, архитектура мультиклета - очевидна? :) Хм. Сильное утверждение.
Вас не затруднит тогда показать ссылки на публикации по теме НЕ этой конторы?
Вы разучились отделять глянцевую упаковку от содержимого.
Мне лень искать, но тут НЕЧЕГО публиковать, потому что это дается в приличном ВУЗе в виде максимум курсовой, даже не диплома.

Цитировать
Цитировать- Напишите сами, где выигрыш на паре ситуаций (подсказываю: ситуации отличаются средней длиной блока независимых или зависимых команд).
Разве это не очевидно?
Нет, это не очевидно. Посчитайте на калькуляторе несколько случаев разной длины блока (скажем, начиная от 3 команд - не стоит надеяться что в общем случае будет сильно больше) и увидите.
Ну в самом деле, неужели вы думаете, что инженеры и в Intel дураки и в HP тоже, и в AMD, VIA, IBM и в прочих (если хотите я тут дам список более десятка процессоростроительных фирм) не заметили такую простую вещь?

Вообще проблема обсуждения в том, что вы сразу перепрыгиваете на VLIW, а я предложил обсудить УЧЕБНЫЙ случай, а именно, ПРОСТОЕ процессорное ядро, для простоты взять канонический load-store RISC (канонический CISC тут менее удобен, тк у него весь интерес в командах, работающих одновременно с несколькими регистрами и памятью).
"Демократия, это когда царь умный, а также добрый и честный по отношению к своим холопам".
--
Удача - подготовленный успех!

dmdimon

ЦитироватьВы разучились отделять глянцевую упаковку от содержимого.
Мне лень искать, но тут НЕЧЕГО публиковать, потому что это дается в приличном ВУЗе в виде максимум курсовой, даже не диплома.
Если вы чего-то не увидели - это не значит, что этого не существует.

2003 – synputer gained a prize in nomination "The best product of the Year" at the forum of new products presented at Annual International Signal Processing Conference in Dallas, USA.
push the human race forward