Однородные вычислительные системы
Moderator: Shaos
-
- Writer
- Posts: 19
- Joined: 06 Sep 2007 07:05
- Location: 212.26.238.228
Интересно, патент на такую архитектуру есть? А то, может, сделать, пока корпорации не хапнули? У кого есть опыт?
Надо ещё выяснить, можно ли на какой-нибудь стандартной девборде в принципе запустить такую ось. Стандарт пока можно не делать, достаточно написать proof of concept на одной конкретной плисине и измерить производительность и потребление на типовых задачах (как делали авторы мультиклета).
Почему-то, несмотря на наличие конверторов, ещё никто не пробовал скомпилить в верилог Dhrystone или CoreMark и проверить на реальном железе скорость.
Надо ещё выяснить, можно ли на какой-нибудь стандартной девборде в принципе запустить такую ось. Стандарт пока можно не делать, достаточно написать proof of concept на одной конкретной плисине и измерить производительность и потребление на типовых задачах (как делали авторы мультиклета).
Почему-то, несмотря на наличие конверторов, ещё никто не пробовал скомпилить в верилог Dhrystone или CoreMark и проверить на реальном железе скорость.
-
- Banned
- Posts: 2139
- Joined: 20 Mar 2005 13:41
- Location: От туда
-
- Admin
- Posts: 23989
- Joined: 08 Jan 2003 23:22
- Location: Silicon Valley
1. гасим и поднимаем FPGA подсовывая ей нужную памятьHardWareMan wrote:А затем, что:Shaos wrote:а зачем заливать через процессор, если FPGA из внешней памяти без всяких процов умеет заливаться?
1. FPGA заливается только 1 раз и только при поверапе.
2. Память нужна не простая, а с определенным алгоритмом.
3. Первый пункт может обходиться через AS.
2. обычно поддерживается букет протоколов, включая SPI, QSPI и т.д.
3. что есть AS?...
P.S. мне это не нравится, т.к. прошивка должна готовится в программном пакете от производителя чипа - это идеологически неверно, что юзеру, чтобы поюзать такой комп надо ставить несколько гигов левого барахла на свой PC...
Я тут за главного - если что шлите мыло на me собака shaos точка net
-
- Admin
- Posts: 23989
- Joined: 08 Jan 2003 23:22
- Location: Silicon Valley
а как же?alone wrote:Интересно, патент на такую архитектуру есть?

в наше время патентами покрыто практически всё мыслимое и немыслимое в софтверно-хардверном плане...
чтобы патент сделать нужна конкретика и, желательно, прототип...alone wrote:А то, может, сделать, пока корпорации не хапнули? У кого есть опыт?
Я тут за главного - если что шлите мыло на me собака shaos точка net
-
- Banned
- Posts: 2139
- Joined: 20 Mar 2005 13:41
- Location: От туда
-
- Fanat
- Posts: 79
- Joined: 27 May 2011 04:25
- Location: Perm
Совсем от процессора (машины Тьюринга) отказываться не стоит. Очень многие задачи по своей сути являются последовательными и не распараллеливаются.
Более гибким будет подход добавить к обычному процессору реконфигурируемый блок, который бы за пару тактов выполнял вычисления целых формул.
С этой идей имеет что-то общее рекурсивная макроконвеерная ЭВМ академика В.М.Глушкова, придуманная им в 70-хх. Он предложил дать возможность динамически обновлять микрокод, а также нанокод, пикокод и т.д.
Для меня новость, что современные ПЛИС могут быть сконфигурированы частями. Надо поизучать этот вопрос. Просто ПЛИС не подойдут. Выигрыш потеряется из-за затрат на конфигурирование. Обдумывал идею сети из микросхем памяти.
Более гибким будет подход добавить к обычному процессору реконфигурируемый блок, который бы за пару тактов выполнял вычисления целых формул.
С этой идей имеет что-то общее рекурсивная макроконвеерная ЭВМ академика В.М.Глушкова, придуманная им в 70-хх. Он предложил дать возможность динамически обновлять микрокод, а также нанокод, пикокод и т.д.
Для меня новость, что современные ПЛИС могут быть сконфигурированы частями. Надо поизучать этот вопрос. Просто ПЛИС не подойдут. Выигрыш потеряется из-за затрат на конфигурирование. Обдумывал идею сети из микросхем памяти.
-
- Admin
- Posts: 23989
- Joined: 08 Jan 2003 23:22
- Location: Silicon Valley
да - последоваельные микровычислители должны остаться
я кстати хочу почитать старые книжки-статейки и понять как люди додумались перейти от конечного автомата к программе - причём может быть это и не заслуга Тьюринга - уж больно он абстрактен...
P.S. кстати из современных пакетов удивительную работу делает MatLab - они умеют поддерживать самые новые перепрограммируемые чипы, загоняя туда свои математические конструкции, симуляция там тоже есть:
http://www.mathworks.com/fpga-design/
я кстати хочу почитать старые книжки-статейки и понять как люди додумались перейти от конечного автомата к программе - причём может быть это и не заслуга Тьюринга - уж больно он абстрактен...
P.S. кстати из современных пакетов удивительную работу делает MatLab - они умеют поддерживать самые новые перепрограммируемые чипы, загоняя туда свои математические конструкции, симуляция там тоже есть:
http://www.mathworks.com/fpga-design/
Я тут за главного - если что шлите мыло на me собака shaos точка net
-
- Fanat
- Posts: 79
- Joined: 27 May 2011 04:25
- Location: Perm
Похожие принципы уже реализованы в железе(на базе ПЛИС Hardcopy) в отечественном Мультиклет viewtopic.php?t=10143.
А вообще есть множество исследований в области потоковых вычислителей (data flow computing http://en.wikipedia.org/wiki/Dataflow). Там есть свои трудности и вроде бы такого же простого и универсального решения как связка [быстрый последовательный вычислитель]-[большой объем однородной памяти] придумать пока не получается.
Удивляюсь, почему гиганты процессоросторения вводят все новые и новые SIMD расширения, вместо того чтобы добавить несколько блоков из ПЛИС, содержащих триггеры в количестве, необходимом для хранения типовых операндов, не более...
А первая программистка была Ада Лавлейс - в конце позапрошлого века;) За полвека до Тьюринга.
Мне кажется, теория конечных автоматов появилась уже после Тьюринга, как раз как развитие
А вообще есть множество исследований в области потоковых вычислителей (data flow computing http://en.wikipedia.org/wiki/Dataflow). Там есть свои трудности и вроде бы такого же простого и универсального решения как связка [быстрый последовательный вычислитель]-[большой объем однородной памяти] придумать пока не получается.
Удивляюсь, почему гиганты процессоросторения вводят все новые и новые SIMD расширения, вместо того чтобы добавить несколько блоков из ПЛИС, содержащих триггеры в количестве, необходимом для хранения типовых операндов, не более...
А первая программистка была Ада Лавлейс - в конце позапрошлого века;) За полвека до Тьюринга.
Мне кажется, теория конечных автоматов появилась уже после Тьюринга, как раз как развитие
-
- Writer
- Posts: 19
- Joined: 06 Sep 2007 07:05
- Location: 212.26.238.228
-
- Fanat
- Posts: 79
- Joined: 27 May 2011 04:25
- Location: Perm
Эх если бы все упиралось в быстроту...
А то есть еще критерии по количеству затраченных ресурсов, количеству потребляемой энергии...
Про ресурсы объясню: имеем иного памяти - имеем большую программу.
При схемном решении - имея много схемных блоков, чтобы реализовать большой алгоритм - имеем огромное количество связей между этими блоками, кроме того большой процент этого хозяйства постоянно простаивает в ожидании данных...
Традиционный принцип построения вычислителей очень сбалансирован.
Придумай что-то такое же гибкое, там быстрая реконфигурация и перестроение связей - чтож, твое имя попадет в историю;) А пока утюги летают по недостижимым орбитам, и не падают)))
А то есть еще критерии по количеству затраченных ресурсов, количеству потребляемой энергии...
Про ресурсы объясню: имеем иного памяти - имеем большую программу.
При схемном решении - имея много схемных блоков, чтобы реализовать большой алгоритм - имеем огромное количество связей между этими блоками, кроме того большой процент этого хозяйства постоянно простаивает в ожидании данных...
Традиционный принцип построения вычислителей очень сбалансирован.
Придумай что-то такое же гибкое, там быстрая реконфигурация и перестроение связей - чтож, твое имя попадет в историю;) А пока утюги летают по недостижимым орбитам, и не падают)))
-
- Admin
- Posts: 23989
- Joined: 08 Jan 2003 23:22
- Location: Silicon Valley
-
- Retired
- Posts: 1328
- Joined: 25 Jul 2011 00:14
- Location: WWW
-
- Fanat
- Posts: 79
- Joined: 27 May 2011 04:25
- Location: Perm
Если развивать дальше рассуждения про последовательность и параллельность:
1) весь алгоритм в кристалл в общем случае не помещается - требуется динамическая реконфигурация извне (из внешней памяти)
2) размер конфигурируемого участка должен меняться динамически (т.е. в разные моменты алгоритму может требоваться различное количество аппаратных блоков и связей между ними)
3) в предельном случае задействования минимума ресурсов получаем последовательный вычислитель!
4) конфигурирование должно производиться либо отдельным неконфигурируемым узлом("утюгом"), либо мастером (см. п.3) либо использоваться мульти-мастеринг. Во втором случае возникает трудности с конфигурированием себя/опасности в деконфигурировании. В третьем случае возникают затраты ресурсов/необходима диспетчеризация...
Имно, без "утюга"(в каком либо виде) сложно это все организовать...
1) весь алгоритм в кристалл в общем случае не помещается - требуется динамическая реконфигурация извне (из внешней памяти)
2) размер конфигурируемого участка должен меняться динамически (т.е. в разные моменты алгоритму может требоваться различное количество аппаратных блоков и связей между ними)
3) в предельном случае задействования минимума ресурсов получаем последовательный вычислитель!
4) конфигурирование должно производиться либо отдельным неконфигурируемым узлом("утюгом"), либо мастером (см. п.3) либо использоваться мульти-мастеринг. Во втором случае возникает трудности с конфигурированием себя/опасности в деконфигурировании. В третьем случае возникают затраты ресурсов/необходима диспетчеризация...
Имно, без "утюга"(в каком либо виде) сложно это все организовать...
-
- Writer
- Posts: 19
- Joined: 06 Sep 2007 07:05
- Location: 212.26.238.228
На размер алгоритма есть ограничение, связанное с размерами мозгов программистов и руководителя проекта. Сложные системы строятся из "кирпичиков", каждый из которых разрабатывается отдельно. Я не знаю реальных задач, которые не поместятся в 2 млн ЛЕ (при переходе на 14 нм их может стать уже 4 млн или ещё больше). Другой вопрос, что делать, если одновременно запущено слишком много задач.
Но показательная система будет полезной даже в том случае, если при переконфигурировании FPGA тормозится. Ибо если она будет создана, то будущие FPGA будут разрабатываться в расчёте на неё, а это значит - без тормозов.
Но показательная система будет полезной даже в том случае, если при переконфигурировании FPGA тормозится. Ибо если она будет создана, то будущие FPGA будут разрабатываться в расчёте на неё, а это значит - без тормозов.
-
- Doomed
- Posts: 598
- Joined: 10 Mar 2012 16:21
- Location: РФ