nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

aahzma · Post by **aahzma** » 27 Jul 2021 12:02

Забавно... Я именно в 2021 году задумался о создании ПК "а-ля 80е", по мотивам всех тогдашних 580-х изделий... и понял, что надо отталкиваться от многопроцессорной масштабируемой архитектуры. Но, на удивление, кроме размышлений ничего не нашел. Тема умерла, как я понимаю?

VGrad · Post by **VGrad** » 27 Jul 2021 19:24

aahzma wrote:Забавно... Я именно в 2021 году задумался о создании ПК "а-ля 80е", по мотивам всех тогдашних 580-х изделий...

Зачем ? Этим актуально было заниматься в середине 80-х !

aahzma wrote: и понял, что надо отталкиваться от многопроцессорной масштабируемой архитектуры. Но, на удивление, кроме размышлений ничего не нашел. Тема умерла, как я понимаю?

Читай как сделана шина MultiBUS (русское название "И-41").
Потом неплохо бы ОС которая это поддерживает.

Если нет зацикленности на 580 процессоре, то сразу перейти к 1810, компьютеру "Нейрон И9.66".

Lavr · Post by **Lavr** » 29 Jul 2021 08:01

aahzma wrote: Тема умерла, как я понимаю?

Нет, не умерла... иногда она неожиданно оживает...
Всё зависит от того, что хочется получить в итоге.

Shaos · Post by **Shaos** » 02 Nov 2021 23:18

В продолжение идей со страницы 23 (август 2012):

viewtopic.php?f=46&t=7540&start=330

Shaos wrote:
HardWareMan wrote:
Shaos wrote:P.S. Я смотрю что слово статуса хватать с шины данных совсем не сложно - так что наверное будут у нас нормальные порты с командами IN и OUT
По большому счёту нам только 2 бита нужны из этого слова состояния - INP и OUT
Латчить по SYNC AND F1 в одну ТМ2. Все верно.
угу

тогда обращение к хардверному семафору, защищающему доступ к софтверным мьютексам (а также 7 другим критическим абстракциям - по 1 биту на каждую), будет выглядеть так:
Code: Select all
DI
MVI A,#10
OUT 7 ; пусть на этом порту находятся 8 хардверных семафоров
LOOP:
IN 7
ANI #10 ; бит 4 пусть будет семафором мьютексов
JZ LOOP ; крутимся пока ноль (значит наш запрос семафора ещё не дошёл)
; далее висим на холде либо идём дальше
...
XRA A
OUT 7
EI 
P.S. Биты в порту 7 можно поделить между следующими "семафорами":
Code: Select all
bit 0 - SEM_PRO (доступ к списку всех процессов)
bit 1 - SEM_ACT (доступ к списку активных процессов)
bit 2 - SEM_SCR (доступ к буферу вывода на экран)
bit 3 - SEM_IOB (доступ к буферу обмена с внешними устройствами)
bit 4 - SEM_MUX (доступ к списку программных мьютексов)
bit 5 - SEM_PIP (доступ к FIFO каналам обмена данными)
bit 6 - SEM_MSG (доступ к очередям сообщений)
bit 7 - SEM_AUX (дополнительный семафор)
P.P.S. Семафоры внутренние, т.е. не входят в публично доступный API - это лишь соглашение о взаимодействии супервайзера (процессор номер ноль) и операционки на рабочих процессорах...

Подумалось тут мне, что чего попусту крутиться в цикле? Можно при попытке записи в порт 7 останавливать проц через сброс READY, если аппаратный арбитр решит не давать ему доступ к ресурсу:

8080.jpg

Либо вообще разнести семафоры по разным номерам портов и писать туда приоритет с которым проц хочет ресурсом попользоваться - арбитр будет сравнивать приоритеты и выстраивать запросы в очередь в правильном порядке, хотя наверное это уже черезчур сложно (а если делать руками супервизора, которым будет выступать 5й процессор, то ещё и медленно)

P.S. Эти "аппаратные" семафоры можно рассматривать как самые настоящие сигнальные семафоры - с помощью них рабочие процы отправляют сигнал процу-арбитру и ждут пока этот сигнал не будет принят. Если добавлять приоритеты 0...7 к семафорам, то каждый проц должен будет запоминать не только номер семафора, но и номер приоритета на регистре, а проц-арбитр должен будет эти регистры всех процов обходить и смотреть если от кого-то пришёл какой-то запрос. Плюс к этому можно сделать передачу символов между процессорами - эдакие каналы от любого процессора к любому процессору. Например запись в порт 0 будет означать передачу символа в 0й процессор (скажем для вывода в терминал). Запись в порт 1 - передача символа в 1й процессор и т.д. Чтение из портов будет означать принятие символа из соответствующего процессора (но не для порта 0, чтение из которого будет возвращать кол-во процессоров в системе и номер процессора). Запись в порт будет подвешивать процессор-передатчик, пока на той стороне не прочитают посланный байт. Если процессор попытается послать символ сам себе (например процессор 3 выполнит команду OUT 3), то он самозаблокируется до перезагрузки системы. Плюс к этому процессор 0 (арбитр/супервизор) может иметь специальную логику, предотвращающую отпускание процессора-передатчика в момент чтения соответствующего порта нулевым процессором т.к. он должен отпускать процессоры в специальном порядке в соответствии с приоритетами (это можно сделать путём записи в порт 0 нужного битика) - для него также чтение из порта 0 будет иметь иной смысл - он будет возвращать битовый набор, где каждый бит сигнализирует, что тот или иной процессор послал байт в канал и ждёт его анализа.

Shaos · Post by **Shaos** » 12 Nov 2021 01:15

Чего-то подумалось, что для реализации этих параллельных каналов связи между процессорами можно взять ВВ55е

|
Даже можно попробовать задействовать хендшейк, который включается в одном из режимов их работы!

BarsMonster · Post by **BarsMonster** » 31 Jul 2022 19:01

Поразмыслил над темой 10 лет...

Предыдущая идея с 580 с обвязкой на сдвиговых регистрах управляемых CPLD - мне по-прежнему нравится. Но не канонично, хоть на центральной CPLD сколько хочешь их можно объеденить (8-16 и более), особенно если где-то влезет небольшой кеш.

О более каноничных вариантах:
1) На 2 фазы шину разбить по-Орионовски - это уже классика. Может и 4 штуки получится - но тяжело, если декодер памяти тяжелый. Это уже обсуждено детально.
2) 2 процессора друг друга придерживают за HOLD по очереди - насколько такое реально провернуть? 580-й же шину теребонькает хорошо если 50% времени, вот и разделят свою фазу. КПД пусть не 100% будет, а 75 - уже успех.
3) Dual-port SRAM. Позволит с обоих сторон подвесить по 4шт по схемам #1+#2. Но тут все упрется в размер памяти и неканоничность.

Что думаете про #2 - это же как раз классический подход для SMP? Конечно он гораздо лучше работает когда есть L1-кеш, но из-за того что сам по себе 580-й медленно работает, может и сработать....

BarsMonster · Post by **BarsMonster** » 31 Jul 2022 19:03

Второй вопрос про разделение адресного пространства.
Разделение стека мне очень нравится, жаль что код и данные не поделить без диких извращений.

Правильно ли я понимаю, что стек через слово состояния отделить можно только в 580/8080 и 8085, но не Z80?

Shaos · Post by **Shaos** » 31 Jul 2022 23:33

Ну решение иметь 4 проца, которые в параллель дёргают быструю оперативную память, причём абсолютно прозрачно и не наступая друг другу на пятки, как мне кажется выглядит самым красивым

BarsMonster · Post by **BarsMonster** » 01 Aug 2022 17:47

Shaos wrote:Ну решение иметь 4 проца, которые в параллель дёргают быструю оперативную память, причём абсолютно прозрачно и не наступая друг другу на пятки, как мне кажется выглядит самым красивым

Наиболее красивым, но и наиболее оторванным от современных концепций SMP. Т.к. работать будет только потому что память и драйверы по технологии 90-350нм, а не 6мкм. Ну и масштабирование упирается в потолок.

Современный SMP - всегда с тормозной шиной. И как выяснили раньше SMP плохо работает без кеша.

Потому возникла такая идея: у каждого процессора своя пара страниц памяти (128кб), т.е. страницы 0 и 1. Там может быть стек (по желанию), локальный код, локальные данные.
А когда проц лезет на страницы 2 и выше, на устройства - вот там все идет через диспетчер шины, медленно. А то и вовсе без диспетчера, а просто по очереди все получают слоты общей шины (т.е. медленно).

В этом случае мы получаем что-то похожее на современные архитектуры, и условно неограниченное масштабирование. Конечно, если написать код который будет случайно дергать глобальную память одновременно со всех ядер - будет тормозить, как и в современных компьютерах. Т.е. по факту будет L1 кеш с "ручным" управлением. В лучшем случае загрузку/выгрузку "кеша" можно положить на КПДП во второй таймслот локальной шины по-Орионовски, но это уже чтобы мастерство показать.

Shaos · Post by **Shaos** » 01 Aug 2022 19:37

BarsMonster wrote:Современный SMP - всегда с тормозной шиной. И как выяснили раньше SMP плохо работает без кеша.

Там же снаружи шина тормозная, а внутри - шустрая, не?

BarsMonster wrote:А когда проц лезет на страницы 2 и выше, на устройства - вот там все идет через диспетчер шины, медленно. А то и вовсе без диспетчера, а просто по очереди все получают слоты общей шины (т.е. медленно).

А зачем медленно, если можно сделать прозрачно и быстро?

До 4 ядер вместе - быстро, а уже эти четвёрки можно сажать на общую "медленную" шину и расширять в "условно неограниченное масштабирование"...

BarsMonster · Post by **BarsMonster** » 01 Aug 2022 20:05

Shaos wrote:До 4 ядер вместе - быстро, а уже эти четвёрки можно сажать на общую "медленную" шину и расширять в "условно неограниченное масштабирование"...

Ну это тогда будет уже сложная многоуровневая система, которую без миллиарда не осилить

NUMA и все такое...

Т.е. то что я предлагаю - это условный подход x86 2000-х.
А то что ты - это подход x86 из 2020-х

Shaos · Post by **Shaos** » 01 Aug 2022 20:16

Ну мы же современные люди

А к этой четвёрке можно и кеш присобачить, через который будет производиться доступ к внешней "медленной" памяти

oldlazycat · Post by **oldlazycat** » 14 Apr 2023 05:38

Дочитал 27 страниц!
И каков итог? Получилось впихнуть невпихуемое?
А, ведь, есть прекрасный Z280, заточенный под мультипроцессорность! Может, его попробуем? viewtopic.php?f=89&t=8954

Lavr · Post by **Lavr** » 14 Apr 2023 07:11

oldlazycat wrote:Дочитал 27 страниц!
И каков итог? Получилось впихнуть невпихуемое?

Ну почему же "невпихуемое"? Вполне даже впихуемое!

Два микропроцессора вполне впихнули:
Двухпроцессорная система на микропроцессорах Intel 8080.

Просто, насколько я понимаю, у всех участников были разные ожидания от этого проекта...

Меня лично результат даже с двумя микропроцессорами разочаровал.

Shaos · Post by **Shaos** » 14 Apr 2023 08:49

Да и 4 проца тоже норм должно работать (если железохрен не обделался с выкладками)

nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах 8080)

Re: nedoPC-580 (SMP на 5 процессорах 8080)

Re: nedoPC-580 (SMP на 5 процессорах 8080)

Re:

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)

Re: nedoPC-580 (SMP на 5 процессорах КР580ВМ80А)