past and future trends in architecture and hardware
play

Past and Future Trends in Architecture and Hardware David - PowerPoint PPT Presentation

Past and Future Trends in Architecture and Hardware David Pa5erson pattrsn@eecs.berkeley.edu SOSP History Day October 3, 2015 1 Outline Part I - Past Part II Future


  1. Past ¡and ¡Future ¡Trends ¡in ¡ Architecture ¡and ¡Hardware ¡ David ¡Pa5erson ¡ pattrsn@eecs.berkeley.edu SOSP ¡History ¡Day ¡October ¡3, ¡2015 ¡ ¡ 1

  2. Outline Part I - Past Part II – Future 50 years of Computer HW Technology Architecture History: • End of Moore’s Law • 1960s: • Flash vs. Disks Computer Families / • Fast DRAM Microprogramming • Crosspoint NVRAM • 1970s: CISC Open ISA & RISC-V • 1980s: RISC • Case for Open ISAs • 1990s: VLIW • Tour of RISC-V ISA • 2000s: NUMA vs. • RISC-V Software Stack Clusters • RISC-V Chips 2

  3. IBM Compatibility Problem in early 1960s By early 1960’s, IBM had 4 incompatible lines of computers! 701 → 7094 650 → 7074 702 → 7080 1401 → 7010 Each system had its own • Instruction set • I/O system and Secondary Storage: magnetic tapes, drums and disks • Assemblers, compilers, libraries,... • Market niche: business, scientific, real time, ... ⇒ IBM System/360 – one ISA to rule them all 3

  4. IBM 360: A Computer Family ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Model ¡30 ¡. ¡. ¡. ¡ ¡ ¡Model ¡70 ¡ ¡Storage ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8K ¡-­‑ ¡64 ¡KB ¡ ¡ ¡256K ¡-­‑ ¡512 ¡KB ¡ ¡Datapath ¡8-­‑bit ¡ ¡ ¡64-­‑bit ¡ ¡Circuit ¡Delay ¡30 ¡nsec/level ¡ ¡5 ¡nsec/level ¡ ¡Registers ¡Main ¡Store ¡ ¡Transistor ¡Registers ¡ The IBM 360 is why bytes are 8-bits long today! IBM ¡360 ¡instruc>on ¡set ¡architecture ¡(ISA) ¡completely ¡hid ¡the ¡ underlying ¡technological ¡differences ¡between ¡various ¡models. ¡ Milestone: ¡The ¡first ¡true ¡ISA ¡designed ¡as ¡portable ¡hardware-­‑ soKware ¡interface! ¡ ¡With ¡minor ¡modifica>ons ¡it ¡s>ll ¡survives ¡today! ¡ 4

  5. IBM System/360 Reference Card (“Green card”) I IBM 1 FEATURE 'INSTRUCTIONS' m ' S y ~ t 8 m / ~ ~ OR (cl OC F L O A ~ N E P ~ I N T - @ P a G k P A W F2 R~hrmca Data Jc.x) . , 3 6 , RR AddN~allted,Extendd AXR I%- D i n n 4 b # ) RDD 86 Add Normdized, Long (c] A D R 2A RR MsDk (n) I S M - m SPM 04 Fdd Normdid, L O ~ B Ic) , AD 8A RX Srorlge Key 4e.d SSK 08 Add Norrndized, Short (01 AER 3A RR a t %s@~n W fpi SSM 80 ' MACHINE IWTRUCTION add Nonnalizad, Short I d hS AE 7A RX Shift Left Dwble (c) SLDA 8F Add Unnormalized, Long (c) AWR 2E RR shift bft ~oubfe ~owical SLDL 8D IUm Add Unnormaltzad, Long (c) AW 6E RX MlWDlllG *;hm~%!#efc) SLA 88 Add Unnomralf*ed, Short (c) AUR 3E RR S M L M Single Logical SLL 89 Apkl (0) AR ICY Add Unnomalited, W r t AU 7E KX Dmlbk bl W b c 3 A R W t SRDA 8E -- Compare, Low ( d Doubh Lagical CDR 29 RR Add AP Shift R w t SRDL 8C Deeimd ( e , d ) ah Cmpm Long (c) CD 69 RX R @ h t $ M e Id SRA 8A Akl Halfvvarel (cl AH 39 Compare, Short (c) CER RR Add Logical (d Wcl Rwt ALR Qry& Logical SRL 88 CE 76 Compare, Short Ic) RX IfQ Y ) Q d add CDBical (d 510 9C AL DiviL, Long DDR 2D RR Sf Sore 50 AND (c) NR Dilde, Long DD 6 0 RX ' store C~Q~~=QC STC 42 AND (c) N Divide, Short DER 3 0 RR St- hl&wd STH So AND (cl Ni m DM&, short DE 7D RX AND (4 90 Nc Long HDR 24 RR W v e . Bmmh and S £ m MuSrir Oontrol (eip) STMC 60 Link BALR Halve, Shon HER 34 RR fbbmlmU S R 16 Branch m d Link BAL LTDR a RR t d Load and Teat, Long (c) Branch a d Stare ( e l SdNmft S 68 W R Load m d Test, Short (c) LTER 32 RR Branch Md Srwe (el 6ubfm&99dm@ lc,d SP FB BAS Load Conplment, Long (c) LCDR 23 RR Q b t F W Wdfword (6) SH 48 BrMCGonCondftion I r n R Load Complement Short (cl LCER RR 8 k 4 w W t & ! & d k) Branah on C;ondEth BIC StR I F wm@ Loeieal (el L - 4 28 S F Long LDR RR BfZmhahCeunt A S t BCT s l w b u k % ~ m LD 68 Load, Long RX on count SVC O A B m n c h 867 mMdwl(c) Load NNegative. Long (cl LNDR 21 RR on Idem H5gh TS 93 8XH Load Negative, SfwR (c) LNER 31 RR ' f M I W 4 % ~ ) BnncSronlhdexL~arEqusl BXLE TCH SF Load Positive, Long (c) LPDR 20 RR l& h 1 (4 %Hi € TI0 9D Conrpors CR Load Padtiva, Shart (c) LPER 3 0 RR ~ ~ . t Wlvsk (cr) r ~ ! ' TM 91 Campare rc) C lQad Rwnded, Extended (x) 26 to Long LRDR RR TR DC fawxm Dschapd bJ) bP Load Rounded, Long to Short Lx) LRER 3S RR OD cMns1*rr,HsWwdnd(cr) ct.E n a m b b d d T ~ TPlT Compnn h m m Laad, Short LER 3 8 RR tat CCR ~~~ UNPK F3 w@ E m & ? Load, Short LE 78 RX 84 eongrr?oLe?iwW CL WRD Multiply. Extended 1x1 MXR 26 RR Wnmv bqhall I 4 ZmQ CLC * ' (GRf) ZAP F8 . Multiply, tong MDR 2C RR -mm Laded I ' CL4 d NQTW Multiply, Long , MD 6C RX @OW PAWLS 1-3 CV& C o - t ( P ~ MXDR n Multiply, LongIExtended. (XI RR r ~mrmtta f e m m d . Decimel feamte code is load& cwwM.ta kwmal CVD m u & W a a $ o a n W fentwm e. Model67 Privileged instruction MulrOpIy, LonaIExtended (x) 87 RX m w m - I(d * MER New o . km&tifm ctoFla it s e t n . condition Extended pwcision Multiply, Short 3 C RR m DhFkk floating point feature Multiply, Short M E 7C RX M i D w Store, Long STD 60 RX Idl Mvlrs *al ~dit #i&CMl#E FORMATS ST € 70 jt?,d)\ ED RX Rl,D2lX2,B2) Editarralnkk 0 E W C H&@WQFID 1 1 SECOND HRLFWORD 2 1 THIRD HALFWORD 3 SDR 28 R R R1.W E & q h 951 tc) -- XR SD 68 RX Rl.M(X2.62~ Em#wiv# OR d c ) X SER xi 38 RR Rl.R2 Ewhsb OR Ce) ' SE 78 RX Rl,D2tX2,02) I EfdwbmQA le) XC E&-Y EX llQ) tc&J H I 0 fnaort Ghlmer IC KgY (w) 1 S K LR Lwd LBlu$ L LQadMdw8, LA (4 eapdaml T w r t LTR Lod l z a w m e n t (c) LCR Lordxdiliword LH - mu^ I & IrduWe Coharol (@a) Lod LMC LNR ' ~ ~ w ( C ) Loai 4 W a o r i t h LPR PSW l F l ( h , p ) Losd LPmY Losd Reid Ackkm (c,e$l LRA MVI MVC !Eswmda W N ~uswithOfkDIst AII"VQ M a m z o M a M W Z value of addms M u l O b MR M MMl*lv w Decbd t d b M u * AfiutalplVHsitmxd M H aR OR 0 OR fc) OR (d 01 5

  6. Control versus Datapath ▪ Processor designs can be split between datapath , where numbers are stored and arithmetic operations computed, and control , which sequences operations on datapath ▪ Biggest challenge for early computer designers was getting control circuitry correct � Maurice ¡Wilkes ¡invented ¡the ¡ Control ¡ idea ¡of ¡ microprogramming ¡ to ¡ InstrucUon ¡ Control ¡Lines ¡ CondiUon? ¡ design ¡the ¡control ¡unit ¡of ¡a ¡ processor, ¡1958 ¡ Registers ¡ ¡ Datapath ¡ Inst. ¡Reg. - ¡Logic ¡expensive ¡compared ¡to ¡ ALU ¡ PC ¡ ROM ¡or ¡RAM ¡ - ¡ROM ¡cheaper ¡than ¡RAM ¡ - ¡ROM ¡much ¡faster ¡than ¡RAM ¡ Busy? ¡ Address ¡ Data ¡ Main ¡Memory ¡ 6

  7. Microprogramming in IBM 360 Model ¡ M30 ¡ M40 ¡ M50 ¡ M65 ¡ Datapath ¡width ¡ 8 ¡bits ¡ 16 ¡bits ¡ 32 ¡bits ¡ 64 ¡bits ¡ Microcode ¡size ¡ 4k ¡x ¡50 ¡ 4k ¡x ¡52 ¡ 2.75k ¡x ¡85 ¡ 2.75k ¡x ¡87 ¡ 750 ¡ns ¡ 625 ¡ns ¡ ¡ 500 ¡ns ¡ 200 ¡ns ¡ ¡ Clock ¡cycle ¡Ume ¡(ROM) ¡ Main ¡memory ¡cycle ¡Ume ¡ 1500 ¡ns ¡ 2500 ¡ ¡ns ¡ 2000 ¡ns ¡ 750 ¡ns ¡ Annual ¡rental ¡fee ¡(1964 ¡$) ¡ $48,000 ¡ $54,000 ¡ $115,000 ¡ $270,000 ¡ $570,000 ¡ $650,000 ¡ $1,400,000 ¡ $3,200,000 ¡ Annual ¡rental ¡fee ¡(2015 ¡$) ¡ 7

  8. IC technology, Microcode, and CISC ▪ Logic, RAM, ROM all implemented using MOS transistors ▪ Semiconductor RAM ≈ same speed as ROM ▪ With Moore’s Law, memory for control store could grow ▪ Allowed more complicated instruction sets (CISC) ▪ Minicomputer (TTL server) Example: Digital Equipment VAX ISA in 1978 8

  9. Microprocessor Evolution ▪ Rapid progress in 1970s, fueled by advances in MOS ▪ ▪ technology, imitated minicomputers and mainframe ISAs ▪ ▪ Intel i432 - - Most ambitious 1970s micro - started in 1975 - released 1981 - 32-bit capability-based object-oriented architecture - Instructions variable number of bits long - Heavily microcoded - Severe performance, complexity, and usability problems ▪ Intel 8086 (1978, 8MHz, 29,000 transistors) - “Stopgap” 16-bit processor, architected in 10 weeks - Extended accumulator architecture - Assembly-compatible with 8080 - 20-bit addressing through segmented addressing scheme ▪ IBM PC uses Intel 8088 for 8-bit bus (and Motorola 68000 was late) - Estimated sales of 250,000; 100,000,000s sold 9

Recommend


More recommend