cheat_sheet - Formulas: Speedup = 1 / (1-affected) *...

Info iconThis preview shows pages 1–2. Sign up to view the full content.

View Full Document Right Arrow Icon
Formulas: Speedup  = 1 / ((1-affected) * old_time + affected * (1 – enhancement)) Or Speedup  = 1 / ((1-affected)+(affected/s))  where s = CPI_old / CPI_new CPI = Sum( % of instructions_i * Cycles required) CPU_clock_cyles  = Sum( CPI_I * C_I ) where C_I = # of instr of class I CPU_exe_time  = CPU clock cycles*Clock time =  Instr/Prog * CPI * sec/cycle = Ironlaw N  = Performance_x / Performance_y = Exec_time_y / Exec_time_x (x is n times faster) Arithmetic mean : 1/n * Sum( Time_i) where i = ith prog, n = total # of progs Better: weighted arithmetic mean! MIPS   = Instruction count / Execution time * 10^6   Definitions: Response time  = time_end – time_start Throughput  = total amount of work in given time Latency  = time it takes to complete an instruction Performance Measurement:  Clock, FLOPS, CPI, IPC, and most  importantly, the time it takes to complete a given task. Big Endian : MSB = leftmost bit Little Endian :  MSB = rightmost bit System balance  ensures that particular components do not present a  performance bottleneck Addressing Modes: -Register ($rs specifies register that is the operand) -Immediate (operand is contained in instruction (signed/unsign) -Absolute / Direct (address of operand is contained in instruction) -Register Indirect    ($reg) (contents of reg point to mem that contains operand) -Base plus displacement  4($reg) (immediate plus indirect = effective addr.) -PC-Relative  (only used by branches and jumps. PC is base) Performance : CPI Performance of Program depends  on: Algorithm, language, compiler,  ISA, hardware Throughput  = 1/latency if one instr at a time Throughput  > 1/latency if multiple instr simultaneously Ripple carry adder        long delays due to the gates on the path taken  delay: 2n + 2 (for n bit adder) Carry lookahead     :    consists of partial full adder (S= A xor B xor C; g= AB; p=A xor B are all outputs to  CLA, except S) and look-ahead logic unit (G = g_i+g_i-1.p_i; P = p_i.p_i-1;  C_i = G + P.C_0, starting with G_i-1, where C is fed to next adder) delay: 4*L + 2 (for L levels of carry lookahead logic) Binary Numbers: Unsigned: 0 –> 2^n – 1 Signed: same as 1’s compl. 1’s complement: (-2^(n-1) + 1) -> (2^(n-1) – 1) 2’s complement: (-2^(n-1)) -> (2^(n-1) – 1) Overflow: Unsigned: if carry out 2’s complement: C_n OR C_n-1 Datapath : Step R-type instr Mem reference Branch jump Instr. Fetch IR   Memory[PC], PC   PC + 4 Decode /register fetch  Reg [IR[25:21]], B   Reg [IR[20:16]],
Background image of page 1

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
Image of page 2
This is the end of the preview. Sign up to access the rest of the document.

Page1 / 3

cheat_sheet - Formulas: Speedup = 1 / (1-affected) *...

This preview shows document pages 1 - 2. Sign up to view the full document.

View Full Document Right Arrow Icon
Ask a homework question - tutors are online