|  |  |  |
| --- | --- | --- |
| **BAR-ILAN UNIVERSITY (RA)**Faculty of EngineeringRamat-Gan 52900, Israel |  **Tel: 03-5317722****engbi@mail.biu.ac.il** | **אוניברסיטת בר-אילן (ע"ר)**הפקולטה להנדסהרמת-גן 52900 |

**מבנה מחשבים ספרתיים**

**תש"ף סמסטר ב' מועד ג'**

**83-301**

**מרצה:** פרופ' שמואל וימר

**מתרגל:** מר בנימין פרנקל

* הבחינה נערכת ב- ZOOM. חובה לפתוח מצלמות וידאו. אי פתיחת מצלמה תגרור פסילת הבחינה.
* פתרון הבחינה חייב להיות בפורמט PDF. יש להעלותו בתוך חלון הזמן שארכו כמשך הבחינה + 15 דקות. אי העלאת קובץ הפתרון בזמן תחשב כאי הגשה.
* בבחינה שתי שאלות ומשקלן שווה. סה"כ הניקוד 120, ציון מקסימלי 100 נקודות.
* יש להקפיד על כתב יד ברור וקריא.
* מותר שימוש בכל חומר עזר.
* משך הבחינה: שעתיים.
* בראש דף הפתרון יש להעתיק ולחתום על ההצהרה הבאה. ללא הצהרה וחתימה הבחינה לא תיבדק .

*אני מתחייב(ת) בזאת לשמור על טוהר הבחינה, לפותרה בכוחות עצמי בלבד ולא לעזור לשום גורם אחר שהוא. ידוע לי כי חשד כלשהו בטוהר הבחינה יאפשר לדרוש ממני להגן על פתרון הבחינה בעל-פה.*

*שם התלמיד(ה):\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_חתימה: \_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_*

**בהצלחה!**

**שאלה מספר 1 –Branch Prediction (60 נקודות)**

בשאלה זו נעסוק במעבד המכיל חזאי קפיצות (branch predictor).

*על המעבד מריצים את התוכנית באה:*

|  |  |  |  |  |  |
| --- | --- | --- | --- | --- | --- |
|  | *0* | *R8,* | *R3,* | *ADDI* |  |
|  | *N* | *$zero,* | *R1,* | *ADDI* |  |
|  |  | *0(R3)* | *R4,* | *LW* | *Loop:* |
|  | *0* | *R4,* | *R5,* | *ADDI* |  |
|  | *1* | *R5,* | *R5,* | *SRL* |  |
|  | *1* | *R5,* | *R5,* | *SLL* |  |
|  | *4* | *R3,* | *R3,* | *ADDI* |  |
| *--br1* | *Cond* | *R5,* | *R4,* | *BNE* |  |
|  | *1* | *R2,* | *R2,* | *ADDI* |  |
|  | *2* | *R5,* | *R5,* | *SRL* |  |
|  | *2* | *R5,* | *R5,* | *SLL* |  |
|  | *1* | *R1,* | *R1,* | *SUBI* |  |
| *--br2* | *Cond* | *R5,* | *R4,* | *BNE* |  |
|  | *1* | *R6,* | *R6,* | *ADDI* |  |
| *--br3* | *Loop* | *$zero,* | *R1,* | *BNE* | *Cond:* |
|  |  |  |  |  |  |

*תזכורת:*

* *SLL - Shift Left Logical*
* *SRL - Shift Right Logical*
* *פקודות ה- shift אינן ציקליות*

*התוכנית עוברת על מערך של מספרים ובודקת חלוקה ב- 2 וב- 4 ללא שארית. נתון כי R8 מצביע לראש מערך המכיל מספרים בין 1 ל- N לפי הסדר, דהיינו: , כאשר N הינו מספר טבעי המתחלק ב- 4 ללא שארית. בכל סעיפי השאלה התוכנית מורצת אינסוף פעמים, ואנו נתעניין במצב המתמיד בלבד (ולא בשלבי הלימוד של חזאי הקפיצות).*

1. *עליכם לכתוב את סדרת האירועים המתרחשים בפועל (לא החיזוי) במהלך ריצת התוכנית כתוצאה מפקודות הקפיצה המותנות (T/NT) עבור כל פקודת קפיצה בנפרד (br1, br2, br3). אם קיימת מחזוריות – ציינו אותה. התייחסו למצב המתמיד בלבד! (8 נקודות)*

עבור br1 – T, NT מחזורי.

עבור br2 – T, NT מחזורי. יש לשים לב שאם br1 נלקח אז br2 לא ירוץ בכלל.

עבור br3 – N-1 פעמים T ולבסוף NT (מחזורי, כיוון שהתוכנית רצה אינסוף פעמים).

* *נתון כי חזאי הקפיצות הקיים במעבד הינו מבוסס 2-bit-saturated counters (כל counter הינו בעל מצבים: SNT, WNT, WT, ST). מכונת המצבים הבסיסית של כל- counter מתוארת בתרשים הבא:*



*החזאי משתמש ב- k=3 סיביות היסטוריה. ההיסטוריה הינה פרטית (לוקאלית), ומכונות המצבים פרטיות (לכל פקודת branch יש את החזאים שלה).* עבור כל אירוע בהיסטוריה נסמן:  ו- . נתון כי אוגרי ההיסטוריה מאותחלים באפסים וכי ערכי היסטוריה חדשים מוכנסים ל- LSB. שימו-לב כי המצב ההתחלתי של מכונות המצבים לא נתון. לכן, אם קיימת תלות במצב זה, יש לציין זאת, ולענות על השאלה כתלות במצב ההתחלתי.

1. נריץ את התוכנית הנתונה על מעבד בעל החזאי הנתון.
	1. מהם ערכי ההיסטוריה השונים של כל קפיצה בנפרד, ומהם מצבי המכונה והחיזויים בכל ערך היסטוריה? התייחס גם להשפעתו של הערך N על התוצאה. *(6 נקודות)*
	2. מהו ה- misprediction rate לכל קפיצה בנפרד? מהו ה- total misprediction rate? *(6 נקודות)*

|  |  |  |
| --- | --- | --- |
| **br1** | **br2** | **br3** |
| **History** | **SM** | **History** | **SM** | **History** | **SM** |
| 010 | ST - T | 010 | ST - T | 110 | ST - T |
| 101 | SNT - NT | 101 | SNT - NT | 101 | ST - T |
|  |  |  |  | 011 | ST - T |
|  |  |  |  | 111 | If N=4: SNT – NTIf N>4: ST (mostly) – TWT (once every iteration) - T  |

פקודות br1 ו- br2 לא טועות לעולם, ולכן: 
לגבי br3: אם N=4 אזי br3 לא טועה לעולם, ולכן . אם N>4 אזי br3 טועה באחד מתוך N חיזויים, ולכן: .
סה"כ: פקודות br1 ו- br3 רצות פעם אחת בכל איטרציה, ואילו br2 רצה ב- 1/2 מהאיטרציות.
ולכן, אם N=4 אז: .
אם N>4 אז: .

* מכאן ואילך נניח כי N=8.
1. מהו הערך k (מספר סיביות ההיסטוריה) הנמוך ביותר שיאפשר? *(8 נקודות)*

בתוכנית זו רק br3 תושפע מ- k. על מנת לאפשר  עלינו להיות במצב בו עבור כל ערך היסטוריה החיזוי יהיה נכון. אם  אז יהיה ערך היסטוריה ייחודי לכל איטרציה של הלולאה (מה שאומר שיש מכונה ייעודית לכל שלב בלולאה), ולכן החיזוי יהיה מושלם. כל k קטן מזה גורם לכך שקיים שיתוף של אותה מכונת מצבים בין מצב שבו צריך לקפוץ ובין מצב שבו לא צריך לקפוץ (מכונת המצבים שמתאימה לערך היסטוריה '111111' תהיה משותפת, ולכן לא ייתכן חיזוי מושלם).

* התוכנית רצה על מעבד מצונר (pipelined) בעל 5 שלבים. נתון כי החיזוי מתבצע בשלב הראשון, וכי ה- branch resolution הינו בשלב השני (שלב ה- ID). הניחו כי אין עיכובים של מערכת הזיכרון, וכי כל תלויות המידע מטופלות ע"י מנגנוני קידום כך שאין אובדן מחזורי שעון בשל כך ().
1. מהו החלק היחסי של פקודות הקפיצה המותנית בפילוג הדינאמי של פקודות התוכנית? עבור k=3, מהו ה-  האפקטיבי של המעבד עבור התוכנית הנתונה? כתבו ביטוי כללי תחילה, ולאחר מכן הציבו מספרים. *(10 נקודות)*

באיטרציות בהן R4 מכיל מספר אי-זוגי ישנן 7 פקודות, מתוכן שתי פקודות branch.
באיטרציות בהן R4 מכיל את המספר 2 או את המספר 6 ישנן 12 פקודות, מתוכן 3 פקודות branch.
באיטרציות בהן R4 מכיל את המספר 4 או את המספר 8 ישנן 13 פקודות, מתוכן 3 פקודות branch.

בנוסף, יש את פקודת האתחול של הרגיסטרים R3 ו- R1, המתבצעות פעם אחת ב- 8 איטרציות.
סה"כ: 20 פקודות branch מתוך 80 פקודות ולכן: .

ה- MR כבר חושב בסעיף ב'. ה- BR בשלב השני בצינור, ולכן שגיאת חיזוי גוררת אובדן ביצועים של מחזור שעון אחד.



1. על-מנת לחסוך במשאבי מערכת, הוחלט להשאיר את ההיסטוריות פרטיות, אך להשתמש במכונות מצבים משותפות לכל פקודות ה- branch. עבור k=3, מהו עתה ה- misprediction rate לכל קפיצה בנפרד? מהו ה- total misprediction rate? נמק היטב את צעדיך. *(12 נקודות)*

נתבונן במצבי ההיסטוריה ונזהה מצבים משותפים ומצבים ייחודיים:
מצבים '110', '011' ו- '111' הם מצבים ייחודיים ל- br3 בלבד, ולכן מכונות אלו יתפקדו כפרטיות ל- br3. מכונות המצבים המתאימות להיסטוריה '110', '011' תמיד יתנו חיזוי מושלם (תמיד יחזו T), ואילו מכונת המצבים המתאימה להיסטוריה '111' תחזה תמיד T, אך זה יהיה נכון רק ב- 4 פעמים מתוך 5 פעמים שניגשים למכונת מצבים זו במחזור שלם של ריצת התוכנית (8 איטרציות של הלולאה).
מצב '010' הינו משותף ל- br1 ול- br2, כאשר גם br1 וגם br2 תמיד יקפצו במצב הזה, ולכן החיזוי של מכונת המצבים המתאימה למצב זה תמיד יהיה נכון (תמיד החיזוי יהיה T).

מצב '101' הינו משותף ל- br1, br2 ול- br3, כאשר br3 תמיד תקפוץ במצב הזה, ואילו br1 ו- br2 תמיד לא יקפצו במצב הזה. בכל מחזור של ריצת התוכנית "נבקר" במצב זה 7 פעמים סה"כ, כאשר רק ביקור אחד יהיה ע"י פקודה br3, ולכן, המכונה הזאת תמיד תחזה NT (במצב היציב), ולכן, התרומה שלה ל- misprediction rate לא תלויה באתחול של מכונות המצבים. יוצא, שהחיזוי של מכונה זו יהיה תמיד נכון עבור br1 ו- br2, ויהיה תמיד שגוי עבור br3 (וזאת בנוסף לטעות שיש למכונת המצבים של ההיסטוריה '111' באיטרציה השמינית של הלולאה).

לסיכום:







1. בנוסף לחיסכון במשאבי המערכת המתואר בסעיף הקודם (שימוש במכונות מצבים משותפות לכל פקודות ה- branch), הוחלט לצמצם גם את מספר סיביות ההיסטוריה ולהסתפק ב- k=2 סיביות היסטוריה עבור כל פקודת branch. מהו עתה ה- misprediction rate לכל קפיצה בנפרד? מהו ה- total misprediction rate? נמק היטב את צעדיך. *(10 נקודות)*

למעשה, עבור br1 ו- br2 אין כל שינוי מהותי. פקודות אלו ישתמשו במכונת המצבים המתאימה למצב '10' ולמצב '01', כאשר עבור שתי הפקודות החיזוי של המכונות הנ"ל יהיה מושלם.

מצב '11' הוא מצב ייחודי ל- br3, אשר תמיד יחזה T, והפעם החיזוי יהיה נכון ב- 5 פעמים מתוך 6 הפעמים שמבקרים במצב זה במהלך מחזור אחד של ריצת התוכנית.

מצב '10' יהיה משותף גם ל- br3 (בנוסף ל- br1 ו- br2), כאשר בכל מחזור של ריצת התוכנית "נבקר" במצב זה 7 פעמים סה"כ. אמנם רק ביקור אחד יהיה ע"י פקודה br3, אך במקרה הזה החיזוי של המכונה (T) יתאים גם ל- br3, ולכן המכונה הזאת תמיד תיתן חיזוי נכון.

מצב '01' יהיה משותף גם הוא ל- br3 (בנוסף ל- br1 ו- br2), כאשר br3 תמיד תקפוץ במצב הזה, ואילו br1 ו- br2 תמיד לא יקפצו במצב הזה. בכל מחזור של ריצת התוכנית "נבקר" במצב זה 7 פעמים סה"כ, כאשר רק ביקור אחד יהיה ע"י פקודה br3, ולכן, המכונה הזאת תמיד תחזה NT (במצב היציב), ולכן, התרומה שלה ל- misprediction rate לא תלויה באתחול של מכונות המצבים. יוצא, שהחיזוי של מכונה זו יהיה תמיד נכון עבור br1 ו- br2, ויהיה תמיד שגוי עבור br3 (וזאת בנוסף לטעות שיש למכונת המצבים של ההיסטוריה '11' באיטרציה השמינית של הלולאה).

 ולכן, התשובה הסופית לסעיף זה זהה לתשובה הסופית של הסעיף הקודם.

 **שאלה מספר 2 – Memory (60 נקודות)**

נתון מעבד בעל מרחב כתובות ווירטואלי של סיביות, רוחב מילה וזיכרון פיזי , וכן נתון כי רזולוציית המיעון היאper-byte . במעבד קיים  בגודל . גדלו של בלוק הוא וזיכרון המטמון הינו physically tagged. החלפת הבלוקים נעשית בשיטת LRU.
נתון שגודל frame הינו .

1. מהו מספר ה- sets, מהו גודל ה- tag ומהו מספר הכולל של סיביות ה- tag בזיכרון המטמון? (6 נקודות)

ה- block offset הינו 4 סיביות, ומספר ה- blocks ב- cache הינו . בנוסף, מאחר ומדובר ב- כל set מכיל בלוקים, ולכן מספר ה- sets הינו . מכאן נסיק כי גודל ה- tag הוא:
. סיביות. בסה"כ בכל ה- cache ישנן: *סיביות של* tag.

1. במהלך התכן של המעבד התברר שמסלול ההשהיה הקריטי עובר במערכת הזיכרון ואורכו , כאשר המסלול מורכב מתרגום כתובת ווירטואלית לכתובת פיזית האורך 800ps, וגישה ל- cache האורכת 600ps. על מנת להאיץ את ביצועי המחשב הציע מהנדס צעיר בוגר בר-אילן לצנר את מערכת הזיכרון. האם הדבר ניתן לביצוע? אם כן, כיצד? בהזנחת זמני ההשהיה ברגיסטרים ובלוגיקה, ובהינתן כי המסלול הארוך ביותר מחוץ למערכת הזיכרון אורך 500ps, מהו התדר המרבי אליו ניתן להאיץ את פעולת המחשב? (6 נקודות)

ניתן לביצוע ע"י הפרדת התרגום מכתובת ווירטואלית לפיזית (TLB) והגישה ל cache לשני שלבים נפרדים בצינור. זמן ההשהיה לשם תרגום הכתובת (גישה ל (TLB הוא זמן ההשהיה המירבי, ועל כן התדר המרבי הינו: .

1. מהנדס בכיר בחברה אמר כי ניתן להגיע להאצה המושגת בסעיף ב' ללא צורך בהעמקת הצינור, וזאת ע"י גישה ל- TLB ולזיכרון המטמון באופן מקבילי. לשם כך, כדי שהגישה באופן מקבילי תוכל להתבצע, המהנדס אמר כי יש צורך לבצע שינוי בגודלו של ה- frame ו/או בגודלו של ה- cache, והמליץ לבצע את השינוי דווקא בגודל ה- frame, משום ששינוי בגודלו של ה- cache יפגע ב- hit-rate שלו. הסבר את דבריו של המהנדס הבכיר. האם הדבר משפיע מספר הכניסות של ה- TLB? האם ישנה דרך להימנע משינוי גודלו של ה- frame? נמקו היטב את תשובתכם. (6 נקודות)

הדבר אכן ניתן להשגה וזאת בתנאי שיהיו לנו מספיק סיביות מה- page-offset כדי לגשת את זיכרון המטמון. במקרה זה ה- page offset גדול שווה ל-cache index (ביחד עם ה- block-offset), ואין צורך בתרגום של TLB בכדי לגשת ב- cache לאינדקס המתאים. על מנת שהתנאי יתקיים (כנראה ש: w<2) יש צורך או להגדיל את ה- frame או להקטין את ה- cache אכן, הקטנת גודל ה- cache עשויה לפגוע באופן טבעי ב- hit-rate שלו (כי יש בו פחות מידע), ולכן בחר המהנדס הבכיר להגדיל את גודל ה- frame.

להצעתו של המהנדס אין כל השפעה על מספר הכניסות של ה- TLB, שמספרם נקבע משיקולי זמני גישה ושיקולי hit/miss rate של מערכת הזיכרון הווירטואלי.

ישנה דרך להימנע משינוי גודלו של ה- frame, וזאת ע"י הגדלת האסוציאטיביות (דרושה דרגת אסוציאטיביות של לפחות 4-way).

1. יהי . בהנחה שהצעתו של המהנדס הבכיר מסעיף ג' אכן התבצעה, האם הדבר משפיע על מספר סיביות ה- tag הכולל בזיכרון המטמון? נמקו היטב את תשובתכם, ואם התשובה חיובית רשמו ביטוי מפורש למספרם במערכת הזיכרון הנתונה בסעיף א'. (5 נקודות)

אם נקבל את הצעתו של המהנדס מסעיף ג' ונגדיל את גודל ה- frame, לא תהיה לכך שום השפעה על מספר סיביות ה- tag בזיכרון המטמון. (אמנם, אם נגדיל את מידת האסוציאטיביות של זיכרון המטמון תהיה לכך השפעה על מספר סיביות ה- tag שהוא: *סיביות של* tag *בזיכרון המטמון כולו).*

1. מהנדס שלישי בוגר אונ' בן-גוריון הציע לוותר לגמרי על תרגום כתובות ווירטואליות לפיזיות לשם חיפוש בזיכרון המטמון. האם הדבר אפשרי? אם כן, מהן הסכנות בוויתור על התרגום? האם ניתן ע"י וויתור על התרגום להגדיל את תדר השעון מעבר להצעה בסעיף ב'? נמקו היטב את תשובתכם. (6 נקודות)

הדבר אכן ניתן להשגה וזאת ע"י הפיכת ה- cache ל- virtually indexed virtually tagged, שבו משתמשים גם בגישה ל- cache וגם ב- tag בכתובת ווירטואלית.

הסכנות שבשימוש ב-virtual tag הינן בעיות של aliasing ושל homonyms.

על פי נתוני הזמנים בסעיף ב', הרי שעל ידי וויתור על הגישה ל- TLB ניתן לעבוד בתדר גבוה יותר, שכן זמן ההשהיה הארוך ביותר כעת הוא זמן הגישה ל- cache, ועל כן התדר המרבי כעת הינו: .

1. האם ההצעה בסעיף ה' משפיעה על גודל ה- tag השמור בזיכרון המטמון? אם כן, כמה סיביות ידרשו בסה"כ למימוש החדש? בהנחת אסוציאטיביות ובהתעלם מהסיביות הנדרשות לניהול ה- cache (dirty וכו') מהו היחס בגדלו הכולל של ה- cache בסעיף זה לזה שבסעיף א'? האם הגדלת האסוציאטיביות מגדילה, איננה משנה, או מקטינה את היחס הזה? (6 נקודות)

מאחר והכתובת הווירטואלית הינה בת 40 סיביות ואלו הפיזית בת 34 סיביות, ה- tag של כל בלוק יגדל מ- ל- . מאחר ומספר הבלוקים איננו משתנה, וכל block entry מכיל הן data והן tag, היחס בגודל הוא:

הגדלות האסוציאטיביות תקטין את היחס הנ"ל, בהתאם לביטוי.

1. עבור נתוני סעיף א' מהו גודלו של page table? כמה כניסות ישנן בו, ומה גודלו הכולל ב- Bytes? הנח שהכתובת הפיזית יחד עם הסיביות הנדרשות לניהול הדפים מאוחסנות ב- 64 סיביות. מהו המספר המקסימלי של תהליכים היכולים להתקיים בו זמנית בזיכרון הפיזי? (6 נקודות)

מאחר ועובדים במרחב כתובות ווירטואלי, , כלומר, למערכת הזיכרון הווירטואלי ישנם דפים, ולכן זהו מספר הכניסות הנדרש ב- page table. כל כניסה מייצגת כתובת של frame שיחד עם סיביות ניהול הדף תופסות 64 סיביות, או 8 בתים. על-כן, הגודל הכולל של טבלת דפים הוא: .

ה- page tables מאוכסנים בזיכרון הפיזי שגודלו . על כן לכל היותר יכולים להתנהל בו זמנית בזיכרון תהליכים. כמובן שזהו חסם תיאורטי, משום שזה לא מותיר בזיכרון שום מקום ל- data ול- instructions.

1. על מנת שמערכת ההפעלה תנצל טוב יותר את הזיכרון ותוכל למקם את ה- page tables באופן יעיל יותר, הוחלט לפצל את הכתובת הלוגית לשלשה שדות כדלהלן: , ו , כאשר משמש את ה- outer table ו- את ה- inner tables. לאחר שינוי זה, מהו שטח הזיכרון המינימלי שיש להקצות על מנת להיות מסוגלים להריץ 100 תהליכים שונים בו זמנית? (6 נקודות)

על מנת שיהיה ניתן לתרגם כתובות, כל תהליך נדרש למינימום של טבלה אחת מתוך ה- inner tables, וכמובן שיש צורך להחזיק בזיכרון את ה- outer table של כל תהליך. גודלה של כל טבלה כזאת הוא: , ולכן נפח הזיכרון המינימלי הנדרש עבור ה- page tables של כל תהליך הינו . לכן, כדי שיהיה ניתן להריץ 100 תהליכים שונים בו זמנית יש צורך להקצות בזיכרון מינימום של .

1. ב- cache שבסעיף א' נקבע . בתוכנית שרצה במחשב הופיע רצף הגישות לכתובות הבאות (hexadecimal) שחזר על עצמו ברציפות 1001 פעמים:

X0ABCD88000, x1BCDE88000, x2CDEFF8080, x0DEF0F8000, x1EF01C8080, x2F012C8000, x0012348000, x1123448080.

בהתעלם מהאיטרציה הראשונה, האם הרצף הנ"ל גורם להחטאות? אם כן, לכמה? (7 נקודות)

כאמור בסעיף א', ה- block offset הינו 4 סיביות. מאחר ו- , ה- cache הינו 4-way set associative, כלומר בכל set ישנם 4 בלוקים. אם כך, כמות ה- sets הינה: , ולכן גודל האינדקס לצורך גישה ל- set הינו 10 סיביות. ב- 6 מתוך 8 הכתובות הנ"ל כל 10 הסיביות של שדה האינדקס זהות, ולכן כתובות הבלוקים המתאימים ממופות לאותו set. בתום האיטרציה הראשונה ארבעת הבלוקים המכילים את הכתובות: x1EF01C8080, x2F012C8000, x0012348000, x1123448080 יהיו מצויים ב- cache (ב- set מספר 128), ומשם ואילך כל פניה ל- set זה גורמת ל- miss. לעומת זאת, שתי הכתובות x2CDEFF8080, x0DEF0F8000 ימופו לסט אחר (ל- set מספר 896), ולכן בגישות לכתובות אלו לא תהיה אף החטאה. לכן, בסה"כ ישנם החטאות.

1. מהנדסת צעירה בוגרת בר-אילן נתבקשה לפתור את הבעיה והציעה להצמיד ל- cache שבסעיף א' cache קטן נוסף מסוג fully associative, כך ששני הזיכרונות יהיו אקסקלוסיביים, כלומר שמילה תימצא **רק באחד** משניהם, ואם תימצא בקטן, אזי תתבצע החלפה של מילה בין הקטן לגדול, כך שהמילה המבוקשת תעבור מהקטן לגדול, ובמקומה תעבור מילה מסוימת מהגדול לקטן (על-פי מדיניות LRU). המערכת פועלת ע"פ המתואר בציור שלהלן:



עבור רצף הגישות מהסעיף הקודם, מלאו את מספר ה- misses בטבלה הבאה. הסבירו במדויק את הערכים שמילאתם בטבלה. (6 נקודות)

|  |  |  |  |  |  |
| --- | --- | --- | --- | --- | --- |
| 16 | 8 | 4 | 2 | 1 | Victim cache size [Blocks] |
|  |  |  |  |  | misses |

הוספת victim cache בגודל של בלוק אחד איננה תפתור את בעיית ההחטאות המתוארת בסעיף הקודם. הוספה של victim cache בגודל של 2 בלוקים ומעלה – תאפס את מספר ה- misses עבור רצף הגישות הנ"ל, משום שזיכרון המטמון יחזיק כל הזמן את 8 הבלוקים הנתונים ברצף הגישות. ה- victim cache ישרת את set מספר 128, ובכך ימנע את ההחטאות. סט מספר 896 איננו זקוק לעזרת ה- victim cache.