HW_04 - ‫סטטיסטיקה למדעי המחשב –...

Info icon This preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: ‫סטטיסטיקה למדעי המחשב – תרגיל ‪4‬‬ ‫טל גלילי‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫שאלות המסומנות ב‪ )*( -‬הן שאלות רשות (ללא ציון) לתרגול נוסף ועשויות להיות קשות יותר‪.‬‬ ‫שאלות המסומנות ב‪ )**( -‬הן שאלות בונוס (רשות)‪ .‬מספר נקודות הבונוס מצויין בשאלה והן מתווספות‬ ‫לציון של שיעורי הבית‪ .‬ציון שיעורי הבית יכול לעלות על ‪ ,011‬ובכך לאזן ציון נמוך בתרגילים עתידיים‪.‬‬ ‫(אך סך הציון בכלל שיעורי הבית לצורך הציון הסופי לא יעלה על ‪)011‬‬ ‫שאלות והבהרות ניתן להעלות בפורום שבאתר הקורס או לפני‪/‬אחרי התרגולים עצמם‪.‬‬ ‫את התרגילים יש להגיש למתרגל בשעת התירגול המתאימה‪ .‬איחור בהגשה (ללא תיאום עם המתרגל‪,‬‬ ‫המלווה בנימוק הגיוני) גורר הורדה של ‪ 5‬נקודות ליום איחור (כולל סופ"שים)‪.‬‬ ‫שאלה ‪1‬‬ ‫כנסו לאתר ‪ -‬‬ ‫מטלות‪:‬‬ ‫א) סיירו באפליקצייה ומצאו ‪ 2‬משתנים (אחד לציר ה‪ X -‬ואחד לציר ה‪ )Y -‬אשר אתם חושבים שיכולים‬ ‫לספר "סיפור" מעניין האחד על השני‪ .‬הסבירו מה כל אחד מהמשתנים שבחרתם מתאר (אם אתם לא‬ ‫בטוחים‪ ,‬היעזרו בגוגל‪ ,‬ואם זה לא עוזר – אז כתבו במפורש שאינכם בטוחים במשמעות‪ ,‬זה לגיטימי)‪.‬‬ ‫ב) בחרו טרנספורמציה מתאימה בין המשתנים (לינארית או לוגריתמית)‪ .‬האם הקשר בין המשתנים‬ ‫שמצאתם נראה לינארי או אחר? תארו אותו במילים (עבור שנה מסוימת)‪.‬‬ ‫ג) האם לדעתכם יש סיבתיות בין גורם אחד לאחר? אם כן‪ ,‬מי לדעתכם גורם למי ובאיזה אופן? נמקו את‬ ‫דעתכם (או ב"ידע כללי"‪ ,‬או בקישורים למקורות באינטרנט)‪.‬‬ ‫ד) האם אתם מזהים תצפיות חריגות בגרף אשר הנתונים שלהם נראים לכם בעיתיים או לא אמינים? אם כן‬ ‫– ציינו כמה מהן‪( .‬אפשר גם לומר שלא)‬ ‫ה) בחרו מדינה אחת בגרף וספרו את הסיפור שלה‪:‬‬ ‫‪ .a‬בחרו גרף אחד אשר מתאר היטב את הסיפור שברצונכם לספר על המדינה הזו (בחרו שנה‪,‬‬ ‫טרנספורמציה מתאימה‪ ,‬מה להדגיש ומה לא‪ trailing ,‬לאורך שנים אם ברצונכם להדגיש ממד‬ ‫זמן וכו')‪,‬‬ ‫צרפו צילום מסך רלוונטי‪.‬‬ ‫‪ .b‬ספרו בקצרה (לא יותר משתי פסקאות) את הסיפור שגיליתם בתמונה‪ .‬הסיפור יכול להיות על‬ ‫התפתחות המדדים (והקשר ביניהם) לאורך השנים‪ ,‬או התייחסות למצב המדינה לעומת‬ ‫מדינות אחרות‪.‬‬ ‫שלבו קישורים רלוונטיים לפי הבנתכם (ויקיפדיה או מקורות אחרים)‪.‬‬ ‫ו)‬ ‫** (בונוס ‪ 2‬נקודות) צרו מצגת ‪( power-point‬היא יכולה להכיל שקף אחד בודד‪ ,‬או מספר שקפים‪ ,‬וגם‬ ‫אפשר ליצור קובץ ‪ )PDF‬אשר מסכם את הממצאים שלכם בשאלה זו‪ .‬את הקובץ עליכם להעלות בפורום‬ ‫מודל של שאלות מנהלתיות‪ .‬רצוי לעשות זאת בהקדם האפשרי (כדי לתת לחבריכם הזדמנות לקבל‬ ‫השראה מהאופן שבו התמודדתם עם התרגיל)‬ ‫מגבלות ‪ :‬אינכם יכולים לבחור את השילוב של תל"ג ותוחלת חיים (היות וזו ברירת המחדל באתר)‪ ,‬אבל‬ ‫באפשרותכם לשלב את המדדים הללו עם משתנים אחרים‪.‬‬ :‫רמזים‬ :‫הסבר פשוט על שימוש באפליקציה מופיע כאן‬ ‫ יש חומרים מעניינים בקישורים הבאים‬,‫אם אתם מתקשים למצוא משהו מעניין משיטוט אקראי‬ .‫ אנא תנו קרדיט‬,‫אם תיעזרו במישהו מהם‬ .‫קשר אינם בהכרח מלמדים על סיבתיות‬/‫מתאם‬/‫ קורלציה‬:‫תזכורת‬ :‫על קורלציה וסיבתיות‬ ‫על אקסטרפולציה‪:‬‬ ‫שאלה ‪2‬‬ ‫בסעיפים א‪-‬ג‪ X ,‬ו‪ Y -‬הם משתנים מקריים כלשהם‪ .‬כאשר בסעיפים שלאחר מכן‪ ,‬הזוגות ‪ xi,yi‬הם זוגות של‬ ‫נתונים אשר יצאו מאיזשהו צמד של משתנים מקריים‪ .‬אין תלות בין המשתנים והערכים שמופיעים בסעיפים‬ ‫השונים‪.‬‬ ‫הראו ש‪:‬‬ ‫א) ‪cor X , Y cor a12 X b1 , a2Y b2 ‬‬ ‫(עבור ‪ a1,a2‬חיוביים)‬ ‫ב) ‪cor X , Y cor X , Y ‬‬ ‫ג) ‪cor X , a 2 X b 1‬‬ ‫(עבור ‪ a‬שונה מ‪)1-‬‬ ‫ד) ‪r X , Y r yˆ , Y ‬‬ ‫(כאשר הקשר בין ‪ X‬ל‪ Y -‬הוא חיובי)‬ ‫(כאשר ˆ‪ y‬הוא ווקטור התחזיות של ערכי ‪ ,y‬אשר מתקבלים מקו הרגרסיה אשר חושב באמצעות שיטת‬ ‫הריבועים הפחותים‪).‬‬ ‫ה) ‪ 0‬‬ ‫‪n‬‬ ‫‪e‬‬ ‫‪i‬‬ ‫‪i 1‬‬ ‫(כאשר ‪ , ei yi yˆi‬ו‪ yˆ i -‬הוא התחזיות של ערך ‪ ,y‬עבור הנקודה ‪ xi‬באמצעות קו הרגרסיה אשר‬ ‫חושב באמצעות שיטת הריבועים הפחותים‪.‬‬ ‫רמז‪ :‬ראשית עליכם להוכיח ש ‪) yˆ y -‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪i 1‬‬ ‫‪i 1‬‬ ‫ו) האם ‪ ei yi yi 0‬‬ ‫נכון עבור ‪ yi‬אשר נאמד באמצעות משוואת הקו החסין? אם כן‪,‬‬ ‫הוכיחו‪ .‬אם לא – נמקו או הביאו דוגמא נגדית‪.‬‬ ‫ז) האם משוואת הקו החסין ומשוואת הרגרסיה יכולות להוביל לאותם קווים? אם כן – הביאו דוגמא‬ ‫מספרית (עם החישובים של שני הקווים)‪ .‬אם לא‪ ,‬הוכיחו שלא‪.‬‬ ‫ח) האם משוואת הקו החסין ומשוואת הרגרסיה יכולות להוביל לשני קווים שונים? אם כן – הביאו דוגמא‬ ‫מספרית (עם החישובים של שני הקווים)‪ .‬אם לא‪ ,‬הוכיחו שלא‪.‬‬ ‫שאלה ‪3‬‬ ‫אנא פתרו את התרגיל הבא בתוכנת ‪.R‬‬ ‫הבחירות לכנסת ה ‪( 91 -‬בשנת ‪ )– 3192‬איפה הסקרים הצליחו ואיפה הם כשלו?‬ ‫חמישה ימים לפני הבחירות לכנסת ה ‪( 01 -‬אשר התקיימו ב ‪ ,)22.10.2102 -‬פירסם עיתון הארץ את‬ ‫הסקר של פרופסור קמיל פוקס (דיאלוג) עם תוצאות הבחירות המשוערות‪ ,‬בקישור הבא‪:‬‬ ‫‪ ‬‬ ‫הסקר כלל ‪ 202‬משיבים (מתוכם ‪ 202‬בסקר טלפוני רווי‪ ,‬ו ‪ 011 -‬משיבים בטלפונים ניידים)‬ ‫הסקר כלל את מספר המנדטים עבור כל מפלגה שעברה את אחוז החסימה‪ ,‬ואחוז המצביעים המשוער‬ ‫עבור המפלגות שלא עברו את אחוז החסימה‪ .‬הנה התוצאות לפניכם‪ ,‬למול נתוני תוצאות האמת (אשר נלקחו‬ ‫מכאן‪) :‬‬ ‫מפלגה‬ ‫הליכוד ביתנו‬ ‫העבודה‬ ‫הבית היהודי‬ ‫ש"ס‬ ‫התנועה‬ ‫יש עתיד‬ ‫יהדות התורה‬ ‫מרצ‬ ‫רעם‪-‬תעל‪ ,‬בל"ד‪,‬‬ ‫חד"ש‬ ‫קדימה‬ ‫בסקר במציאות‬ ‫‪31‬‬ ‫‪32‬‬ ‫‪15‬‬ ‫‪17‬‬ ‫‪11‬‬ ‫‪14‬‬ ‫‪11‬‬ ‫‪12‬‬ ‫‪6‬‬ ‫‪8‬‬ ‫‪19‬‬ ‫‪12‬‬ ‫‪7‬‬ ‫‪5‬‬ ‫‪6‬‬ ‫‪6‬‬ ‫‪12‬‬ ‫‪2‬‬ ‫‪12‬‬ ‫‪2‬‬ ‫מטלות‪:‬‬ ‫‪ )0‬צרו תרשים פיזור של שני המשתנים‪ .‬הקפידו בבחירתכם של מי שצריך להיות בציר ה‪ X -‬ומי בציר ה‪Y -‬‬ ‫(כאשר בציר ה‪ ,X -‬נעדיף את המשתנה ה"מסביר")‬ ‫‪ )2‬מהו מקדם המתאם של פירסון (הקורלציה)?‬ ‫‪ )2‬מהו אחוז השונות המוסברת?‬ ‫‪ )4‬התאימו מודל של רגרסיית ריבועים פחותים (‪ – )OLS‬מהו המודל? (חותך‪ ,‬שיפוע‪ ,‬נוסחא)‬ ‫‪ )5‬מה תהיה תחזית מודל ה‪ OLS -‬עבור מפלגה שקיבלה בסקר ‪ 5‬מנדטים? האם החיזוי שונה ממה‬ ‫שהתרחש במציאות עבור המפלגה "יהדות התורה"? אם כן – הסבירו כיצד ייתכן שיהיו שתי התוצאות‬ ‫השונות הללו‪.‬‬ ‫‪ )2‬התאימו מודל של רגרסיית קו חסין – מהו המודל? (חותך‪ ,‬שיפוע‪ ,‬נוסחא)‬ ‫‪ )2‬הלבישו על תרשים הפיזור שלכם מסעיף ‪ 0‬את שני קווי הרגרסיה אשר חישבתם‪.‬‬ ‫‪ )8‬צרו תרשים שאריות (‪ )ei‬עבור מודל הרגרסיה של קו הריבועים הפחותים מול ערכי ‪.x‬‬ ‫‪ )1‬מהי ההתפלגות של השאריות של מודל הרגרסיה (צרו תרשים היסטוגרמה‪ ,‬או צפיפות עם מחליק‬ ‫קרנל)‪ .‬מהי צורת ההתפלגות? האם אתם מזהים תצפית‪/‬תצפיות חריגות? (אם כן‪ ,‬ציינו מהי התצפית‬ ‫הזו)‬ ‫‪ )01‬מהי מסקנתכם מניתוח הנתונים‪:‬‬ ‫‪ .a‬האם נראה לכם שיש קשר בין שני המשתנים?‬ ‫‪ .b‬האם לדעתכם (תחת הנחות סבירות) יש סיבתיות בין המשתנים? (אם כן‪ ,‬מהו כיוונה?)‬ ‫נספח – קצת עזרה על הקוד ‪R‬‬ ‫למען הנוחות‪ ,‬הנה הדבק של קוד פשוט לשימושכם‪ ,‬והסבר על הפונקציות שבו (הסבר יותר מורחב תוכל לקרוא בדפי העזרה‬ ‫של הפונקציות(‬ ‫)‪x <- c(72, 88, 88, 96, 96‬‬ ‫)‪y <- c(73, 87, 74, 90, 100‬‬ ‫)‪cor(x, y‬‬ ‫)‪plot(y~x, pch = 19, cex = 1.5‬‬ ‫)‪model_1 <- lm(y~x‬‬ ‫)‪abline(model_1, col = 2, lwd = 3‬‬ ‫)‪model_2 <- line(x,y‬‬ ‫)‪abline(model_2, col = 3, lwd = 3‬‬ ‫))‪legend("topleft", legend = c("OLS", "Robust"), fill = c(2,3‬‬ )‪points(mean(y) ~ mean(x), pch = 3, col = "purple", lwd = 5‬‬ ‫)‪summary(model_1‬‬ ‫הסברים על הפונקציות‪R:‬‬ ‫עושה תרשים פיזור ‪plot -‬‬ ‫מתאימה מודל של רגרסיה לינארית ‪lm -‬‬ ‫הקורלציה בין שני משתנים – ‪cor‬‬ ‫‪.‬מלביש את קו הרגרסיה על התרשים ‪abline -‬‬ ‫היא הפונקציה בשביל הרגרסיה החסינה ‪line -‬‬ ‫‪.‬נותן מיקראה בגרף ‪legend -‬‬ ‫‪ Y.‬ושל ‪ X‬מאפשר להוסיף נקודה של הממוצע של ‪points -‬‬ ‫מוסיף מידע על תוצאות הרגרסיה – ‪summary‬‬ ‫‪o‬‬ ‫‪o‬‬ ‫‪o‬‬ ‫‪o‬‬ ‫‪o‬‬ ‫‪o‬‬ ‫‪o‬‬ ‫‪o‬‬ ‫שאלה ‪4‬‬ ‫אנא פתרו את הסעיפים ‪ 2 ,5 ,4‬משאלה ‪ 2‬שוב‪ ,‬אבל ידנית‪ .‬מותר לכם לחשב את הממוצעים‪ ,‬סטיות התקן‪,‬‬ ‫קורלציות‪ ,‬חציונים‪ ,‬וכו' באמצעות ‪.R‬‬ ‫**שאלה ‪( 5‬בונוס של עד ‪ 5‬נקודות)‬ ‫באפשרותכם לשפר אחד או כמה מהערכים הבאים בויקיפדיה העברית –‬ ‫מתאם פירסון‬ ‫‪ ‬‬ ‫‪%D7%A1%D7%95%D7%9F‬‬ ‫רגרסיה לינארית‬ ‫‪ ‬‬ ‫‪D7%99%D7%A0%D7%90%D7%A8%D7%99%D7%AA‬‬ ‫ושפרו את הערך (באפשרותכם להיעזר בערך באנגלית)‪.‬‬ ‫כתשובה לתרגיל זה רישמו‪:‬‬ ‫‪ )0‬את שם המשתמש שלכם בויקפדיה‬ ‫‪ )2‬תמצות של מה ביצעתם‬ ‫‪ )2‬כמה נקודות בונוס מגיע לכם (לדעתכם) על עבודת העריכה שביצעתם (בין ‪ 0‬ל‪ 5 -‬נק')‬ ...
View Full Document

{[ snackBarMessage ]}

What students are saying

  • Left Quote Icon

    As a current student on this bumpy collegiate pathway, I stumbled upon Course Hero, where I can find study resources for nearly all my courses, get online help from tutors 24/7, and even share my old projects, papers, and lecture notes with other students.

    Student Picture

    Kiran Temple University Fox School of Business ‘17, Course Hero Intern

  • Left Quote Icon

    I cannot even describe how much Course Hero helped me this summer. It’s truly become something I can always rely on and help me. In the end, I was not only able to survive summer classes, but I was able to thrive thanks to Course Hero.

    Student Picture

    Dana University of Pennsylvania ‘17, Course Hero Intern

  • Left Quote Icon

    The ability to access any university’s resources through Course Hero proved invaluable in my case. I was behind on Tulane coursework and actually used UCLA’s materials to help me move forward and get everything together on time.

    Student Picture

    Jill Tulane University ‘16, Course Hero Intern