6660Fall07pfinSoln - CS 6660 Fall 2007 practice final...

Info iconThis preview shows pages 1–2. Sign up to view the full content.

View Full Document Right Arrow Icon
CS 6660 Fall 2007 practice final sample solution 1.  Suppose you work for a car insurance company. You are asked to come up with  a system for classifying whether a new customer is likely to be a safe driver or an  unsafe driver.  Any customer with 2 or more accidents in any year, or with 3 or  more accidents over a 3-year span is considered “unsafe”. The data for your  evaluation: Accident claims from customers for the past 10 years: customer ID (the policy  number), date of accident, location of accident, cost to the insurance company  to handle the claim The personal data of the customers: name, address, social security number,  policy number, age, gender, single/married,  number of people in household  and their ages. Answer the following questions: a) List two attributes you will remove and explain why you are doing so. Name and social security number would not be useful. Neither has a meaningful  connection to driving safety. A social security number is (almost) unique, so any  conclusions based on that would only apply to an individual. b) Describe which customers you will remove from the classification process and  explain why. Any customers joining the company recently or starting driving recently would  not have had the time to generate the accident reports that can tell us if the driver  is safe or not.   c) For one of the attributes that you are using for your analysis, explain how you  would “bin” the data and why. address: use the zip code to split up the addresses. It makes sense that the  location will affect the number of accidents. In more urban areas, there are  usually many more cars, while in areas that have colder climates, weather  conditions like icy roads tend to cause more accidents. The zip code is better than  the city for binning since cities may vary significantly in size. Using the zip code  helps create a more even distribution of the area. 2. Going back to the classroom problem of the midterm, suppose we have a 
Background image of page 1

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
Image of page 2
This is the end of the preview. Sign up to access the rest of the document.

Page1 / 6

6660Fall07pfinSoln - CS 6660 Fall 2007 practice final...

This preview shows document pages 1 - 2. Sign up to view the full document.

View Full Document Right Arrow Icon
Ask a homework question - tutors are online