TRABAJO FINAL CIENCIA DE DATOS NATALIAS .docx - Universidad Pontificia Bolivariana-Escuela de Ingenier\u00eda y Arquitectura-Ingenier\u00eda Industrial

TRABAJO FINAL CIENCIA DE DATOS NATALIAS .docx - Universidad...

This preview shows page 1 - 3 out of 8 pages.

Universidad Pontificia Bolivariana-Escuela de Ingeniería y Arquitectura-Ingeniería Industrial COMPARACIÓN DE MODELOS PREDICTIVOS PARA PREDECIR LA CALIDAD DE VINOS TENIENDO EN CUENTA SUS PROPIEDADES FISICOQUIMICAS. Integrantes: Natalia A. Echeverry Aristizabal y Natalia A. Camacho Peñuela RESUMEN Dentro del machine learning es posible realizar aprendizaje no supervisado y supervisado, el aprendizaje supervisado trata de asignar una clasificación k (variable de salida) dadas unas variables de entrada que previamente han sido seleccionadas según su relevancia con el objeto de estudio. El proceso es realizado por medio de la utilización de distintos métodos y algoritmos direccionados a la manipulación de datos, como son la regresión logística (Logit), Análisis discriminante lineal (LDA), Análisis discriminante cuadrático y K nearest neighbors entre muchos otros métodos, en esta investigación fueron empleados los métodos de clasificación previamente mencionados. Abstract: Within machine learning it is possible to make supervised and unsupervised learning, supervised learning tries to assign a k classification (output) given a previously selected set of input variables or predictors that are relevant for the subject of study. The process is realized through the utilization of various methods and algorithms directionated to data handling, just as logistic regression (Logit), Linear discriminant analysis (LDA), Quadratic discriminant analysis (QDA) and k nearest neighbors (KNN) among other methods, in this investigation the previously mentioned methods were applied. 1. INTRODUCCION “La ciencia de datos es un campo interdisciplinario que utiliza métodos, procesos, algoritmos y sistemas científicos para extraer valor de los datos”[ CITATION ORA1 \l 9226 ]. Dentro de la ciencia de datos se encuentra el machine learning o aprendizaje automático, el cual es realizado por medio de algoritmos, el objetivo del machine learning es crear modelos que sean capaces de resolver una tarea asignada. El modelo es entrenado o ajustado a partir de una gran cantidad de datos, en una primera instancia se aprende de estos datos, en segunda instancia se realizan predicciones y por ultimo se realiza la validación de la precisión de las predicciones del modelo, la selección del método/Algoritmo a utilizar dependerá del objetivo del estudio y del comportamiento de los datos. Existen distintos tipos de machine learning, el aprendizaje supervisado y no supervisado, para el primer caso “los algoritmos trabajan con datos “etiquetados” (labeled data), intentado encontrar una función que, dadas las variables de entrada (input data), les asigne la etiqueta de salida adecuada. El algoritmo se entrena con un “histórico” de datos y así “aprende” a asignar la etiqueta de salida adecuada a un nuevo valor, es decir, predice el valor de
Image of page 1
Universidad Pontificia Bolivariana-Escuela de Ingeniería y Arquitectura-Ingeniería Industrial salida”[ CITATION Osv18 \l 9226 ], el aprendizaje supervisado suele ser usado en problemas de clasificación y
Image of page 2
Image of page 3

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture