Dominar la conexión entre tablas, funciones y espacios vectoriales para poder llevar lo que vemos a modelos conocidos, y entender las consecuencias tanto que va a pasar como que herramientas tenemos disponibles para explorarlo.
Si estás aprendiendo Análisis de Datos o a programar son los "ladrillos" de los que vas a construir cualquier cosa que hagas, y más entender como todo está construido combinando tan poco...Sirve porque si entendés como combinarlos enseguida encontrás muchas soluciones probadas, y en especial sabés que resisten la necesidad de cambio que va a traer el tiempo. Por el contrario, si no los entendés del todo, lo que construís sale irremediablemente frágil de mil maneras... como si hicieras una pared pero se te endurece el cemento, o no endurece nunca, y los ladrillos estan chuecos...
Aprender a usar tablas es valioso porque
- Es la forma en que todas las empresas, fuentes de información y la mayoría de los sitios web guardan sus datos
- Es la forma de asegurarte que podes estandarizar y recuperar algo coherente de lo que se guardo, en especial si lo cargan personas diferentes
Aprender a usar funciones es muy valioso porque
- Te permite acumular y combinar formas de averiguar cosas, un ejemplo simple son las fórmulas que recordamos (y podemos programar) pero hay mucho más sofisticados ej. entrenar redes neuronales para que predigan resultados futuros en base a los pasados...
- Es una forma solida de describir cualquier proceso que siga una máquina o un seres humanos
- Los conjuntos, tablas y programas suelen definirse en base a funciones que dicen si un elemento pertenece o no, a cuales esta asociado, etc.
Aprender a usar espacios vectoriales es valioso porque
- Los usamos para entender ej. posiciones y distancias en un mapa
- Analizamos muchos otros problemas como si fueran mapas, ej. la "distancia" entre las ideas de dos personas y cuanto influye en que compren lo mismo, la "distancia" entre las caracteristicas de dos productos o empresas que compiten
- Muchas veces lo estamos haciendo sin darnos cuenta cuando tratamos de encontrar "grises" entre dos categorias, ej. aunque una persona no sea ni de River ni de Boca, nos imaginamos en que grado quiere que gane más uno que el otro... lo mismo con posiciones políticas, aversión al riesgo, nivel socio económico, etc.
Estado actual
Probamos explicar en una mini-clase el primer objetivo del plan de modelos matemáticos y estadísticos.
Conseguimos una tabla de Restaurants de Palermo con latitud, longitud, rango de precios, tipo de comida, puntaje asignado por reviews, etc. https://www.kaggle.com/podemosaprender/restaurants-palermo
Conseguimos una tabla de Restaurants de Palermo con latitud, longitud, rango de precios, tipo de comida, puntaje asignado por reviews, etc. https://www.kaggle.com/podemosaprender/restaurants-palermo
Próximos pasos
Crear un cuaderno en kaggle y compartirlo
Graficar funciones en dos dimensiones
ej. precio vs. cuanto hace que abrió, como es de lindo vs. precio, etc.
Graficar funciones en tres dimensiones (heatmaps, 3d, etc.
ej. el mapa vs. precios
Hacer las operaciones relacionales entre tablas (join, filtrar, diferencia entre conjuntos, unión, proyectar)
ej. definir una tabla de tipo de comida a un número que indique de "0" para "comida chatarra" a "5" para "muy elegante y sofisticada, usar un join para asociar ese numero a cada fila de la tabla de restaurants
ej. filtrar los restaurants que abrieron hace menos de un año
Calcular "distancias"
ej. una "distancia de calidad" usando las columnas que indican como es de lindo el local, si la comida es chatarra y compararla con la distancia en los precios.
ej. tratar de descubrir si los restaurants con opciones similares se agrupan por zona o se ponen lo mas lejos posible
ej. tratar de descubrir lo mismo para los restaurants caros
Graficar funciones en dos dimensiones
ej. precio vs. cuanto hace que abrió, como es de lindo vs. precio, etc.
Graficar funciones en tres dimensiones (heatmaps, 3d, etc.
ej. el mapa vs. precios
Hacer las operaciones relacionales entre tablas (join, filtrar, diferencia entre conjuntos, unión, proyectar)
ej. definir una tabla de tipo de comida a un número que indique de "0" para "comida chatarra" a "5" para "muy elegante y sofisticada, usar un join para asociar ese numero a cada fila de la tabla de restaurants
ej. filtrar los restaurants que abrieron hace menos de un año
Calcular "distancias"
ej. una "distancia de calidad" usando las columnas que indican como es de lindo el local, si la comida es chatarra y compararla con la distancia en los precios.
ej. tratar de descubrir si los restaurants con opciones similares se agrupan por zona o se ponen lo mas lejos posible
ej. tratar de descubrir lo mismo para los restaurants caros
¿A quienes les puedo preguntar?
@mauriciocap @patri
0 comentarios :
Publicar un comentario