Pizarra con algunos materiales de nuestros encuentros

sábado, 21 de abril de 2018

Proyecto: tablas, funciones y espacios vectoriales

Dominar la conexión entre tablas, funciones y espacios vectoriales para poder llevar lo que vemos a modelos conocidos, y entender las consecuencias tanto que va a pasar como que herramientas tenemos disponibles para explorarlo.

Si estás aprendiendo Análisis de Datos o a programar son los "ladrillos" de los que vas a construir cualquier cosa que hagas, y más entender como todo está construido combinando tan poco...

Sirve porque si entendés como combinarlos enseguida encontrás muchas soluciones probadas, y en especial sabés que resisten la necesidad de cambio que va a traer el tiempo. Por el contrario, si no los entendés del todo, lo que construís sale irremediablemente frágil de mil maneras... como si hicieras una pared pero se te endurece el cemento, o no endurece nunca, y los ladrillos estan chuecos...

Aprender a usar tablas es valioso porque
  • Es la forma en que todas las empresas, fuentes de información y la mayoría de los sitios web guardan sus datos
  • Es la forma de asegurarte que podes estandarizar y recuperar algo coherente de lo que se guardo, en especial si lo cargan personas diferentes
Aprender a usar funciones es muy valioso porque
  • Te permite acumular y combinar formas de averiguar cosas, un ejemplo simple son las fórmulas que recordamos (y podemos programar) pero hay mucho más sofisticados ej. entrenar redes neuronales para que predigan resultados futuros en base a los pasados...
  • Es una forma solida de describir cualquier proceso que siga una máquina o un seres humanos
  • Los conjuntos, tablas y programas suelen definirse en base a funciones que dicen si un elemento pertenece o no, a cuales esta asociado, etc.
Aprender a usar espacios vectoriales es valioso porque
  • Los usamos para entender ej. posiciones y distancias en un mapa
  • Analizamos muchos otros problemas como si fueran mapas, ej. la "distancia" entre las ideas de dos personas y cuanto influye en que compren lo mismo, la "distancia" entre las caracteristicas de dos productos o empresas que compiten
  • Muchas veces lo estamos haciendo sin darnos cuenta cuando tratamos de encontrar "grises" entre dos categorias, ej. aunque una persona no sea ni de River ni de Boca, nos imaginamos en que grado quiere que gane más uno que el otro... lo mismo con posiciones políticas, aversión al riesgo, nivel socio económico, etc.

Estado actual

Probamos explicar en una mini-clase el primer objetivo del plan de modelos matemáticos y estadísticos.

Conseguimos una tabla de Restaurants de Palermo con latitud, longitud, rango de precios, tipo de comida, puntaje asignado por reviews, etc. https://www.kaggle.com/podemosaprender/restaurants-palermo

Próximos pasos

Crear un cuaderno en kaggle y compartirlo

Graficar funciones en dos dimensiones
 ej. precio vs. cuanto hace que abrió, como es de lindo vs. precio, etc.

Graficar funciones en tres dimensiones (heatmaps, 3d, etc.
 ej. el mapa vs. precios

Hacer las operaciones relacionales entre tablas (join, filtrar, diferencia entre conjuntos, unión, proyectar)
 ej. definir una tabla de tipo de comida a un número que indique de "0" para "comida chatarra" a "5" para "muy elegante y sofisticada, usar un join para asociar ese numero a cada fila de la tabla de restaurants
 ej. filtrar los restaurants que abrieron hace menos de un año

Calcular "distancias"
 ej. una "distancia de calidad" usando las columnas que indican como es de lindo el local, si la comida es chatarra y compararla con la distancia en los precios.
 ej. tratar de descubrir si los restaurants con opciones similares se agrupan por zona o se ponen lo mas lejos posible
 ej. tratar de descubrir lo mismo para los restaurants caros

¿A quienes les puedo preguntar?

@mauriciocap @patri




Compartir:

0 comentarios :

Publicar un comentario