Proyecto TripleTen, Sprint 8: SQL
Descripción del Proyecto Análisis exploratorio de datos (Python)
Además de los datos que recuperaste en las tareas anteriores te han dado un segundo archivo. Ahora tienes estos dos CSV:
/datasets/project_sql_result_01.csv. contiene los siguientes datos:
company_name: nombre de la empresa de taxis
trips_amount: el número de viajes de cada compañía de taxis el 15 y 16 de noviembre de 2017.
/datasets/project_sql_result_04.csv. contiene los siguientes datos:
dropoff_location_name: barrios de Chicago donde finalizaron los viajes
average_trips: el promedio de viajes que terminaron en cada barrio en noviembre de 2017.
Para estos dos datasets ahora necesitas
importar los archivos estudiar los datos que contienen asegurarte de que los tipos de datos sean correctos identificar los 10 principales barrios en términos de finalización del recorrido hacer gráficos: empresas de taxis y número de viajes, los 10 barrios principales por número de finalizaciones sacar conclusiones basadas en cada gráfico y explicar los resultados Paso 5. Prueba de hipótesis (Python)
/datasets/project_sql_result_07.csv — el resultado de la última consulta. Contiene datos sobre viajes desde el Loop hasta el Aeropuerto Internacional O'Hare. Recuerda, estos son los valores de campo de la tabla:
start_ts: fecha y hora de la recogida weather_conditions: condiciones climáticas en el momento en el que comenzó el viaje duration_seconds: duración del viaje en segundos Prueba la hipótesis:
"La duración promedio de los viajes desde el Loop hasta el Aeropuerto Internacional O'Hare cambia los sábados lluviosos".
Decide por tu cuenta dónde establecer el nivel de significación (alfa).
Explica:
cómo planteaste las hipótesis nula y alternativa qué criterio usaste para probar las hipótesis y por qué