Data Science N004 Recopilar datos de una tabla en excel y el formato .csv

Cordiales Saludos

Recopilación de Datos de una hoja de excel

Podemos importar los datos de una hoja de excel para trabajar, con ellos, en nuestro cuaderno de jupyter notebooks. Hasta ahora realizábamos los ejercicios creando nosotros las variables para las Series y Dicionarios que luego tratábamos con los Data Frame. Ahora comenzaremos a "recopilar los datos", traerlos desde un archivo externo a nuetra área de trabajo.

Para la extracción de datos de una tabla de excel, tomé como referencia: La Tabla final de la Temporada N14 del Torneo de Ajedrez que organiza el amigo @schamangerbert


Season 14: 17 July to 18 September 2021 / Standings after Round 9 (Final):
004_11.png
Fuente

Conectando nuestro DRIVE

Debemos activar nuestro DRIVE dentro de nuestro cuaderno de trabajo para poder accesar a los archivos que nos interesan.
Importante: Previamente debemos cargar el archivo de excel a la carpera de Colab Notebooks


004_DRIVE.png

Para activar el DRIVE, click a la carpeta de exploración de archivos (Flecha roja)

004_1.png

Luego click en la carpeta con es símbolo del DRIVE (Flecha roja)

004_2.png

Luego aparecerá este mensaje y le damos click a [Conectar con Google Drive]

004_3.png

Aparecerá nuestro DRIVE en el explorador de archivos (Recuadro azul)

004_4.png

Entramos a Colab Notebooks y luego a nuestra carpeta de trabajo del curso. En el recuadro verde vemos los dos archivos con los que trabajaremos en esta publicación.

004_5.png

Para comenzar a trabajar escribiremos el siguiente código

import pandas as pd
from google.colab import drive

.

004_6.png

A continuación copiamos la ruta de acceso al archivo de excel. Primero click con el botón derecho a Season14.slsx (flecha azul) para desplegar el menú contextual.

004_7.png

Luego agregamos la ruta de acceso al archivo a la siguiente instrucción(Ctrl + V), dentro de las comillas (Flecha roja)

pd.read_excel(' ')

004_8.png

Y listo!

004_9.png


python_pandas2.png

Recopilación de Datos de un archivo .csv

Trabajaremos con los datos utilizados en nuestra publicación anterior: Tabla final 7ma Temporada Hivechess Tournament, organizado por @stayoutoftherz, pero ahora guardada en nuestro DRIVE con la extensión .csv

004_12.png

Importante: Que son los archivos .csv
Todo el proceso para recopilar los datos en este formato, es igual a lo que acabamos de hacer para traer los datos de una hoja de cálculo, cambiaríamos solamente la instrucción que sigue:

pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Data_Science/Tabla_jugadores.csv')

004_10.png


separador001.png

Lo bonito de la informática es que podemos hacer algunos procesos de diferentes formas, el siguiente código es otra manera para activar El DRIVE en nuestra área de trabajo. Esto lo revisaremos en otra publicación

from google.colab import drive
drive.mount('/content/drive')  


separador001.png

Mi twitter
Rafael Aquino (Facebook)

H2
H3
H4
3 columns
2 columns
1 column
Join the conversation now
Ecency