View full version

Data Science N004 Recopilar datos de una tabla en excel y el formato .csv

Cordiales Saludos

Recopilación de Datos de una hoja de excel

Podemos importar los datos de una hoja de excel para trabajar, con ellos, en nuestro cuaderno de jupyter notebooks. Hasta ahora realizábamos los ejercicios creando nosotros las variables para las Series y Dicionarios que luego tratábamos con los Data Frame. Ahora comenzaremos a "recopilar los datos", traerlos desde un archivo externo a nuetra área de trabajo.

Para la extracción de datos de una tabla de excel, tomé como referencia: La Tabla final de la Temporada N14 del Torneo de Ajedrez que organiza el amigo @schamangerbert


Season 14: 17 July to 18 September 2021 / Standings after Round 9 (Final):

Fuente

Conectando nuestro DRIVE

Debemos activar nuestro DRIVE dentro de nuestro cuaderno de trabajo para poder accesar a los archivos que nos interesan.
Importante: Previamente debemos cargar el archivo de excel a la carpera de Colab Notebooks



Para activar el DRIVE, click a la carpeta de exploración de archivos (Flecha roja)

Luego click en la carpeta con es símbolo del DRIVE (Flecha roja)

Luego aparecerá este mensaje y le damos click a [Conectar con Google Drive]

Aparecerá nuestro DRIVE en el explorador de archivos (Recuadro azul)

Entramos a Colab Notebooks y luego a nuestra carpeta de trabajo del curso. En el recuadro verde vemos los dos archivos con los que trabajaremos en esta publicación.

Para comenzar a trabajar escribiremos el siguiente código

import pandas as pdfrom google.colab import drive

.

A continuación copiamos la ruta de acceso al archivo de excel. Primero click con el botón derecho a Season14.slsx (flecha azul) para desplegar el menú contextual.

Luego agregamos la ruta de acceso al archivo a la siguiente instrucción(Ctrl + V), dentro de las comillas (Flecha roja)

pd.read_excel(' ')

Y listo!



Recopilación de Datos de un archivo .csv

Trabajaremos con los datos utilizados en nuestra publicación anterior: Tabla final 7ma Temporada Hivechess Tournament, organizado por @stayoutoftherz, pero ahora guardada en nuestro DRIVE con la extensión .csv

Importante: Que son los archivos .csv
Todo el proceso para recopilar los datos en este formato, es igual a lo que acabamos de hacer para traer los datos de una hoja de cálculo, cambiaríamos solamente la instrucción que sigue:

pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Data_Science/Tabla_jugadores.csv')




Lo bonito de la informática es que podemos hacer algunos procesos de diferentes formas, el siguiente código es otra manera para activar El DRIVE en nuestra área de trabajo. Esto lo revisaremos en otra publicación

from google.colab import drivedrive.mount('/content/drive')  



Mi twitter
Rafael Aquino (Facebook)