Herramientas de usuario

Herramientas del sitio


wiki2:jupyter

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
wiki2:jupyter [2018/12/23 15:55]
alfred [Panda data structures]
wiki2:jupyter [2020/05/09 09:25] (actual)
Línea 22: Línea 22:
  
 ''​df = pd.read_csv('​file.csv',​ header=2)''​ lee el fichero file.csv esquivando las dos primeras líneas. Más parámetros a la hora de leer: ''​df = pd.read_csv('​file.csv',​ header=2)''​ lee el fichero file.csv esquivando las dos primeras líneas. Más parámetros a la hora de leer:
-  * ''​indx_col=(0,​ 2, 3)'', ​no leerá ​las columnas 0, 2 ni 3.+  * ''​indx_col=(0,​ 2, 3)'', ​indica que las columnas 0, 2 son índices.
   * ''​parse_dates=[3]''​ indica que la columna 3 es fecha.   * ''​parse_dates=[3]''​ indica que la columna 3 es fecha.
  
Línea 39: Línea 39:
 </​code>​ </​code>​
  
-Para agrupar una columna por intervalos de, por ejemplo días, y luego contarlos usaríamos: ''​data['​columns'​].resample('​D'​).count()''​+Para agrupar una columna por intervalos de, por ejemplo días, y luego contarlos usaríamos: ''​data['​columns'​].resample('​D'​).count()''​. Con '​h'​ seria para horas.
  
 ==== Panda data structures ==== ==== Panda data structures ====
Línea 73: Línea 73:
  
 ''​count''​ and ''​sum''​ are other userful functions. ''​count''​ and ''​sum''​ are other userful functions.
 +
 +''​crimes = cirmes.set_index(['​primary'​],​ append=True)''​ añade la columna primary al indice. Es decir añade un level al indice.
 +==== Reshaping ====
 +
 +  * pivot_table (to select just the rows and columns you want)
 +  * stack / unstack (to add more levels to a multiindex)
 +  * groupby (like sql group by)
 +  * resample (for time intervals)
 +
 +
 +Añadir una columna (occourences) con valores de 1: ''​crimes['​occourences'​] = np.ones(len(crimes))''​. Ahora podrías crear un índice quitándote los repetidos con: ''​crimes.occourences.groupby(level=(0,​ 1)).sum()''​
 +
 +''​fillna(0)'' ​ method llena los valores que son NaN con 0.
 +
 +Consultar: ''​crimes_by_type.loc[:,​ ['​THEFT',​ '​HOMICIDE'​]]['​2016'​]''​. Mostrará los crímenes theft y homicidio en 2016. Para quitar ruido (porque estarán puestos por hora) los ponemos por día: ''​crimes_by_type.loc[:,​ ['​THEFT',​ '​HOMICIDE'​]]['​2016'​].ersample('​D'​).sum().plot()''​
 +
 +===== ipywidgets =====
 +
 +https://​ipywidgets.readthedocs.io
 +
 +[[https://​ipywidgets.readthedocs.io/​en/​stable/​examples/​Widget%20List.html|List of widges]]
 +
 +Are for creating dynamic notebooks.
 +
 +<​code>​
 +from ipywidgets import interact
 +
 +@interact(crime_type = crimetype.columns)
 +def plot_cart(crime_type):​
 +  crime_by_type.loc[:,​ crime_type]...
 +</​code>​
 ===== Jupyter Notebooks ─ Special cases ===== ===== Jupyter Notebooks ─ Special cases =====
  
wiki2/jupyter.1545580512.txt.gz · Última modificación: 2020/05/09 09:25 (editor externo)