- arquivo
file
, separador;
e decimal,
, usando colunas da listacolunas
file = "./arquivo.csv" df = pd.read_csv( file,\ sep=';',\ error_bad_lines=False,encoding='latin1',compression='gzip',warn_bad_lines=True,keep_default_na=False,\ usecols=colunas,decimal=',' )
df.to_csv('./pasta/' + 'nome arquivo' + '.csv.gz')
df.rename( columns={\
"AREA CONSTRUIDA_x": "área apto",\
"AREA CONSTRUIDA_y": "área garagem"\
},\
inplace=True
)
df.sort_values(by=['col1'])
df['coluna nova'] = df['coluna tal'].str[0:6]
-
sem regex
critério1 = df['coluna tal'].str.contains("apartamento em condomínio",case=False) temp['coluna nova'] = temp['coluna tal'].str[0:6]
-
com regex
critério2 = df['coluna tal'].str.contains("garagem.*residencial",case=False,regex=True)
df_filtrado = df[ (critério1 | critério2) & critério3 ].copy()
df['coluna nova'] = np.where( \
(df['ano'] > 2006) & (df['ano'] < 2014), \
'2007-2013', \
'2014-2020'\
)
df1.merge(df_busca, how='left', on='ID')
df['coluna nova'] = df['coluna'].map( function , na_action='ignore' )
colunas_agregar = [ "província" ]
agrega = {"área construída":'mean'}
dftemp1 = df.groupby( colunas_agregar ).agg( agrega ).reset_index()
df['quantil'] = pd.qcut(df['coluna a agrupar'],q=10)
df['intervalo igual'] = pd.cut(df['coluna a agregar'], bins=4)
-
chamando matplotlib
import matplotlib.pyplot as plt
-
colocando fundo branco
plt.rcParams['axes.facecolor']='white' plt.rcParams['savefig.facecolor']='white'
-
fixando tamanho
fig, ax = plt.subplots(figsize=(10,8))
bin_labels_coluna1 = list(range(1, 11))
bin_labels_coluna2 = bin_labels_coluna1.copy()
df['quantil_coluna1'] = pd.qcut( df['coluna1'] , q=10 , labels=bin_labels_coluna1 )
df['quantil_coluna2'] = pd.cut( df['coluna2'], bins=10, labels=bin_labels_coluna2)
colunas_agregar = [ "quantil_coluna1" , "quantil_coluna2" ]
agrega = {"parâmetro para somar":'sum'}
agregado = df.groupby( colunas_agregar ).agg( agrega ).reset_index()
ax = sns.heatmap(agregado,square=True,annot=True,fmt="d")
plt.savefig('gráfico.png',transparent=False)
```
```