pandas
gráficos
- geral

pandas

geral

ler CSV (comprimido gzip)

arquivo file, separador ; e decimal ,, usando colunas da lista colunas

file = "./arquivo.csv"

df = pd.read_csv( file,\
                  sep=';',\
                  error_bad_lines=False,encoding='latin1',compression='gzip',warn_bad_lines=True,keep_default_na=False,\
                  usecols=colunas,decimal=','
                )

salvar em CSV (comprimido gzip)

df.to_csv('./pasta/' + 'nome arquivo' + '.csv.gz')

renomeando colunas de dataframe já existente

df.rename( columns={\
                    "AREA CONSTRUIDA_x": "área apto",\
                    "AREA CONSTRUIDA_y": "área garagem"\
                   },\
            
            inplace=True 
         )

visualização

ordenando colunas

df.sort_values(by=['col1'])

processando colunas

n primeiros caracteres

df['coluna nova'] = df['coluna tal'].str[0:6]

checar se contém sequência de caracteres

sem regex

critério1 = df['coluna tal'].str.contains("apartamento em condomínio",case=False)
temp['coluna nova'] = temp['coluna tal'].str[0:6]

com regex

critério2 = df['coluna tal'].str.contains("garagem.*residencial",case=False,regex=True)

extraindo linhas conforme os critérios

df_filtrado = df[ (critério1 | critério2) & critério3 ].copy()

criando colunas segundo critérios

df['coluna nova'] = np.where( \
                                (df['ano'] > 2006) & (df['ano'] < 2014), \
                                '2007-2013', \
                                '2014-2020'\
                            )

criando colunas usando VLOOKUP, sem jogar fora quando não encontra

df1.merge(df_busca, how='left', on='ID')

aplicando função em uma coluna para criar uma nova

df['coluna nova'] = df['coluna'].map( function , na_action='ignore' )

gerando relatórios

agrupando por certas colunas

colunas_agregar = [ "província" ]

agrega = {"área construída":'mean'}

dftemp1 = df.groupby( colunas_agregar ).agg( agrega ).reset_index()

classificando valores

por contagem igual (em 10 grupos)

df['quantil'] = pd.qcut(df['coluna a agrupar'],q=10)

por intervalo igual (em 4 grupos)

df['intervalo igual'] = pd.cut(df['coluna a agregar'], bins=4)

gráficos

geral

configurações preliminares

chamando matplotlib
```
import matplotlib.pyplot as plt
```

colocando fundo branco

plt.rcParams['axes.facecolor']='white'
plt.rcParams['savefig.facecolor']='white'

fixando tamanho
```
fig, ax = plt.subplots(figsize=(10,8))
```

mapa de calor

bin_labels_coluna1 = list(range(1, 11))
bin_labels_coluna2 = bin_labels_coluna1.copy()

df['quantil_coluna1'] = pd.qcut( df['coluna1'] , q=10 , labels=bin_labels_coluna1 )
df['quantil_coluna2'] = pd.cut( df['coluna2'], bins=10, labels=bin_labels_coluna2)

colunas_agregar = [ "quantil_coluna1" , "quantil_coluna2" ]
agrega = {"parâmetro para somar":'sum'}
agregado = df.groupby( colunas_agregar ).agg( agrega ).reset_index()

ax = sns.heatmap(agregado,square=True,annot=True,fmt="d")

criando gráfico

salvando

plt.savefig('gráfico.png',transparent=False)



```

```

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

python.md

python.md

pandas

geral

ler CSV (comprimido gzip)

salvar em CSV (comprimido gzip)

renomeando colunas de dataframe já existente

visualização

ordenando colunas

processando colunas

n primeiros caracteres

checar se contém sequência de caracteres

extraindo linhas conforme os critérios

criando colunas segundo critérios

criando colunas usando VLOOKUP, sem jogar fora quando não encontra

aplicando função em uma coluna para criar uma nova

gerando relatórios

agrupando por certas colunas

classificando valores

por contagem igual (em 10 grupos)

por intervalo igual (em 4 grupos)

gráficos

geral

configurações preliminares

mapa de calor

criando gráfico

salvando

Files

python.md

Latest commit

History

python.md

File metadata and controls

pandas

geral

ler CSV (comprimido gzip)

salvar em CSV (comprimido gzip)

renomeando colunas de dataframe já existente

visualização

ordenando colunas

processando colunas

n primeiros caracteres

checar se contém sequência de caracteres

extraindo linhas conforme os critérios

criando colunas segundo critérios

criando colunas usando VLOOKUP, sem jogar fora quando não encontra

aplicando função em uma coluna para criar uma nova

gerando relatórios

agrupando por certas colunas

classificando valores

por contagem igual (em 10 grupos)

por intervalo igual (em 4 grupos)

gráficos

geral

configurações preliminares

mapa de calor

criando gráfico

salvando