Skip to content

Releases: monambike/pdfconverter-pdftables-to-csv

1.3

03 Dec 12:52
Compare
Choose a tag to compare
v1.3

Update files to keep the same as OuroWeb TFS

v1.2

28 Jul 19:32
Compare
Choose a tag to compare
Update README.md

v1.1

12 Jul 14:49
Compare
Choose a tag to compare
v1.1 Pre-release
Pre-release

NOTAS DE ATUALIZAÇÃO

(versão: v1.1)

MELHORIAS

Argumentos

Foi criada uma nova função em conjunto com a biblioteca argparse para fazer o recebimento e a manipulação de argumentos. Agora o usuário pode passar o caminho de importação e exportação para o terminal.
Foi definido o caminho de exportação padrão como a mesma pasta na qual localiza-se o Script ou executável do Script.

Terminal

Houveram melhorias nas mensagens de erro exibidas pelo terminal, e foram criadas novas para atender a adição das funções relacionadas à argumentos do terminal.

Código

Houveram diversas mudanças e melhorias na documentação do código para facilitar a compreensão.
Agora o arquivo de terminal é ignorado com o .gitignore.

ERROS CONSERTADOS

Foi criado o tratamento para chegar dentro do Script se no momento da operação a pasta existe.

v1.0 - First Best Release

02 Jul 19:51
Compare
Choose a tag to compare

NOTAS DE ATUALIZAÇÃO

(versão: v1.0)

Houveram muitas mudanças, desde documentação do código à algumas modificações de exportação e formatação. Essa é a melhor versão até o momento.

v0.9

07 May 19:03
Compare
Choose a tag to compare

NOTAS DE ATUALIZAÇÃO

(versão: v0.9)

Houve poucas atualizações na prática mais houveram muitas muitas mudanças na documentação, melhorias no código e similares para melhor funcionamento da aplicação e entendimento pro parte do desenvolvedor.

MELHORIAS

Código

Foram feitas algumas mudanças de disposição de código e de documentação para melhor entendimento.

Terminal

Agora o terminal exibe os índices corretamente e possui algumas melhorias visuais.

README

Agora o arquivo está finalmente estruturado e detalha alguns processos do código.

v0.8 - Huge Update

03 May 20:30
Compare
Choose a tag to compare

NOTAS DE ATUALIZAÇÃO

(versão: v0.8)

MELHORIAS

Exportação

Agora o resultado da exportação está mais fiel à tabela porque os dados são convertidos como string antes de serem passados ao DataFrame.

Terminal

Melhoria no leiaute da tabela do terminal.

Código

Agora o código possui um padrão de documentação melhor estruturado que antes, com títulos e descrições e com métodos separados por regiões.

Agora a conversão Lattice e Stream possui um método que deixa mais claro o entendimento.

O método 'cleanTextFile' foi mudado para 'formatTextFile' para melhor compreensão.

Estrutura de Arquivos

Os caminhos estão sendo dispostos de uma forma mais intuitiva, resultando em menos pastas.

ERROS CONSERTADOS

A saída do terminal agora está mais legível e os números de página foram trocados pelo índex da tabela, pois era o que estava sendo exibido anteriormente, apenas estava com o rótulo errado.

Agora o código está melhor formatado por conta das expressões regulares. Agora as seguintes situações foram tratadas.

  • Campos vazios
  • Zeros à esquerda (leading zeros)
  • E números em inteiro que acabavam sendo convertidos para double resultando em zeros à direita desnecessários

v0.7 - Code Structure Update

22 Apr 19:49
c2345e6
Compare
Choose a tag to compare
Pre-release

NOTAS DE ATUALIZAÇÃO

(versão: v0.7)

O código está mais enxuto e com algumas mudanças na documentação e disposição do código.

MUDANÇAS

Apenas mudanças necessárias para facilitar a codificação do projeto.

v0.6

14 Apr 20:33
Compare
Choose a tag to compare
v0.6 Pre-release
Pre-release

NOTAS DE ATUALIZAÇÃO

(versão: v0.6)

O código está mais enxuto com a criação de novos métodos.

MUDANÇAS

Remoção

Foi removida a exportação de arquivos com guess=False

ERROS CONSERTADOS

Agora as linhas que não possuem separador são apagadas (títulos, descrições, coisas que não são consideradas tabelas, ou seja, possuem divisões).

Foi resolvido um erro de codificação que impedia de algumas páginas serem convertidas.

Linhas de dados que estão completamente vazias são apagadas.

Foi arrumado um erro que impedia de Exceptions serem exibidas corretamente na saída do terminal.

v0.5

14 Apr 11:52
Compare
Choose a tag to compare
v0.5 Pre-release
Pre-release

NOTAS DE ATUALIZAÇÃO

(versão: v0.5)

O código foi limpado evitando

NOVOS RECURSOS

Preparando Terreno

Adicionei algumas linhas de código para que fosse possível dar início à alguns testes futuros que vão ajudar a trazer melhorias ao código, no momento estou testando alguns modos de leitura e escrita de dados.

Observe que agora tem dois métodos de leitura (lattice e stream) cada um tendo o guess=False e guess=True.

MUDANÇAS

Melhorias

Agora a saída do terminal está mais limpa e tem uma linha ITENS10.pdf lattice=True guess=False onde será possível realizar uma pesquisa com o CTRL + F para achar a opção de sua escolha.

image

Remoção

Foi removida a conversão para Excel para facilitar e agilizar o andamento do projeto, ia ser muito difícil dar manutenção à conversão de texto e Excel ao mesmo tempo.
Além disso, como são muitos arquivos de PDF que são convertidos de uma vez, converter duas vezes toma bastante tempo, ainda mais quando é uma extensão de arquivo que aparenta ser mais complexa como Excel.

v0.4 - Appearance Update

12 Apr 20:36
Compare
Choose a tag to compare

NOTAS DE ATUALIZAÇÃO

(versão: v0.4)

NOVOS RECURSOS

Aparência

Todos os ícones do projeto foram atualizados.

Agora o projeto segue uma paleta de cores definida.

Praticidade

O executável foi gerado.

Agora tem uma progressBar para checar o andamento da conversão.

ERROS CONSERTADOS

Agora os números que antes eram gerados pelo index já não são gerados mais.