Dieses Script ermöglicht das Auslesen (PDF/JPG/PNG) von Text mittels OCR. Dieser Text wird an eine lokale KI gesendet und aufbereitert. Danach wird (im besten Fall ;-)) ein sinnvoller Dateiname zurückgegeben. Abschließend wir die Datei umbennant und in den done
-Order verschoben.
./scan.sh .
ausführen (Parameter gibt Verzeichnis an, aus welchem die Dateien eingelesen werden sollen)
./scan 11-11-2023 0002 35.pdf
Starte OCR-Erkennung ...
OCR erfolgreich
Starte KI-Anfrage ...
Continentale Versicherung Erhöhung ( ContinentaleVersicherung\_Erhöhung.txt )
'./scan 11-11-2023 0002 35.pdf' wurde erfolgreich zu './done/Continentale Versicherung Erhöhung.pdf' umbenannt und verschoben
./scan 11-11-2023 0002 7.pdf
Starte OCR-Erkennung ...
OCR erfolgreich
Starte KI-Anfrage ...
Datenschutzerklärung Finanzberater ( Datenschutzerklärung\_Finanzberater.txt )
'./scan 11-11-2023 0002 7.pdf' wurde erfolgreich zu './done/Datenschutzerklärung Finanzberater.pdf' umbenannt und verschoben
...
- Repo klonen:
git clone https://github.com/tabsl/ocr-scan-and-rename-by-ai.git
- Homebrew installieren: https://brew.sh
- Poppler installieren:
brew install poppler
- Tesseract installieren:
brew install tesseract
- Tesseract DE-Langpack installieren:
brew install tesseract-lang
- LM-Studio installieren: https://lmstudio.ai
- LLM über LM-Sudio downloaden: https://huggingface.co/TheBloke/vicuna-13B-v1.5-16K-GGUF/blob/main/vicuna-13b-v1.5-16k.Q4_K_M.gguf
chmod +x ./scan.sh
- LM-Studio (Local Inference Server) mit entsprechendem LLM starten
This script enables reading text (PDF/JPG/PNG) using OCR. The text is sent to a local AI and processed. Then, in the best case ;-), a meaningful filename is returned. Finally, the file is renamed and moved to the done
folder.
Run ./scan.sh .
(the parameter specifies the directory from which the files should be read)
./scan 11-11-2023 0002 35.pdf
Starting OCR detection ...
OCR successful
Starting AI request ...
Continental Insurance Increase ( ContinentalVersicherung_Erhöhung.txt )
'./scan 11-11-2023 0002 35.pdf' was successfully renamed to './done/Continental Insurance Increase.pdf' and moved
./scan 11-11-2023 0002 7.pdf
Starting OCR detection ...
OCR successful
Starting AI request ...
Data Protection Declaration Financial Advisor ( Datenschutzerklärung_Finanzberater.txt )
'./scan 11-11-2023 0002 7.pdf' was successfully renamed to './done/Data Protection Declaration Financial Advisor.pdf' and moved
...
- Clone repo:
git clone https://github.com/tabsl/ocr-scan-and-rename-by-ai.git
- Install Homebrew: https://brew.sh
- Install Poppler:
brew install poppler
- Install Tesseract:
brew install tesseract
- Install Tesseract DE language pack:
brew install tesseract-lang
- Install LM-Studio: https://lmstudio.ai
- Download LLM via LM-Studio: https://huggingface.co/TheBloke/vicuna-13B-v1.5-16K-GGUF/blob/main/vicuna-13b-v1.5-16k.Q4_K_M.gguf
chmod +x ./scan.sh
- Start LM-Studio (Local Inference Server) with the respective LLM