🧑💻엔지니어 정보
- 네이버 SmartPlace
- 그림, 수식 표현에 제한
-
구글
- 문단이 나눠지지 않음.
- pdf는 인식이 잘 되지만 손 글씨는 잘 인식하지 못함.
-
이름 : PILGI Analog To Digital
-
IDEA :
→ 강의 듣는데 자신의 글씨를 알아볼 수 없다.
→ 깔끔하게 저장할 수 있는 model 필요!
-
input : Image ( 수학 과제, 수업 필기)
- output : txt, LaTex, Image 별 다른 OUTPUT을 갖음
- 과정
- TEXT → (CHARCTER, CONTENT, 띄어쓰기 여부, 문단 바꾸기 여부)
- 글자 크기 DEFAULT
- 시작 위치 (x,y) 좌표에다가 해당 TXT 내용 뿌림.
- DRAWING → (X, Y, X_SIZE, Y_SIZE)
- DETECTION 모델
- LATEX CHARACTER ⇒ 실제 기호 1.
- TEXT → (CHARCTER, CONTENT, 띄어쓰기 여부, 문단 바꾸기 여부)
- DETECTOR 모델과, OCR 모델
- DETECTION LAYER로 해당 PIXEL과 CLASS를 얻음
- DRAWING CLASS의 경우, 그대로 저장.
- CHARACTER CLASS의 경우, OCR 모델을
-
user 맞춤형, 약간의 overfitting
- 루게릭 병
- OCR의 중간에 user가 feedback 가능하도록
- 나중에