COS301-SE-2024 · paul-nhlapo · Aug 11, 2024 · Aug 10, 2024 · Aug 11, 2024 · Aug 11, 2024
diff --git a/.gitignore b/.gitignore
@@ -9,3 +9,4 @@ myenv/
 __pycache__/
 .DS_Store
 **/.DS_Store
+env
diff --git a/backend/Detection_Engine/GND_LSG.jpg b/backend/Detection_Engine/GND_LSG.jpg
diff --git a/backend/Detection_Engine/Mediator Narrow Web Extra Bold.ttf b/backend/Detection_Engine/Mediator Narrow Web Extra Bold.ttf
diff --git a/backend/Detection_Engine/__init__.py b/backend/Detection_Engine/__init__.py
diff --git a/backend/Detection_Engine/biometric_detection.py b/backend/Detection_Engine/biometric_detection.py
@@ -58,7 +58,9 @@ def biometric_detect_all(self,pdf_path):
         # clean up folders
         if (pdf_path.endswith('.pdf')):
             # extract_images_from_pdf(pdf_path)
-            images = [f'./Detection_Engine/extracted_images/pdf_images/{i}' for i in os.listdir('./Detection_Engine/extracted_images/pdf_images')]
+
+            images = [f'./Detection_Engine/extracted_images/pdf_images/{i}' for i in os.listdir('./Detection_Engine/extracted_images/pdf_images') if i.endswith('.png')]
+
             output = []
             for image in images:
                 output.append(self.biometric_detect_people(image))
@@ -71,7 +73,7 @@ def biometric_detect_all(self,pdf_path):
 
         elif (pdf_path.endswith('.docx')):
             # extract_images_from_docx(pdf_path)
-            images = [f'./Detection_Engine/extracted_images/docx_images/{i}' for i in os.listdir('./Detection_Engine/extracted_images/docx_images')]
+            images = [f'./Detection_Engine/extracted_images/docx_images/{i}' for i in os.listdir('./Detection_Engine/extracted_images/docx_images') if i.endswith('.png')]
             output = []
             for image in images:
                 output.append(self.biometric_detect_people(image))
@@ -84,7 +86,7 @@ def biometric_detect_all(self,pdf_path):
 
         elif (pdf_path.endswith('.xlsx')):
             # extract_images_from_excel(pdf_path)
-            images = [f'./Detection_Engine/extracted_images/xlsx_images/{i}' for i in os.listdir('./Detection_Engine/extracted_images/xlsx_images')]
+            images = [f'./Detection_Engine/extracted_images/xlsx_images/{i}' for i in os.listdir('./Detection_Engine/extracted_images/xlsx_images') if i.endswith('.png')]
             # images = [f'extracted_images/xlsx_images/{i}' for i in os.listdir('extracted_images/xlsx_images')]
             output = []
             for image in images:
@@ -95,6 +97,19 @@ def biometric_detect_all(self,pdf_path):
                 os.remove(file)
 
             return output
+
+        directories = [
+            "./Detection_Engine/extracted_images/xlsx_images",
+            "./Detection_Engine/extracted_images/docx_images",
+            "./Detection_Engine/extracted_images/pdf_images"
+        ]
+
+        for directory in directories:
+            all_files = glob.glob(os.path.join(directory, '*'))
+            for file in all_files:
+                os.remove(file)
+
+        return output
 
 
 

diff --git a/backend/Detection_Engine/circle-question-regular.jpg b/backend/Detection_Engine/circle-question-regular.jpg
diff --git a/backend/Detection_Engine/detection_engine.py b/backend/Detection_Engine/detection_engine.py
@@ -3,6 +3,9 @@
 from .regex_layer import regex_layer
 from .report_generation_layer import report_generation_layer
 
+import datetime
+import os
+
 class detection_engine:
 
     def __init__(self):
@@ -72,6 +75,36 @@ def process(self, path, path_):
             status = "Compliant"
         else:
             status = "Non-compliant"
+
+#----------------------------------------------------------REPORT GEN------------------------------------------------------------------# 
+
+        location_report = self.report_generator.location_report_generation(text)
+        ner_result_report = self.report_generator.ner_report_generation(text)
+        reg_result_personal_report = self.regex_report_personal(text)
+        reg_result_financial_report = self.regex_report_financial(text)
+        reg_result_contact_report = self.regex_report_contact(text)
+        ca_statement_report = self.report_generator.CA_report_generation(text)
+        gi_result_report = self.report_generator.gen_report(text)
+        em_result_report = self.report_generator.EM_report(text)
+        md_result_report = self.report_generator.MD_report(text)
+        image_result_report = self.report_generator.Image_report_generation(path_)
+
+        violation_data = {
+            "score": {
+                "Location": location_report,
+                "NER": ner_result_report,
+                "Personal": reg_result_personal_report,
+                "Financial": reg_result_financial_report,
+                "Contact": reg_result_contact_report,
+                "Consent Agreement": ca_statement_report,
+                "Genetic": gi_result_report,
+                "Ethnic": em_result_report,
+                "Medical": md_result_report,
+                "Biometric": image_result_report,
+            }
+        }
+
+#----------------------------------------------------------REPORT GEN END------------------------------------------------------------------#
 
         result = ""
         result += status
@@ -111,6 +144,65 @@ def process(self, path, path_):
         # print(path_)
         # print(self.report_generator.Image_report(path_))
         return result
+
+#----------------------------------------------------------REPORT GEN------------------------------------------------------------------# 
+
+    def report_generation(self, path, path_):
+
+        text = path
+
+        location_report = self.report_generator.location_report_generation(text)
+        ner_result_report = self.report_generator.ner_report_generation(text)
+        reg_result_personal_report = self.regex_report_personal(text)
+        reg_result_financial_report = self.regex_report_financial(text)
+        reg_result_contact_report = self.regex_report_contact(text)
+        ca_statement_report = self.report_generator.CA_report_generation(text)
+        gi_result_report = self.report_generator.gen_report(text)
+        em_result_report = self.report_generator.EM_report(text)
+        md_result_report = self.report_generator.MD_report(text)
+        image_result_report = self.report_generator.Image_report_generation(path_)
+
+        status = 1
+
+        if (reg_result_personal_report > 0 or 
+            reg_result_financial_report > 0 or 
+            reg_result_contact_report > 0 or  
+            gi_result_report > 0 or 
+            em_result_report > 0 or 
+            md_result_report > 0 or 
+            image_result_report > 0):
+
+                status = 0
+
+
+        violation_data = {            
+            "score": {
+                "Status": status,
+                "Location": location_report,
+                "NER": ner_result_report,
+                "Personal": reg_result_personal_report,
+                "Financial": reg_result_financial_report,
+                "Contact": reg_result_contact_report,
+                "Consent Agreement": ca_statement_report,
+                "Genetic": gi_result_report,
+                "Ethnic": em_result_report,
+                "Medical": md_result_report,
+                "Biometric": image_result_report,
+            }
+        }
+
+        timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
+        # output_file = f"violation_report_{timestamp}.pdf"
+        output_dir = os.path.join(".", "Generated_Reports")
+        output_file = os.path.join(output_dir, f"violation_report_{timestamp}.pdf")
+
+        if not os.path.exists(output_dir):
+            os.makedirs(output_dir)
+
+        self.report_generator.generate_pdf(violation_data, output_file)
+        return violation_data
+
+#----------------------------------------------------------REPORT GEN END------------------------------------------------------------------#
 
 
 if __name__ == "__main__":

diff --git a/backend/Detection_Engine/location-dot-solid.jpg b/backend/Detection_Engine/location-dot-solid.jpg