the-deep · thenav56 · Jun 14, 2024 · Jun 14, 2024 · Jun 14, 2024
diff --git a/.flake8 b/.flake8
@@ -1,7 +1,7 @@
 [flake8]
-ignore = C901, W504
-max-line-length = 125
-exclude = .git,__pycache__,old,build,dist,*/migrations/*.py
+extend-ignore = C901, W504, E203, E701
+max-line-length = 130
+exclude = .git,__pycache__,old,build,dist,*migrations*,*snapshots*
 max-complexity = 10
 per-file-ignores =
     /**/tests/*_mock_data.py: E501

diff --git a/.github/workflows/lint.yml b/.github/workflows/lint.yml
@@ -0,0 +1,23 @@
+name: Python lint check
+
+on:
+  push:
+    branches:
+      - develop
+  pull_request:
+
+
+jobs:
+  pre_commit_checks:
+    name: 🚴 Pre-Commit checks 🚴
+    runs-on: ubuntu-latest
+
+    steps:
+      - uses: actions/checkout@main
+      - name: Install poetry
+        run: pipx install poetry
+      - uses: actions/setup-python@main
+        with:
+          cache: 'poetry'
+      - run: poetry install
+      - uses: pre-commit/action@main
diff --git a/.pre-commit-config.yaml b/.pre-commit-config.yaml
@@ -0,0 +1,27 @@
+default_language_version:
+  python: python3
+
+# NOTE: Update in .flake8 pyproject.toml as well
+exclude: |
+    (?x)^(
+      \.git|
+      __pycache__|
+      .*snap_test_.*\.py|
+      .+\/.+\/migrations\/.*
+    )
+
+repos:
+  - repo: https://github.com/psf/black
+    rev: 24.3.0
+    hooks:
+      - id: black
+
+  - repo: https://github.com/PyCQA/isort
+    rev: 5.13.2
+    hooks:
+      - id: isort
+
+  - repo: https://github.com/PyCQA/flake8
+    rev: 7.0.0
+    hooks:
+      - id: flake8
diff --git a/.python-version b/.python-version
@@ -1 +1 @@
-3.8.10
+3.12
diff --git a/Dockerfile b/Dockerfile
@@ -1,4 +1,4 @@
-FROM python:3.8-slim-buster as base
+FROM python:3.12-slim-bullseye as base
 
 LABEL maintainer="Deep Dev dev@thedeep.io"
 

diff --git a/apps/analysis/apps.py b/apps/analysis/apps.py
@@ -2,4 +2,4 @@
 
 
 class AnalysisConfig(AppConfig):
-    name = 'analysis'
+    name = "analysis"
diff --git a/apps/analysis/dataloaders.py b/apps/analysis/dataloaders.py
@@ -1,37 +1,39 @@
-from promise import Promise
 from collections import defaultdict
 
-from django.utils.functional import cached_property
 from django.db import models
+from django.utils.functional import cached_property
+from promise import Promise
 
 from utils.graphene.dataloaders import DataLoaderWithContext, WithContextMixin
 
 from .models import (
     Analysis,
     AnalysisPillar,
     AnalysisReport,
+    AnalysisReportContainer,
+    AnalysisReportContainerData,
+    AnalysisReportSnapshot,
+    AnalysisReportUpload,
     AnalyticalStatement,
     AnalyticalStatementEntry,
     DiscardedEntry,
     TopicModelCluster,
-    AnalysisReportUpload,
-    AnalysisReportContainerData,
-    AnalysisReportContainer,
-    AnalysisReportSnapshot,
 )
 
 
 class AnalysisPublicationDatesLoader(DataLoaderWithContext):
     def batch_load_fn(self, keys):
-        qs = AnalyticalStatementEntry.objects.filter(
-            analytical_statement__analysis_pillar__analysis__in=keys,
-        ).order_by().values('analytical_statement__analysis_pillar__analysis').annotate(
-            published_on_min=models.Min('entry__lead__published_on'),
-            published_on_max=models.Max('entry__lead__published_on'),
-        ).values_list(
-            'published_on_min',
-            'published_on_max',
-            'analytical_statement__analysis_pillar__analysis'
+        qs = (
+            AnalyticalStatementEntry.objects.filter(
+                analytical_statement__analysis_pillar__analysis__in=keys,
+            )
+            .order_by()
+            .values("analytical_statement__analysis_pillar__analysis")
+            .annotate(
+                published_on_min=models.Min("entry__lead__published_on"),
+                published_on_max=models.Max("entry__lead__published_on"),
+            )
+            .values_list("published_on_min", "published_on_max", "analytical_statement__analysis_pillar__analysis")
         )
         _map = {}
         for start_date, end_date, _id in qs:
@@ -45,17 +47,13 @@ def batch_load_fn(self, keys):
 
 class AnalysisAnalyzedEntriesLoader(DataLoaderWithContext):
     def batch_load_fn(self, keys):
-        _map = Analysis.get_analyzed_entries([
-            Analysis(id=key) for key in keys
-        ])
+        _map = Analysis.get_analyzed_entries([Analysis(id=key) for key in keys])
         return Promise.resolve([_map.get(key, 0) for key in keys])
 
 
 class AnalysisAnalyzedLeadsLoader(DataLoaderWithContext):
     def batch_load_fn(self, keys):
-        _map = Analysis.get_analyzed_sources([
-            Analysis(id=key) for key in keys
-        ])
+        _map = Analysis.get_analyzed_sources([Analysis(id=key) for key in keys])
         return Promise.resolve([_map.get(key, 0) for key in keys])
 
 
@@ -88,57 +86,71 @@ def batch_load_fn(self, keys):
 
 class AnalysisPillarsAnalyzedEntriesLoader(DataLoaderWithContext):
     def batch_load_fn(self, keys):
-        qs = AnalysisPillar.objects\
-            .filter(id__in=keys)\
+        qs = (
+            AnalysisPillar.objects.filter(id__in=keys)
             .annotate(
                 dragged_entries=models.functions.Coalesce(
                     models.Subquery(
-                        AnalyticalStatement.objects.filter(
-                            analysis_pillar=models.OuterRef('pk')
-                        ).order_by().values('analysis_pillar').annotate(count=models.Count(
-                            'entries',
-                            distinct=True,
-                            filter=models.Q(entries__lead__published_on__lte=models.OuterRef('analysis__end_date'))))
-                        .values('count')[:1],
+                        AnalyticalStatement.objects.filter(analysis_pillar=models.OuterRef("pk"))
+                        .order_by()
+                        .values("analysis_pillar")
+                        .annotate(
+                            count=models.Count(
+                                "entries",
+                                distinct=True,
+                                filter=models.Q(entries__lead__published_on__lte=models.OuterRef("analysis__end_date")),
+                            )
+                        )
+                        .values("count")[:1],
                         output_field=models.IntegerField(),
-                    ), 0),
+                    ),
+                    0,
+                ),
                 discarded_entries=models.functions.Coalesce(
                     models.Subquery(
-                        DiscardedEntry.objects.filter(
-                            analysis_pillar=models.OuterRef('pk')
-                        ).order_by().values('analysis_pillar__analysis').annotate(count=models.Count(
-                            'entry',
-                            distinct=True,
-                            filter=models.Q(entry__lead__published_on__lte=models.OuterRef('analysis__end_date'))))
-                        .values('count')[:1],
+                        DiscardedEntry.objects.filter(analysis_pillar=models.OuterRef("pk"))
+                        .order_by()
+                        .values("analysis_pillar__analysis")
+                        .annotate(
+                            count=models.Count(
+                                "entry",
+                                distinct=True,
+                                filter=models.Q(entry__lead__published_on__lte=models.OuterRef("analysis__end_date")),
+                            )
+                        )
+                        .values("count")[:1],
                         output_field=models.IntegerField(),
-                    ), 0),
-                analyzed_entries=models.F('dragged_entries') + models.F('discarded_entries'),
-            ).values_list('id', 'analyzed_entries')
-        _map = {
-            _id: count
-            for _id, count in qs
-        }
+                    ),
+                    0,
+                ),
+                analyzed_entries=models.F("dragged_entries") + models.F("discarded_entries"),
+            )
+            .values_list("id", "analyzed_entries")
+        )
+        _map = {_id: count for _id, count in qs}
         return Promise.resolve([_map.get(key, 0) for key in keys])
 
 
 class AnalysisStatementAnalyzedEntriesLoader(DataLoaderWithContext):
     def batch_load_fn(self, keys):
-        qs = AnalyticalStatement.objects.filter(id__in=keys).annotate(
-            count=models.Count('entries', distinct=True)
-        ).values('id', 'count')
-        _map = {
-            _id: count
-            for _id, count in qs
-        }
+        qs = (
+            AnalyticalStatement.objects.filter(id__in=keys)
+            .annotate(count=models.Count("entries", distinct=True))
+            .values("id", "count")
+        )
+        _map = {_id: count for _id, count in qs}
         return Promise.resolve([_map.get(key, 0) for key in keys])
 
 
 class AnalysisTopicModelClusterEntryLoader(DataLoaderWithContext):
     def batch_load_fn(self, keys):
-        qs = TopicModelCluster.entries.through.objects.filter(
-            topicmodelcluster__in=keys,
-        ).select_related('entry').order_by('topicmodelcluster', 'entry_id')
+        qs = (
+            TopicModelCluster.entries.through.objects.filter(
+                topicmodelcluster__in=keys,
+            )
+            .select_related("entry")
+            .order_by("topicmodelcluster", "entry_id")
+        )
         _map = defaultdict(list)
         for cluster_entry in qs:
             _map[cluster_entry.topicmodelcluster_id].append(cluster_entry.entry)
@@ -151,10 +163,7 @@ def batch_load_fn(self, keys):
         qs = AnalysisReportUpload.objects.filter(
             id__in=keys,
         )
-        _map = {
-            item.pk: item
-            for item in qs
-        }
+        _map = {item.pk: item for item in qs}
         return Promise.resolve([_map.get(key, []) for key in keys])
 
 
@@ -173,7 +182,7 @@ class OrganizationByAnalysisReportLoader(DataLoaderWithContext):
     def batch_load_fn(self, keys):
         qs = AnalysisReport.organizations.through.objects.filter(
             analysisreport__in=keys,
-        ).select_related('organization')
+        ).select_related("organization")
         _map = defaultdict(list)
         for item in qs:
             _map[item.analysisreport_id].append(item.organization)
@@ -204,13 +213,14 @@ def batch_load_fn(self, keys):
 
 class LatestReportSnapshotByAnalysisReportLoader(DataLoaderWithContext):
     def batch_load_fn(self, keys):
-        qs = AnalysisReportSnapshot.objects.filter(
-            report__in=keys,
-        ).order_by('report_id', '-published_on').distinct('report_id')
-        _map = {
-            snapshot.report_id: snapshot
-            for snapshot in qs
-        }
+        qs = (
+            AnalysisReportSnapshot.objects.filter(
+                report__in=keys,
+            )
+            .order_by("report_id", "-published_on")
+            .distinct("report_id")
+        )
+        _map = {snapshot.report_id: snapshot for snapshot in qs}
         return Promise.resolve([_map.get(key) for key in keys])