Skip to content

Latest commit

 

History

History
125 lines (101 loc) · 7.64 KB

readme.md

File metadata and controls

125 lines (101 loc) · 7.64 KB

Giai đoạn 4

Toàn bộ code để trích xuất dữ liệu từ file tif, train model, sinh map nằm trong thư mục PythonCode

  1. genmap.py - Code chạy model và sinh map
  2. getPixels.py - Code lấy các pixel và các tham số trong ảnh địa hình (ảnh tif)
  3. get_split_data.py - Code chia data ra ở file data.csv ra 2 tập test và train
  4. LogisticRegression.py - Code thử nghiệm model LogisticRegression
  5. NaiveBayes.py - Code thử nghiệm model NaiveBayes
  6. RandomForestModel.py - Code thử nghiệm model RandomForestModel
  7. StandardizedCSV.py - Code thử nghiệm model StandardizedCSV

Sau khi thử nghiệm, đã chọn ra các tham số phù hợp nhất cho từng model. 4 file tif ở trong thư mục MyGenmap là kết quả thu được cho từng model với tham số được chọn sau thử nghiệm.

Giai đoạn 3

Những việc cần làm

  • Tải ảnh bản đồ lớp phủ, cắt theo shapefile của ĐBSH, tách ra các phân lớp (em Long)
  • Hợp nhất các polygon trong cùng phân lớp (em Long)
  • Tính toán số điểm lấy mẫu và lấy mẫu ngẫu nhiên cho mỗi phân lớp (em Long)
  • Hiển thị điểm ngẫu nhiên trên Google earth pro (xem tiếp phía dưới sẽ có phần phân công từng file cho mỗi người), kiểm tra xem điểm đã ở đúng vị trí được mô tả hay chưa, nếu chưa thì: (các thành viên còn lại trong nhóm)
    • Kéo thả điểm vào đúng khu vực khớp với mô tả ở gần với nó (cứ tìm xung quanh đó có vùng nào khớp với mô tả không)
    • Hoặc xóa nếu như không có khu vực khớp với mô tả ở gần (cái này cực kỳ hạn chế, chỉ làm khi không tìm được)
  • Xuất dữ liệu sau khi chỉnh sửa ra file .kmz (các thành viên còn lại trong nhóm)
  • Chuyển file kmz thành file .tif bằng Arcmap (các thành viên còn lại trong nhóm)
  • Chuyển hệ quy chiếu của file .tif sang hệ UTM 48N (các thành viên còn lại trong nhóm)
  • Xuất dữ liệu các điểm trong file .tif ra excel (phải xuất được tọa độ, gán nhãn cho cho điểm (danh mục các nhãn ở dưới)) (các thành viên còn lại trong nhóm)
  • Tổng hợp các file excel (em Long)
  • Tính toán các điểm nằm ở ô nào trong ma trận của từng band (em Long)
  • Tính toán các chỉ số NDVI, NDWI cho từng điểm (em Long)
  • Viết báo cáo (em Long)
  • Dead line việc của những thành viên còn lại trong nhóm (trừ em Long) đến 21h chiều thứ 5 (04/11/2021)
  • Nếu có gì không hiểu hoặc khó khăn thì lập tức hỏi em

Thông tin trong các loại phân lớp trong map VLUCD - nhãn của các phân lớp là từ được viết sau dấu gạch ngang (-)

  1. Phân lớp 1, 2: đất ở (residential land) - resident
  2. Phân lớp 3: đồng lúa (rice paddies) - rice
  3. Phân lớp 4, 5, 6: đất trồng trọt (croplands) - crop
  4. Phân lớp 7: đồng cỏ (grassland) - grass
  5. Phân lớp 8: đất cằn cỗi (barren land) - barren
  6. Phân lớp 9: bụi rậm (scrub/shrub) - scrub
  7. Phân lớp 10, 11, 12, 14, 20: rừng (forest) - forest
  8. Phân lớp 15: vùng đất trũng, ẩm ướt (wetland) - wet - cái này không cần quan tâm, do chả có pixel nào của nó trong bản đồ cả
  9. Phân lớp 18: vùng nước bỏ trống (open water) - water
  10. Phân lớp 19: vùng nước nuôi trồng thủy sản (aquaculture) - aqua

Sử dụng 2000 mẫu, minval: 75

  1. resident: 199
  2. rice: 424
  3. crop: 425
  4. grass: 96
  5. barren: 86
  6. scrub: 75
  7. forest: 445
  8. wet: 0
  9. water: 150
  10. aqua: 100

Các file shapefile để sử dụng trong GoogleEarth nằm ở thư mục DATA/GEarthSample

  1. resident: 199 (anh Long)
  2. rice1: 400 (anh Dương)
  3. rice2: 24 (anh Long)
  4. crop1: 400 (anh Khánh)
  5. crop2: 25 (anh Long)
  6. grass: 96 (Minh)
  7. barren: 86 (Minh)
  8. scrub: 75 (Minh)
  9. forest1: 400 (Lương Đạt)
  10. forest2: 45 (Minh)
  11. water: 150 (anh Long)
  12. aqua: 100 (Minh)

Giai đoạn 2

Video buổi họp tuần 2

Thống nhất là toàn bộ data (ngoại trừ data tải về từ GEE) sẽ dùng hệ quy chiếu UTM

Bảng hệ quy chiếu UTM và code của nó (cái này cho vui thôi, thêm vào báo cáo cũng hay)

Các việc cần làm tuần 2

  • Cài đặt Python, gdal, numpy
  • Đọc file ảnh vệ tinh đã được tải về, đổi hệ quy chiếu sang UTM
  • Thống kê (max, min, median, mean, std) cho từng band
  • Tính toán các chỉ số NDVI, NDWI dựa trên 3 band Red (band 1), Green (band 4), NIR (band 2)
  • Xuất bản đồ NDVI, NDWI dưới dạng tif
  • Hiển thị bản đồ trên arcmap
  • Phân chia công việc
  • Viết báo cáo tuần 2

Hướng dẫn cài đặt python 3.10

  1. Vào link và chọn Download Python 3.10.0 để tải file cài đặt python về
  2. Mở bộ cài đặt được tài về, tiến hành cài đặt, nhớ tích chọn cài đặt PATH để có thể dùng được python trên cmd, terminal

Hướng dẫn cài đặt gdal

  1. Nhớ cài đặt python trước đó

  2. Vào link

    1. Tải GDAL‑3.3.2‑cp310‑cp310‑win_amd64.whl dành cho python 3.10, win 64 bit
    2. Tải GDAL‑3.3.2‑cp310‑cp310‑win32.whl dành cho python 3.10, win 32 bit
    3. Không khuyến khích dùng các phiên bản khác nhằm mục đích đồng bộ
  3. Tại nơi tải về, mở cmd lên, nhập lệnh sau để cài đặt vào python:

    python -m pip install GDAL (ấn thêm phím tab 1 lần để tự động nhảy ra đúng tên file vừa tải về)

Để code được như code demo của thầy ở buổi 2

Để sử dụng được hàm ReadAsArray(), phải cài đặt thêm numpy, gõ lệnh sau trong cmd hoặc terminal ở đâu cũng được:

python -m pip install numpy

Các code mẫu để xử lý ảnh (trong drive của thầy cũng có):

https://pcjericks.github.io/py-gdalogr-cookbook/raster_layers.html

Xử lý ảnh:

Các ảnh tải xuống từ GEE đang dùng hệ quy chiếu cầu, cần chuyển sang hệ quy chiếu UTM. Cái này không cần code, sử dụng tool Project Raster trong ArcMap là được.

Giai đoạn 1