Skip to content

Commit

Permalink
Edit Data linkage
Browse files Browse the repository at this point in the history
  • Loading branch information
na399 committed Nov 22, 2023
1 parent ac60e18 commit d56edc3
Showing 1 changed file with 2 additions and 2 deletions.
4 changes: 2 additions & 2 deletions chapters/data-linkage.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -20,9 +20,9 @@

เนื่องจากประชากรไทยมีเลขประจำตัวประชาชนทุกคนจึงสามารถ match unique patient identifier ได้โดยตรง เมื่อข้อมูลถูกแปลงเป็นมาตรฐาน OMOP CDM แล้ว สามารถนำมาเชื่อมโยงกันได้โดยผ่านเลขประจำตัวประชาชนที่ผ่านการ hash แล้วที่เก็บใน `field person_source_value` ของ table `person` โดยจะต้องมีการเรียงลำดับเลข `person_id`, `visit_occurrence_id` และ id ใน transaction tables ต่าง ๆ ใหม่ เนื่องจากข้อมูลจาก 2 แหล่งอาจมีเลข id ที่ซ้ำกัน

ทั้งนี้ข้อมูลที่ซ้ำกันเช่น การวินิจฉัย (`condition_occurrence`) หัตถการ (`procedure_occurrence`) เป็นต้น มีการระบุแหล่งที่มาในข้อมูลที่เชื่อมไว้อยู่แล้ว จึงไม่มีปัญหาในการนำไปใช้ทำวิจัย เว้นแต่ว่า การบันทึกกิจกรรมข้างต้น มีวันที่คาดเคลื่อนกันมาก จะมีผลต่อการวิจัย จึงต้องมีการเขียนการทดสอบเพื่อรายงานความคลาดเคลื่อนเหล่านี้ไว้ด้วย
ทั้งนี้ข้อมูลที่ซ้ำกันเช่น การวินิจฉัย (`condition_occurrence`) หัตถการ (`procedure_occurrence`) เป็นต้น มีการระบุแหล่งที่มาในข้อมูลที่เชื่อมไว้อยู่แล้ว (`[condition/procedure]_type_concept_id`)จึงไม่มีปัญหาในการนำไปใช้ทำวิจัย เว้นแต่ว่า การบันทึกกิจกรรมข้างต้น มีวันที่คาดเคลื่อนกันมาก จะมีผลต่อการวิจัย จึงต้องมีการเขียนการทดสอบเพื่อรายงานความคลาดเคลื่อนเหล่านี้ไว้ด้วย

Script การเชื่อมโยงข้อมูล: [GitHub SiDataPlus/omop_linkage_dbt](https://github.com/sidataplus/omop_linkage_dbt)
Script การเชื่อมโยงข้อมูล: [GitHub sidataplus/omop_linkage_dbt](https://github.com/sidataplus/omop_linkage_dbt)

ตัวอย่าง data lineage ของการเชื่อมโยงข้อมูล

Expand Down

0 comments on commit d56edc3

Please sign in to comment.