L’algoritmo Kfinger si pone l’obiettivo del calcolo degli Overlap tra lunghe reads genomiche, compito fondamentale, ad esempio, per costruire l’overlap graph. La tecnica proposta utilizza le fattorizzazioni di Lyndon. E’ ben noto che la fattorizzazione di Lyndon di una stringa è una sequenza non crescente di fattori, che sono parole di Lyndon. Tale fattorizzazione è unica e può essere calcolata in tempo lineare. Viene utilizzata una rappresentazione delle reads come sequenza di interi, precisamente data dalla lunghezza delle parole di Lyndon che compongono la fattorizzazione della read (Lyndon Fingerprints). E’ stato dimostrato in che due stringhe che condividono un overlap comune, condividono anche un insieme di fattori consecutivi nella loro fattorizzazione. Quindi, in viene mostrato come individuare regioni comuni tra reads, utilizzando queste k-uple di interi (chiamate k-fingers o k-mers). Qui proponiamo una versione in C più efficiente di quella proposta originariamente in Python
-
Notifications
You must be signed in to change notification settings - Fork 0
Tonin-ai/pattern-matching-2
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
No description, website, or topics provided.
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published