Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

080_download-gatk-bundlesのバリエーションデータについて #29

Open
nakane-scc opened this issue Apr 22, 2021 · 3 comments
Open
Assignees

Comments

@nakane-scc
Copy link

080_download-gatk-bundles.shを見ると、ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/hg38からデータファイルをDLするようですが、サイトにアクセスできません。

下記サイトを見ると、Grch38/hg38 referenceはGoogleクラウドに移されたように思えます。
https://gatk.broadinstitute.org/hc/en-us/articles/360035890811-Resource-bundle

そこで、サイトにアクセスしてみたところ、
Mills_and_1000G_gold_standard.indels.hg38.vcf.gz
Mills_and_1000G_gold_standard.indels.hg38.vcf.gz.tbi
はあったのですが、次の2つのファイルが見つかりません。
dbsnp_146.hg38.vcf.gz
dbsnp_146.hg38.vcf.gz.tbi

ご確認と対応方法をご教授いただければ幸いです。

@misshie
Copy link
Owner

misshie commented Apr 27, 2021

まず、issueへの対応が大幅に遅くなっていることをお詫びします。順次すすめていきます。また、お返事・対応の順番が前後することをお許し下さい。

p71の080_download-gatk-bundles.sh の件について。

いろいろパブリックデータの場所が変化することもあり、完全に対応がむずかしくなっています。とくにGATK関連は体制がかわるごとに変化が激しいようです。

提示戴いたGATKのページ中程にある”Owned by the Broad Institute"以下のリンク gcp-public-data--broad-references に行きますと、hg38/v0ディレクトリ以下にHomo_sapiens_assembly38.dbsnp138.vcf.gz *.tbiファイルがあります。dbSNPのバージョンは下がってしまいますが、これで代用できないでしょうか?

実際にはお手元のコンピューターへのダウンロードど、スクリプト内のファイル名の書き換えが必要になると思います。

@misshie misshie self-assigned this Apr 27, 2021
@nakane-scc
Copy link
Author

回答ありがとうございます。

アドバイスいただきました通り、Homo_sapiens_assembly38.dbsnp138.vcf.gzをDLし、090を実行した後、#19の質問に対する回答にあったように、gatk-4.1.2.0をDLしなおして100を実行いたしました。
ところが、#19の方と同じエラーが出て、処理が進みません。
ご多用とは存じますが、アドバイスをいただければ幸いです。

Exception in thread "main" java.lang.IncompatibleClassChangeError: Inconsistent constant pool data in classfile for class org/broadinstitute/hellbender/transformers/ReadTransformer. Method 'org.broadinstitute.hellbender.utils.read.GATKRead lambda$identity$d67512bf$1(org.broadinstitute.hellbender.utils.read.GATKRead)' at index 65 is CONSTANT_MethodRef and should be CONSTANT_InterfaceMethodRef
at org.broadinstitute.hellbender.transformers.ReadTransformer.identity(ReadTransformer.java:30)
at org.broadinstitute.hellbender.engine.GATKTool.makePreReadFilterTransformer(GATKTool.java:345)
at org.broadinstitute.hellbender.engine.GATKTool.getTransformedReadStream(GATKTool.java:374)
at org.broadinstitute.hellbender.engine.ReadWalker.traverse(ReadWalker.java:93)
at org.broadinstitute.hellbender.engine.GATKTool.doWork(GATKTool.java:1039)
at org.broadinstitute.hellbender.cmdline.CommandLineProgram.runTool(CommandLineProgram.java:139)
at org.broadinstitute.hellbender.cmdline.CommandLineProgram.instanceMainPostParseArgs(CommandLineProgram.java:191)
at org.broadinstitute.hellbender.cmdline.CommandLineProgram.instanceMain(CommandLineProgram.java:210)
at org.broadinstitute.hellbender.Main.runCommandLineProgram(Main.java:162)
at org.broadinstitute.hellbender.Main.mainEntry(Main.java:205)
at org.broadinstitute.hellbender.Main.main(Main.java:291)

@nakane-scc
Copy link
Author

gatk-4.1.2.0をgatk-4.2.0.0にしたら、動き始めました。これで様子を見てみたいと思います。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants