Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

P66 ./010_download-ucsc.sh 内のコマンドの誤植について #24

Open
shouya00025 opened this issue Mar 5, 2021 · 6 comments
Open
Assignees

Comments

@shouya00025
Copy link

shouya00025 commented Mar 5, 2021

突然のご連絡失礼します
P66 ./010_download-ucsc.sh 内のコマンドに置きまして、コマンドが
u1="ftp://hgdownload.soe.ucsc.edu"
となっていたのですが、正しくは
u1="https://hgdownload.soe.ucsc.edu"
だと思われます。私の場合、初期の状態ではhg38参照ゲノムがダウンロードされなく、上記のようにコマンドを変えることでダウンロードできるようになりました。
私のコンピュータ(MacBook Pro m1チップ搭載モデル)のみでの誤作動ならよいのですが、他の方にも支障あると思い連絡させていただきました。
ご確認のほど何卒よろしくお願いします。

@misshie misshie self-assigned this Mar 5, 2021
@NakanoTakato
Copy link

失礼します。同様のエラーがこちらでも発生しておりますので、コメントさせていただきます。
以下、エラー内容の詳細です。

Mac Version 11.2.3
カレントディレクトリ /Users/ユーザー名/Analysis/ngsdat2-master/DiseaseGenomeMain

less 010_download-ucsc.sh のコマンドまでは、問題なく動いています。
./010_download-ucsc.sh のコマンドを実行すると、
curl: (7) Failed to connect to hgdownload.soe.ucsc.edu port 21: Operation timed out
tar: Error opening archive: Failed to open 'hg38.analysisSet.chroms.tar.gz'
~/Analysis/ngsdat2-master/DiseaseGenomeMain
という内容のエラーが発生します。

ダウンロードしたいファイルに接続できず、タイムアウトになると解釈しましたので、shouya00025 様がURLを変更することで(正しくファイルに接続できるようになり、)問題を解決したというのは頷けます。(USCSのサイト側がURLを変更したのではないかと考えております。)
ただ、ftpをhttpsに変更して、必要なデータが正しくダウンロードできて、その先のコマンド等に影響が出ないかを懸念しているため、まだhttpsに変更してコマンドの実行までには至っておりません。その辺りのコメントをいただけると非常にうれしいです。

@shouya00025
Copy link
Author

その後のコマンド等には特には影響はなかったです。
この部分についてはおそらくこのコマンドが正しいと個人的には感じました。

@NakanoTakato
Copy link

ありがとうございます。
とりあえず、010_download-ucsc.shのftpをhttpsに変更して先に進めてみることにしました。ここでは問題なく実行できたように思います。
ですが、030_download-dra.shで同じエラーが発生しました。(curl: (7) Failed to connect to ftp.ddbj.nig.ac.jp port 21: Operation timed out)
ここでもcurl でftpに接続しようとして失敗するので、そのあたりに原因がありそうな気がします。(曖昧ですみません。。。)
先人の方達が問題なく010_download-ucsc.shや030_download-dra.shを使えているところを見ると、誤植ではなく、こちら側に問題がありそうな気がします。
また今回は030_download-dra.shのftpをhttpsに変更しても問題が解決されませんでした。
解決方法を見つけ次第ここにコメントを残そうと思います。

@shouya00025
Copy link
Author

個人的にもその点について気になり軽くではあるのですが検索をかけてみたのですが、もしかすると個人的にインストールしたウイルス対策ソフトに問題があるのかもと思いました。
ただ、データ管理やウイルスに関してどうしてそのウイルス対策ソフトをアンインストール又、無効化することはできないのでそのソフトが原因であるのかは確認できておりません。参考までに、私の考えを述べさせたいただきました。
その他、我々の不具合の原因になりうる要因が分かりましたらご教授頂けたら幸いです。
何卒よろしくお願いいたします。

@NakanoTakato
Copy link

ご返信ありがとうございます。
僕もウイルス対策ソフトやファイアウォールがftpを妨げている可能性があるのかと思い、ファイアウォールを解除して実行したりしたのですがそれでもうまくいきませんでした。

ただ、前回のコメントで『今回は030_download-dra.shのftpをhttpsに変更しても問題が解決されませんでした。』と書いたのですが、これは単純に僕の打ち間違いでして、
site="ftp://ftp.ddbj.nig.ac.jp"

site="https://ddbj.nig.ac.jp"
に変更すれば、無事にsraファイルをダウンロードすることはできました。
根本的な解決にはなっていませんが、とりあえずこれで進めていこうと思っています。
ご教授ありがとうございました。

@knakamura6222053
Copy link

突然のご連絡失礼いたします。
p66 ./010_download-ucsc.sh
を実行したのですが、以下のエラーが出ました。
curl: (28) Failed to connect to hgdownload.soe.ucsc.edu port 21 after 75011 ms: Operation timed out
tar: Error opening archive: Failed to open 'hg38.analysisSet.chroms.tar.gz'

上記のように、u1="https://hgdownload.soe.ucsc.edu/"
スクリプトを変更したのですが、上手くいきません。
ご教授していただけると幸いです。
宜しくお願い致します。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants