-
Notifications
You must be signed in to change notification settings - Fork 0
20180329
percipere edited this page Mar 29, 2018
·
35 revisions
趣旨:ワークフローシステム、再現性、自動化、及びそれに関連する様々な事柄について、知見を交換したり、技術を高めるための研究会です
日程:2018年3月29日
時間:10時から19時
場所:理化学研究所、東京連絡事務所(15階) 第5会議室(以前第2会議室とアナウンスしていました。すみません。)、部屋の前に、10:00-19:00 Workflow Meetupって書いてある看板があると思います。
アクセス:東京連絡事務所・革新知能統合研究センター・医科学イノベーションハブ推進プログラムへのアクセス | 理化学研究所
- 地下鉄できたときは、1階まで行く
- 1階から6階まであがるエレベータにのる(ドラッグストアの近くのエレベータです。)
- 6階から15階まであがるエレベータにのる(会社の受付のようなところをとおりすぎ奥の方へいくとエレベータがあります、入場ゲートはとおらないです)
東京連絡事務所に入った後、第5会議室への行き方
- 入って、左手に進む。
- 広いスペースにはいるところ左手、わかりやすい位置に看板があります。
時間 | 内容 | 備考 |
---|---|---|
10:00-11:30 | 作業 | |
11:30-12:30 | 昼食 | まわりがこみそうなので、とりあえずこの時間に設定しました |
12:30-13:30 | 作業 | |
13:30-14:00 | トーク「Garuda Platform の紹介」 | |
14:00-15:00 | 作業 | |
15:00-15:30 | 中間報告、問題点共有 | |
15:30-18:00 | 作業 | |
18:00-19:00 | まとめ |
トーク「Garuda Platform の紹介」(Nikolaos Tsormanさん, システム・バイオロジー研究機構 - The Systems Biology Institute)
Garuda Platform の紹介を、開発されている方々から予定しています。
Latest Garuda Developer Pack here.
For any questions please contact Nikos Tsorman.
発表時間は 13:30 から 30-40分の予定です。
E-Cell4 の Azure Batch 活用機能を切り出したプログラムの GARUDA gadget化
- GARUDAはデスクトップアプリケーションだがE-Cell4で研究レベルのシミュレーションを行うにはローカルのPCでは無理がある
- バイオクラウドハッカソン以降E-Cell4は Azure Batchを用いて並列計算で複数回のシミュレーション結果の統計を得ることが可能になった。
- (細かいことではあるが)Azure Batchを用いる場合, ローカルPCへのE-Cell4(とその依存物)のinstallをユーザーに強いる必要も無くなる
- アノテーションパイプライン (e.g. https://twitter.com/uniprot/status/976030489252433921)
- タスクスケジューリングパイプラインの調査 (dask + luigi?)
- (抽象的な)モデルの利用に適したパイプラインの(記法の)有無の調査 (データ同化分野でこういったものがあるかも?,データサイエンスではレコメンドエンジンコンテストなどで「予測タスクのワークフロー設計」や「性能評価のためのデータ分割方法」がコツとして存在する?)
- ID Conversion ワークフローがあれば知りたい
- AWS, GCP に Azure オープンライセンス相当があるか知りたい
- 所属ラボの強み・プロジェクトとは異なりますがCytoscapeの最新動向を知りたい方のサポートはできるかもしれないです。
- ACE EditorでのCWLのシンタックスハイライトの作成
- ワークフローシステム(CWLとかNextflowなど)の紹介スライドの作成
- できたら
- Yacleの実装(CWLのGolang実装)
- Galaxyでの、CWLサポートについて可能であればサポートを広げる
- Galaxy多言語対応
- ご自身で開発中のシステムを含めて、CWLやNextflowなどワークフローシステムを使っているところや、使っている情報があれば知りたいです
- Nextflowの Kubernetes サポートについてどうやっているのかなど
- uDockerの中身、具体的な挙動
- Azure Batchや、AWS Batchなどを使ったジョブ実行方式について調べたいと思っています。dockerコンテナつかえるのかなど。
- セキュリティ関連
- 下記のシステムなど使用(開発)経験はあるので、そのあたりは応えられるかもしれません。
- Puppet, Ansible, Chef, Jenkins
- Java, Python
- Galaxy, CWL
- 各種エディタでの、言語ハイライト
- CWL で入力が SE/PE の双方に対応したツールをCWLをよしなにすることができるか
- https://github.com/pitagora-galaxy/cwl のファイルの整理
- Singularity
- 既にある CWL workflows 動くのか調査
- dockerのセキュリティ問題を本当に解決しているのか調査
- 邪悪なCWLを睨んでいた https://github.com/pitagora-galaxy/cwl/pull/3
- validation をしない、readability を上げる、という意味では inputs class: File[] とすべきだが…
- 引き続きまともな方法を探す
- singularity 試す時間なかったのでまた今度
「お名前」以降「その他」までをコピーして、 やることや興味があることなどを事前に書いておいていただけると、情報交換などがスムーズかなとおもいます。 あと、やったことや、作ったレポジトリ、画像などをはってもらえると、まとめにもなるので、助かります。
- CWL の Javascript Expression が自由すぎるので消えて欲しい
- 事前準備として、現状の JSExpression がどのように使われているのかをまとめる
- 各パターンについて代替案を考える
- CWL 以外のワークフロー記述言語での型変換や入力パラメータの validation を行う方法
- JSExpression の用途をまとめた
- 後で英語にして問題提起 & JSExpression を滅ぼしたい
- ワークフローシステムの紹介スライド作成のためのネタ出しを行った
- nextFlow の使い方
- 基本的な記述方法はexampleを見るのが一番良いか?
- Cancer Analysis Workflow variantの検出のワークフローが参考になる
- Write Once, run everywhere.
- 一手詰めtoolsとても良いかも!!
- 当日やることを書く、複数あれば複数書く
- こんなこと知りたい、調査したいということを書く。複数あれば複数書く
- なにかその他の情報など、自分が詳しい分野とか、まわりへの告知など