Google ColabでBiocondaをいれる

1. はじめに

遺伝子発現解析をやってみたい、と思う人にとって、先人が残してくれたオープンソースのソフトウェア、それらの使い方を綴ったブログや著作というのは非常に役に立つと思う。また、最近ではそういったものもどんどん増えてきている。そのため、以前と比べると遺伝子発現解析をするハードルはかなり下がっていると思う。

だけど、遺伝子発現解析をするためのソフトウェアの中には、お安いパソコンにはのっていないようなメモリを必要としたり、パソコンがwindowsの人には使いづらいソフトウェアもあったりする。そのため、特に若者の中には、遺伝子発現解析をちょっとはじめてみたいと思っても、環境整備にかけるお金がないよ、といって困ったり、あきらめてしまう人もいるかも知れない。

なのでここでは、新たに数十万円のパソコンを買うことなく、Google ColabとGoogle Driveを使って、遺伝子発現解析をお安く行うための環境構築と、実際に遺伝子発現解析を行う方法を何回かに分けて書いていきます。

2. 予備知識

以下の項目については、他の方が詳しく述べているので割愛。

3. 利点

・安い
 Google ColabとGoogle Driveに課金しても、月3000円いかない。ちょっと解析始めてみたいだけならパソコンを新たに買う必要はなくて、ひと月だけ課金して3000円で仕事を終えればいいと思う。

・初心者が環境構築に悪戦苦闘して、PCの重要な部分の設定を壊すことが少ない (と思う)

4. 欠点

・データのアップロード
 Google Driveにデータをアップロードして、そこから解析をしていくという流れを考えているから、機密性の高いデータを扱ってて、そもそもGoogle Driveにアップロードするのは嫌だ、という人にはむかない。 

・スペック
 大規模に解析したりするガチ勢には全然向かない。あくまではじめの一歩ですね。

5. Google Colab上にBiocondaをいれる

#minicondaインストール
%%bash
MINICONDA_INSTALLER_SCRIPT=Miniconda3-4.5.4-Linux-x86_64.sh
MINICONDA_PREFIX=/usr/local
wget https://repo.continuum.io/miniconda/$MINICONDA_INSTALLER_SCRIPT
chmod +x $MINICONDA_INSTALLER_SCRIPT
./$MINICONDA_INSTALLER_SCRIPT -b -f -p $MINICONDA_PREFIX

#condaのアップデート
!conda update -n base conda

#チャンネル追加
!conda config --add channels conda-forge
!conda config --add channels defaults
!conda config --add channels r
!conda config --add channels bioconda