Google ColabでBiocondaをいれる

1. はじめに

遺伝子発現解析をやってみたい、と思う人にとって、先人が残してくれたオープンソースのソフトウェア、それらの使い方を綴ったブログや著作というのは非常に役に立つと思う。また、最近ではそういったものもどんどん増えてきている。そのため、以前と比べると遺伝子発現解析をするハードルはかなり下がっていると思う。

だけど、遺伝子発現解析をするためのソフトウェアの中には、お安いパソコンにはのっていないようなメモリを必要としたり、パソコンがwindowsの人には使いづらいソフトウェアもあったりする。そのため、特に若者の中には、遺伝子発現解析をちょっとはじめてみたいと思っても、環境整備にかけるお金がないよ、といって困ったり、あきらめてしまう人もいるかも知れない。

なのでここでは、新たに数十万円のパソコンを買うことなく、Google ColabとGoogle Driveを使って、遺伝子発現解析をお安く行うための環境構築と、実際に遺伝子発現解析を行う方法を何回かに分けて書いていきます。

2. 予備知識

以下の項目については、他の方が詳しく述べているので割愛。

3. 利点

・安い
 Google ColabとGoogle Driveに課金しても、月3000円いかない。ちょっと解析始めてみたいだけならパソコンを新たに買う必要はなくて、ひと月だけ課金して3000円で仕事を終えればいいと思う。

・初心者が環境構築に悪戦苦闘して、PCの重要な部分の設定を壊すことが少ない (と思う)

4. 欠点

・データのアップロード
 Google Driveにデータをアップロードして、そこから解析をしていくという流れを考えているから、機密性の高いデータを扱ってて、そもそもGoogle Driveにアップロードするのは嫌だ、という人にはむかない。 

・スペック
 大規模に解析したりするガチ勢には全然向かない。あくまではじめの一歩ですね。

5. Google Colab上にBiocondaをいれる

#minicondaインストール
%%bash
MINICONDA_INSTALLER_SCRIPT=Miniconda3-4.5.4-Linux-x86_64.sh
MINICONDA_PREFIX=/usr/local
wget https://repo.continuum.io/miniconda/$MINICONDA_INSTALLER_SCRIPT
chmod +x $MINICONDA_INSTALLER_SCRIPT
./$MINICONDA_INSTALLER_SCRIPT -b -f -p $MINICONDA_PREFIX

#condaのアップデート
!conda update -n base conda

#チャンネル追加
!conda config --add channels conda-forge
!conda config --add channels defaults
!conda config --add channels r
!conda config --add channels bioconda

伊賀泰代著「生産性」

仕事の生産性を高めるというと、どうしてもコストの削減だったり、機械の導入による業務の効率化などを思い浮かべがちだと思います。それは確かに一理あるんだけども、それだけでは、生産性を高めるということの一面しかみえていません。この本で著者は、その見落としがちな側面について、深く述べています。そもそも生産性とは、投入したリソースに対するリターンの割合である、という根本的なところからはじめて、コストの削減だけじゃなく、商品の付加価値を増加させるような改善やイノベーションが重要である、と。また、生産性の改善というのは、商品を製造する部門だけではなくて、企業のどの部門でも行われるべきものであると、著者は強調します。こうした考え方は、徐々に広まっているものの、日本の企業ではまだまだ広がりが不十分だとも言及しています。良い成果が出るのならどれだけ時間をかけても良い、のではなく、必要以上に時間がかかってしまい良い成果が出たのなら、それはまだ未熟な証拠だ、という捉えかたは非常に大事ですね。