この記事は、BioPythonのインストールに関する内容です。
生命科学・生命工学を学ぶPython初心者向けの記事となります。
本記事の内容
- BioPythonとは?
- BioPythonのシステム要件
- BioPythonのインストール
- BioPythonの動作確認
それでは、上記に沿って解説していきます。
BioPythonとは?
BioPython公式サイト
https://biopython.org/
BioPythonは、生命科学における計算を行うためのPythonライブラリとなります。
オープンソースとして開発されており、無償での利用が可能です。
機能としては、とにかくたくさんあります。
その分だけ、ドキュメントもしっかりしています。
ドキュメントを読みつつ、クラスや関数を試していけば問題ないでしょう。
以上、BioPythonについての説明でした。
次は、BioPythonのシステム要件を確認します。
BioPythonのシステム要件
現時点(2021年6月末)でのBioPythonの最新バージョンは、1.79となります。
この最新バージョンは、2021年6月4日にリリースされています。
サポートOSに関しては、以下を含むクロスプラットフォーム対応となります。
- Windows
- macOS
- Linux
基本的には、OSは問わないということです。
ただし、サポート対象となるPythonのバージョンには注意しましょう。
- Python 3.6
- Python 3.7
- Python 3.8
- Python 3.9
上記は、Pythonの公式開発サイクルに準じています。
その意味では、よく管理されているライブラリと言えます。
下記は、Pythonの公式開発サイクルです。
バージョン | リリース日 | サポート期限 |
3.6 | 2016年12月23日 | 2021年12月 |
3.7 | 2018年6月27日 | 2023年6月 |
3.8 | 2019年10月14日 | 2024年10月 |
3.9 | 2020年10月5日 | 2025年10月 |
ただ、もうPython 3.6を切り捨て始めているライブラリも存在します。
そのうち、BioPythonもPython 3.6のサポートをやめるでしょう。
そもそも、BioPythonではPython 3.9の利用を推奨しています。
それに従って、Pyhthon 3.9の利用をおススメします。
検証では、以下のバージョンを利用しています。
>python -V Python 3.9.5
WindowsでPythonのバージョンを上げるなら、次の記事が役に立ちます。
Linuxの場合は、Pythonのバージョンアップについては注意が必要です。
次の記事では、Ubuntuを例に注意すべき内容や対応方法について解説しています。
以上、BioPythonのシステム要件についての説明でした。
次は、BioPythonをインストールしていきます。
BioPythonのインストール
まずは、現状のインストール済みパッケージを確認しておきます。
>pip list Package Version ---------- ------- pip 21.1.2 setuptools 57.0.0
次にするべきことは、pipとsetuptoolsの更新です。
pipコマンドを使う場合、常に以下のコマンドを実行しておきましょう。
python -m pip install --upgrade pip setuptools
では、BioPythonのインストールです。
BioPythonのインストールは、以下のコマンドとなります。
pip install biopython
インストールは、少しだけ時間がかかります。
では、どんなパッケージがインストールされたのかを確認しましょう。
>pip list Package Version ---------- ------- biopython 1.79 numpy 1.21.0 pip 21.1.2 setuptools 57.0.0
Numpyに依存しているようです。
Numpyの最新バージョンである1.21.0は、すでにPython 3.6をサポート外としています。
このことからも、もうPython 3.6は使うべきではありませんね。
以上、BioPythonのインストールについての説明でした。
最後に、BioPythonの動作確認を行います。
BioPythonの動作確認
以下は、公式サイトで公開されているサンプルコードです。
from Bio.Seq import Seq # create a sequence object my_seq = Seq("CATGTAGACTAG") # print out some details about it print("seq %s is %i bases long" % (my_seq, len(my_seq))) print("reverse complement is %s" % my_seq.reverse_complement()) print("protein translation is %s" % my_seq.translate())
上記を実行します。
次のように表示されれば、BioPythonの動作確認は問題ありません。
seq CATGTAGACTAG is 12 bases long reverse complement is CTAGTCTACATG protein translation is HVD*
以上、BioPythonの動作確認についての説明でした。