|
2005.02.23
|
|
多次元サポートベクターマシンによる遺伝子発現データの可視化技術
DNAマイクロアレイから得られる遺伝子発現プロファイルは非常に高次元なデータであるため、従来は主成分分析などの次元削減手法によって可視化が行われていました。しかし、従来の手法は、データに関する事前情報を全く利用しないため、癌組織-正常組織間の発現プロファイル比較など、二群間比較を行う際には、最適な可視化になるとは限りません。
河村らは、機械学習の分野で用いられているSupport Vector Machines (SVM)を多次元に拡張した多次元サポートベクターマシン(Multidimensional SVM, MD-SVM)を提案しました。MD-SVMはデータに関する事前情報を利用することで、二群を鮮明に分ける軸を複数抽出し、二群間比較に最適な可視化を実現します。肺ガン組織及び正常肺組織から得られた発現プロファイルに適用し、主成分分析に比べ二つの群が鮮明に分かれていること、また、肺ガン組織のサンプル中に存在する異常サンプルがより容易に検出できることを確認しました。
Komura D, Nakamura H, Tsutsumi S, Aburatani H, Ihara S.
Multidimensional support vector machines for visualization of gene expression data.Bioinformatics. 2005 Feb 15;21(4):439-44
PubMed
|
|