<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=445779107733115&amp;ev=PageView&amp;noscript=1">

【徹底解説】機械学習の3つの種類やアルゴリズム・手法11選
手法を選ぶポイントも紹介

 2023.02.22  2023.09.13

機械学習は、AI技術の一つで、コンピューターがアルゴリズムを使ってデータの法則性を見つける手法です。機械学習を有効活用するためには、目的に応じた手法を選ぶことが大切です。本記事を読んでいる方の中には「機械学習にどのような種類があるのかよくわからない」という方も多いのではないでしょうか。

機械学習の3つの種類や代表的なアルゴリズム11選を解説【手法一覧】

そこで今回は、機械学習の3つの種類や、代表的なアルゴリズム11選を解説します。また、機械学習の手法の選び方についても紹介します。それぞれの種類やアルゴリズムの特徴を詳しく解説していますので、機械学習の知識がない方にもわかりやすい内容となっています。

これから機械学習をビジネスに導入したい、機械学習の手法一覧を読みたいといった際には、ぜひ本記事をご活用ください。

機械学習の種類は3つに分類される

機械学習とはAI技術の一つであり、コンピューターにデータを学習させ、データの法則性を見つける手法です。コンピューターにデータを入力し、アルゴリズムを使ってデータの持つ特徴を抽出します。そして、抽出した結果をデータとして出力します。コンピューターがデータから法則性を見つける処理を繰り返し、より精度を高めていく過程を「学習」と呼びます。機械学習は、学習結果を基にデータを分類・予測することが可能です。

機械学習の学習法の種類は、大きく分けて「教師あり学習」「教師なし学習」「強化学習」に分類されます。データ活用の目的に応じて適切な手法を選ぶことが大切です。

そもそも機械学習とは何かをわかりやすく知りたいという方は、以下の記事をぜひご覧ください。

機械学習について詳しくはこちら

機械学習の3つの種類

機械学習の3つの学習法を解説します。3つの学習法の特徴を詳しく見ていきましょう。

教師あり学習

教師あり学習は、正解データを使って学習する方法です。学習段階で、特徴や答えを表すデータが必要です。質の高いデータを学習すればするほど、特徴量が蓄積され精度が上がります。教師あり学習の目的は、「分類」と「回帰」の二つです。以下で目的の異なる二つの手法「分類」と「回帰」について解説します。

分類

分類は、データがどのグループに属するかを分類する手法です。2種類に分類することを「二値分類」、3種類以上に分類することを「多値分類」と呼びます。分類の手法の活用事例として、メールのスパム判定や製造現場の不良品検知などがあります。

回帰

回帰は、連続するデータの変化を読み、数値を予測する手法です。回帰の手法の活用事例の一つに、店舗の販売予測があります。過去の天候や曜日、商品情報などのデータを入力し、販売個数を予測します。販売個数を正確に予測できると、利益の向上や廃棄率の減少などにつながる施策の作成に役立ちます。

教師なし学習

教師なし学習は、正解がわからないデータを使ってデータの特徴を学習する方法です。整理されていないデータから構造を理解し、データに隠された傾向や法則を見つけられます。そのため、あらかじめ正解がわからなくてもデータを学習することが可能です。以下で教師なし学習の代表的な手法「クラスタリング」と「次元削減」を解説します。

クラスタリング

クラスタリングは、データをグループ分けする手法です。似たような特徴を持つデータをグループ化します。クラスタリングは、ECサイトのレコメンド機能や顧客分類などに活用されています。例えば、ロイヤル顧客限定のセールに招待する顧客を識別したいときに、顧客の直近の購買履歴や行動のデータから分類することで、対象の顧客層に的確にアプローチすることが可能です。

次元削減

次元削減は、膨大なデータから重要な部分を抽出する手法です。データの圧縮・可視化を目的としています。データの量が多いと処理に時間がかかるので、データの次元数を削減する必要があるためです。次元数とは、項目数ともいえます。データの量が少なくなれば、処理スピードが速められます。

3次元以下に次元削除を行えば、図やグラフに可視化することが可能です。そのため、複雑なデータが視覚的にわかりやすくなります。

強化学習

強化学習は、どのような行動をすれば得られる報酬が最大化できるか学習する方法です。一連の行動の結果が最も良くなるように、より適切な行動を学習していきます。試行錯誤を重ね、行動を修正しながらどんどん賢くなります。強化学習は、教師あり学習のようにあらかじめ学習するためのデータを用意する必要はありません。

強化学習は、一連の行動をまとめて学習するような一定の環境での予測に適した学習法です。行動パターンや制御を最適化することを得意とし、オセロや将棋などのゲームソフトやロボットの制御に活用されています。強化学習は、将来さらに活用の幅が広がるといわれています。

機械学習の主なアルゴリズム11選

機械学習の主なアルゴリズム11選を解説します。アルゴリズムの概要を具体的に説明しているのでぜひご覧ください。

k近傍法

k近傍法は、近い属性を持つデータを同じグループだと判断し、分類する手法です。ルールに沿って学習データを並べ、データの特徴を数値で表します。主に分類に使われるアルゴリズムの一つですが、分類と回帰のどちらにも使用できます。k近傍法は、機械学習のアルゴリズムの中でも単純でわかりやすい手法の一つです。

k近傍法の特徴として、学習データ量が多いと分類の計算に時間がかかる点が挙げられます。また、データを分類するために大量の学習データを近傍検索するため、学習データを格納するための大容量メモリが必要です。時間と大容量メモリを搭載しているコンピューターが必要なため、膨大な学習データを扱うときには不向きです。

決定木

決定木は、条件分岐によって分割し、分類する手法です。分類を行う「分類木」と回帰を行う「回帰木」の総称です。二者択一を複数組み合わせてより詳細な分類ができる構造となっています。データの不均等さを表す不純度を計算し、不純度が低くなるようにデータを最小単位まで分割します。

決定木は分類過程に階層構造の木構造を用いるため、どこで分岐されたかが理解しやすい点が特徴です。そのため、データが出力結果に至るまでの経緯を読み取りやすいです。

ランダムフォレスト

ランダムフォレストは、決定木を複数使用し、より高性能のモデルを作成する手法です。決定木の出力結果をまとめて、多数決で答えを導き出します。分割するときに特徴量をランダムに選択することで、異なる出力結果を得られます。同一の方法で決定木を作成すると同じ出力結果になるため、多数決をとる意味がありません。複数の出力結果から総合的に判断することで予測精度が高まります。ランダムフォレストは、分類と回帰のどちらにも適応します。

サポートベクターマシン(SVM)

サポートベクターマシンは、クラスを二つに分類するときに用いられる手法です。マージン最大化の考え方を用いて、分類クラスの境目である決定境界を求めます。マージン最大化とは、決定境界に最も近い点からの距離が最大になるように線を引くことです。そして、決定境界に最も近い点のことをサポートベクターといいます。それぞれのクラスのサポートベクターと決定境界の距離を計算し、区切り線を求めてどちらのクラスに属するか識別するというものです。

サポートベクターマシンは、データ量が少なくても高い精度で識別できます。分類と回帰のどちらにも使用でき、広く応用されています。

ロジスティック回帰

ロジスティック回帰は、名前に「回帰」とつきますが、分類問題に用いられる手法です。複数の変数を使ってある事象が発生する確率を計算します。ロジスティック回帰は、主に二値分類に使用されるアルゴリズムですが、多項分類に使用することが可能です。

二値分類の場合は、データを「ある事象が起こる」「ある事象が起こらない」のそれぞれのクラスに属する確率を計算し、二つに分類します。分析結果の決定境界は50%で、確率が50%以上なら「ある事象が起こる」、確率が50%以下なら「ある事象が起こらない」に分類します。

ナイーブベイズ

ナイーブベイズは、データが特定のカテゴリに属する確率を計算し、最も高い確率になるカテゴリに分類する手法です。スパムメールのフィルターや文章の分類など自然言語の分類に活用されています。「文章が出現する確率」「文章から特定の単語が出現する確率」の二つの確率を求め、その結果を比較して確率が最大になるカテゴリに分類します。ナイーブベイズは、高速に計算できるかつ大規模なデータにも対応できる点が特徴です。

線形回帰

線形回帰は、データの数式から直線を求め、説明変数に基づいて目的変数を予測する手法です。説明変数とは要因となる数値、目的変数とは結果となる数値を指します。説明変数と説明変数の関係性を線形関数で表し、最小二乗法を用いて計算します。線形回帰は、機械学習のアルゴリズムの中でもわかりやすい基本的な手法の一つです。説明変数が一つの分析モデルを単回帰分析、説明変数が二つ以上の分析モデルを重回帰分析とも呼びます。

ニューラルネットワーク

ニューラルネットワークは、入力層と出力層の間に中間層を挟み、より複雑な決定境界を求める手法です。入力層はデータを入力する層、中間層は計算を行う層、出力層は結果を出力する層です。中間層は、隠れ層とも呼びます。ニューラルネットワークは、神経細胞ニューロンのつながりからヒントを得て、人間の脳の働きを再現したものです。分類と回帰のどちらにも適応します。ニューラルネットワークを多層化したものが、ディープラーニングです。

k平均法(k-means)

k平均法は、単純でわかりやすい、クラスタリングの代表的な手法です。似たような特徴を持つデータ同士を同じグループに分けます。グループ数を指定し、各データをランダムにグループを割り当て、各グループの中心点を計算します。さらに、各データの中心点からの距離を求めます。そして、各データを中心点が最も近いグループに再割り当てし、再度中心点を計算する仕組みです。

k平均法は、データをランダムに割り当て中心点を計算するため、中心点同士の距離が近いとうまく分類できないところが欠点といえます。

主成分分析

主成分分析は、次元削減の一つで、データの次元数を減らすために用いられる手法です。データの情報を要約し、なるべく特徴を損なわずに、データを少ない次元数で表します。主成分分析は、大量の変数間の関係性を調べるのに有用です。通常は大量の変数を分析すると、膨大な時間がかかるところを効率的に調べられます。3次元以下に次元を削減できれば、データをグラフ化することも可能です。データの傾向が直感的に表せされ、データの関係性を考察しやすくなります。

GAN(敵対的生成ネットワーク)

GANは、データから特徴を学習して、新たに擬似データを生成する手法です。Generator(生成)とDiscriminator(識別)の二つのニューラルネットワークを競わせ、精度を高めていきます。生成する機能の精度が高まると、それを識別する機能の精度も高くなる仕組みです。GANの活用で、低画質の画像から高画質の画像、テキストから画像、テキストから音声というように、さまざまなデータを生成できます。

機械学習の手法を選ぶときの3つのポイント

機械学習を有効活用するためには、目的に応じて適切な手法を選ぶことが大切です。機械学習の手法を選ぶときの3つのポイントを解説します。ぜひご参考になさってください。

精度の高さ

機械学習の手法を選ぶときに最も重要なのは、予測精度の高さです。予測結果と実際の結果の差が少ないほど予測精度が高いといえます。予測精度が高い手法は以下の通りです。

  • ランダムフォレスト
  • サポートベクターマシン(SVM)
  • ニューラルネットワーク

なお、予測精度が高い手法は、計算に時間がかかる点がデメリットとなることを留意しておきましょう。

利用目的

機械学習の利用目的に応じて、それぞれのタスクを得意とする手法を選ぶことも重要です。手法を検討するときはまずデータ活用の目的を明確にするとよいでしょう。どの手法を選べば利用目的を達成する出力結果が得られるかをよく理解する必要があります。機械学習が行えるタスクの例として、以下が挙げられます。

  • データをいくつかに分類する
  • 将来の数値を予測する
  • 正解データなしでいくつかのグループにまとめる
  • 大量のデータから重要なデータを抽出する

計算にかかる時間

機械学習の用途によっては、計算にかかる時間も大切なポイントです。データ量が多ければ計算時間も長くなります。短い時間で出力結果が出るのはよいことです。早く出力結果が出れば、素早くデータの全体像を把握できるためです。データが示した結果を基に考察し、すぐに改善に向けた行動が取れます。

どのくらい時間を確保できるかや、誤った出力結果が出たときに対応可能なスケジュールかを考慮して検討するとよいでしょう。計算にかかる時間が短い手法は以下の通りです。

  • ナイーブベイズ

機械学習の種類や性質を理解しよう

機械学習の学習法は、3種類に分けられます。それぞれの学習法には、さまざまなアルゴリズムがあります。各手法の特徴を理解することが、機械学習を有効活用するための近道です。

株式会社電算システムでは、技術コンサルサービスをご提供いたします。潜在的な課題の発掘や開発環境等のヒアリングを行い、最適なプランをご提案いたします。ビジネスに機械学習を活用したいとお考えの方に向けて、機械学習についてまとめた資料をご用意しております。機械学習の概要や種類、導入・運用における重要なポイントがわかります。ぜひご覧ください。

Google Cloudと 機械学習

RELATED POST関連記事


RECENT POST「Google Cloud(GCP)」の最新記事


Google Cloud(GCP)

機械学習とは?一般的な手法や活用事例を徹底解説!

Google Cloud(GCP)

これだけは知っておきたい!機械学習のアルゴリズム10選

Google Cloud(GCP)

機械学習と深層学習の違いとは?メリットや課題を挙げながら解説

Google Cloud(GCP)

強化学習とは最適な行動を探す学習方法!仕組みや活用事例5選をわかりやすく解説

【徹底解説】機械学習の3つの種類やアルゴ リズム・手法11選丨手法を選ぶポイントも紹介