小澤昌樹氏のデータ分析コラム
-

第29回「スクレイピング(1)」
こんにちは、小澤です。これまで、AutoMLツールやPythonによる機械学習のライブラリをいくつか紹介してきました。しかし、どんなに高度な分析手法があっても、そもそも「データがなければ何も始まらない」という現実があります。新しい価値を生み出すには、企業や組織が保持している内部データだけで…
-

第28回「近ごろの機械学習ライブラリ(5)mlxtend」
こんにちは、小澤です。これまで、auto-sklearn、H2O AutoML、PyCaretといったAutoML(自動機械学習)ツール を紹介してきました。いずれも、プログラミングに不慣れな人でも機械学習を活用できるように設計されたツールで、AI導入のハードルを大きく下げてくれる存在です…
-

第27回「近ごろの機械学習ライブラリ(4)PyCaret」
こんにちは、小澤です。前回は、auto-sklearn や H2O AutoML などの AutoML(自動機械学習)ツール を紹介しました。今回は、もうひとつ、注目すべきAutoMLライブラリである PyCaret(パイキャレット)を紹介します。PyCaretは「簡単・高速・実用…
-

第26回「近ごろの機械学習ライブラリ(3)Auto-sklearn、H2O AutoML」
こんにちは、小澤です。前回は、PyTorch(パイトーチ) を使ってニューラルネットワークを構築する基本的な流れを体験しました。「モデルを自分で組む楽しさ」を感じられる内容でしたが、「もっと簡単にモデルを作れないか」と思った方もいるかもしれません。そこで、今回紹介するのがAutoMLという…
-

第25回「近ごろの機械学習ライブラリ(2)PyTorch」
こんにちは、小澤です。前回は、Googleの機械学習ライブラリTensorFlow / Kerasを使って、シンプルなニューラルネットワークの作り方をご紹介しました。Keras の手軽さで、深層学習の入り口としてはかなり取り組みやすいということが伝わったかと思います。今回は、もう一…
-

第24回「近ごろの機械学習ライブラリ(1)TensorFlow/Keras」
こんにちは、小澤です。これまで、scikit-learnを中心に、分類・回帰・クラスタリングなど、機械学習の基本的な手法を紹介してきました。scikit-learnはシンプルな構文で高機能な機械学習を実現できる便利なライブラリであり、機械学習の第一歩として最適です。さらに、より高度…
-

第23回「scikit-learnの使い方(9)クラスタリング」
こんにちは、小澤です。これまでに見てきた「分類」や「回帰」は、あらかじめ正解ラベルが与えられているデータを用いて学習を行う「教師あり学習」に分類されるものでした。一方で、「教師なし学習」は、正解ラベルのないデータからパターンや構造を見つけ出す手法を指します。その中でも特に代表的な手…
-

第22回「scikit-learnの使い方(8)モデルの評価」
こんにちは、小澤です。今回は、分類モデルの評価指標の中でも特に重要な「カテゴリごとの分類精度」「予測確率の正確さ」、そして「混同行列の可視化と分析」について解説していきます。単に「正解率が何%」というだけでは、分類モデルの性能は十分に評価できません。各カテゴリに対してどの程度正確か…
-

第21回「scikit-learnの使い方(7)次元削減」
こんにちは、小澤です。今回は、データ分析において重要な技術である次元削減について解説していきます。次元削減とは、データの構造を整理し、より少ない情報で本質を捉えるための手法です。大量の特徴量を持つデータを効率よく扱うために欠かせない技術であり、回帰や分類といった機械学習モデルの精度向上にも…
-

第20回「scikit-learnの使い方(6)回帰」
こんにちは、小澤です。今回は、機械学習で基本として取り上げられる「回帰(Regression)」について解説していきます。回帰は連続的な数値を予測するための手法で、分類と並び、あらゆる分野で広く使われています。特に、数値予測を行う基本技術として、機械学習の中でも最も実用的な手法といえます。…
