機械学習・自然言語処理の勉強メモ

学んだことのメモやまとめ

2017-11-16から1日間の記事一覧

matplotlibのscatter(散布図)

散布図を作るときは、scatterが便利。分類やクラスタリングを視覚化する場合、 ラベルの出力値に応じて自動で色分けしてくれる。以下のようにcにラベルを指定するだけ plt.scatter(x[:, 0], x[:, 1], c=crf.labels_) すると、こんな風に色分けしてくれる。

matplotlibの色指定

忘れがちなのでメモ。主要な色については 1 文字で指定可能b:青 (Blue) g:緑 (Green) r:赤 (Red) c:シアン (Cyan) m:マゼンタ (Magenta) y:黄 (Yellow) k:黒 (Black) w:白 (White)出力イメージ 尚、これらの情報はこちらを参考にさせて頂いた。(ほ…

gensimでLSI(潜在的意味解析)

コーパスと辞書を用いて潜在的意味解析を行う。 *文書のベクトル化(次元圧縮) 文書セットから辞書を作成する。 不用語を取り除く BoW表現に変換 from gensim import corpora dic = corpora.Dictionary(documents) dic.filter_extremes(no_below=20, no_ab…

MeCabの基本操作

形態素解析エンジン。 言語, 辞書,コーパスに依存しない汎用的な設計が基本方針。 コスト推定はコーパスから学習する。 *与えられた文章を分割できるすべてのパターンに分割し、その中で計算したコストがもっとも小さい分割結果を採用。 とりあえず解析 MeC…