2017-02-01から1ヶ月間の記事一覧

Keras のテキスト分類の結果をscikit learn のmetricsで評価

前回、scikit-learnの GridSearch をおさらいした。今回は、前々回のコードを修正し、同じscikit-learnのデータを使ってKeras(Tensolflowバックエンド)での標準的実装で精度を出した。精度算出のメトリックを合わせるため、scikit-learnで提供されているmetr…

pythonのscikit-learnでgrid search(テキスト分類)

scikit-learnの復習のため、グリッドサーチしてみた。 テキスト分類です。 タスク テキストのマルチクラス(20クラス)問題 方法: TFIDFのBoWでベクトル作成 線形分類問題として20クラス分類(one vs the rest) グリッドサーチのパタン TF-IDF:1-gram or 1-gr…

pythonでテキスト分類の復習

scikitlearnでテキスト分類を復習です。KerasでのDeep Learning結果との精度比較を行うためにもベース知識として、個人的な備忘録です。 参照した場所 Classification of text documents using sparse features — scikit-learn 0.18.1 documentation scikit-…