rohaniのブログ

ゆるっと自然言語処理奴。ときどき工作系バイト。

scikit-learn Tutorial【デコ13日目】

Google Colaboratoryを使って、scikit-learn tutorialをやってみた。

An introduction to machine learning with scikit-learn

Machine learning: the problem setting

Loading an example dataset

sklearn標準のデータセットを読み込むには

  • from sklearn import datasets
    • datasets.load_iris()
    • datasets.load_digits()

Learning and predicting

grid searchとcross validationは自分で実装したことはあってもsklearn使ったことはないから試したい

  • Future work: grid search, cross validation. They are tools which are used to find good values for these parameters.
  • if you want to learn more, you should do "Recognizing hand-written digits"

Model persistence

  • joblib.dump(), joblib.load(), which are more efficient on big data