Let’s read the document "sklearn.tree.DecisionTreeClassifier"

scikit-learn.org

  • Click the [https://github.com/scikit-learn/scikit-learn/blob/42aff4e2e/sklearn/tree/_classes.py#L607:title=\[source\]] and check that the information in the website is provided in the source. ソースコードを見てみよう
    • The source file contains "python commands" and the information to be provided in the website and with help() function.
    • ソースファイルには、いわゆるパイソンのコマンドがあり、それ以外に、ウェブサイトに現れたりhelp()関数で呼び出したりする情報が書かれていることが解る
  • What to know about 知っておくとよいこと
    • "Parameters" パラメタ(引数)
      • Parameters determine the conditions of "learning procedure" of the object you make.
      • パラメタは学習をするために作成したオブジェクトに、学習をするときの条件を与える
    • "Attributes" 属性
      • The python object to perform "learning" should have various information it needs to run and it generates during the run and information you want to know or to take out.
      • 属性は、学習を実行する際に必要な情報や、学習をさせた後で保持しておくべき、情報としてオブジェクトに付属してストックされる。属性は呼び出せる
    • "Methods" メソッド・関数
      • Methods are functions you can use with the object.
      • 学習用に作成したオブジェクトから使える関数のこと
      • The functions to perform the "learning" procedure itself are included.
      • 学習を実施するには、入力を取っていろいろなことをしないいけないが、そのするべきことが関数として指定されている。その関数が含まれる
      • Also the functions useful to process the inputs and outputs so that the users feel comfortable to use the object.
      • その他に、学習の入出をいじったり加工したりできると便利なので、便利関数がオブジェクトから呼び出せるようになっている
  • Python commands
    • Show parameters and attributes (splitter is a parameter. max_features_ is an attribute)
    • パラメタと属性を表示させてみる
clf.splitter
clf.max_features_
    • Another way to get the value of parameters/attributes
getattr(clf,"max_features_")
getattr(clf,"splitter")
    • Use a function in Methods. メソッド登録されている関数を使ってみる
      • Learn and generate a model
clf.fit(X,y)
      • Use the generated model
clf.predict(X)
  • ipynb

github.com