2018-01-01から1ヶ月間の記事一覧

名義特徴量と順序特徴量の話

毎日学ぶことがあるので昨日の宿題を日記に残しておく暇がなかった。相関と回帰の違い、分散と共分散の違いはなんとなく理解できたぞということだけメモしておいて、今日は「sklearnでロジスティック回帰分析をする際にカテゴリ型を数値型データに置き換える…

機械学習のためのPythonのための統計学の勉強をした

統計学の勉強経歴 なし。 平均はわかるけど偏差ってなんなんですレベル。 勉強をした理由 研修担当の先輩が「(分析について)調べた時に「分散」とかわからなかったらちょっと困ると思いますね〜」といった旨のことをつぶやいていたので。統計学歴/zeroな自…

jupyterでmatplotlibのグラフ化に躓いた

scikit-learn(サイキットラーン)とは Pythonで機械学習をするために必要なライブラリ。配列型(データフレーム型?)を使用することが可能になるPandas(パンダス)、計算に強いNumpy(ナンパイ)と組み合わせて使用する。後者二つはimport Pandas, import…

匿名であるということ

諸々の理由から技術ブログを始めるにあたって、先達に倣うべくはてブロをあれこれ眺めてみたときに、まず感じたことが匿名性の高さだった。 匿名性、というと変に分かりにくいけれども、要するに名前を明かして、あるいはなんらかの名前を表に出して、一個人…