卒論・修論tips

デザイン TeX

この記事は何？卒論・修論を書き始めるときに知っておくと良い知識を研究室内でまとめていたのですが，恐らく研究室外の方々にも役に立つのではないかと思い公開してみます．基本的にTeXを使った理系の卒論・修論を想定しています，分野毎に作法が異なる点…

2017-01-16

スケーリングは訓練データだけでやる？テストデータも混ぜてスケーリングする？

機械学習

この記事は何？機械学習における前処理として，特徴量のスケーリングがあります．スケーリングの有無によって，予測器の性能が変化することがあります．スケーリングにも様々な手法があります．代表的なものとして，「最小値を0，最大値を1とする0-1スケ…

2017-01-09

不均衡データに対する予測結果のAccuracyは簡単に上がってしまう

機械学習統計学

この記事は何？機械学習における不均衡データの扱いは，学習時にも評価時にも注意する必要があります．例えばSVMにおける学習では，クラス重みを事前に設定することで，不均衡データによるバイアスを軽減できます．不均衡データに対する予測精度の評価に…

2017-01-03

【Python】組み込み関数のsumとnumpyのsumはどっちが速い？

Python

この記事は何？ Pythonでリストやnumpy.array中の数値和を求めたい時は，組み込み関数のsumを使う方法とnumpy.sumを使う方法があります．この記事では，どちらの方法がより高速に和を求められるのかを確認します．結論は？リスト中の数値和を求めるときは…

2016-12-05

CNNとRankNetを用いた画像の順序予測(ラブライブ!のキャラクター順序予測を例に)

機械学習 Python

(Chainer Advent Calendar 2016 5日目です．この記事はTokyoTechLTで発表したものと同内容のものです．) この記事は何？以前Chainer Advent Calendar 2015において，Chainerを用いたRankNet(ランク学習手法の1つ)の実装を紹介しました．本記事では，RankNe…