ぱんでも

にうむ

pythonでデータの標準化

さいきんpythonデータマイニングをやり始めたので色々メモ. numpyありき.こんな雰囲気の計算をよく使うのでメモ.

import numpy as np

def normalize(arr):
    m = np.mean(arr)
    s = np.std(arr)
    if s != 0.0:
        arr = np.array([(arr[i] - m) / s for i in range(len(arr))])
    return arr

あるいは合計で割るような場合は,

def normalize(arr):
    sumarr = float(sum(arr))
    if sumarr != 0.0
        arr = np.array([arr[i] / sumarr for i in range(len(arr))])
    return arr

リスト内包表記べんり.