累積分布図の目盛調整

(1) 連続分布

Part (2) に進む   Workbench に戻る
目盛調整の意味

まず例でもって説明します。図(i)のように10個の測定データが小さい順に並べられたとします(正規分布を想定します)。 データの番号(1〜10)を縦軸、データの値を横軸にしてグラフを作ればいわゆる累積分布図(ii)が得られます。
この図では目盛間隔は1ですが、間隔を調整すると(iii)のように、ある程度凸凹は残るものの直線上に乗せられます。

実は目盛の調整は目新しいものではなくて、例えば Dr. Berendsen箸「データ・誤差解析の基礎」(東京化学同人)の p.8 と p.176 にグラフが出ています。 しかし特に説明がないので、HWBのテーマとして目盛調整を取り上げることにします。

連続量の累積分布

xmin〜xmaxで正規分布に従う連続データ N(x)が得られたとします。累積分布 y=cum(x) は次式となります。Aは規格化定数です。

erf(x) は誤差関数です。確率yに対して z=invcum(y)/(xmax-xmin) という操作を施すと直線に乗せられます。 ここで invcum(x) は cum(x) の逆関数で次式で定義されます。
適用例

xmin=2, xmax=8, a=5, σ=1, A=1.017(cum(xmax)=1 という条件からAは自動的に決まります) として得られた累積分布(破線)と変形後の分布(実線)および変形後の目盛を下に示します。 また5%の目盛位置を元の分布と変形後の分布で示しています。

1-6-2023, S. Hayashi