matplotlib.pyplot.boxplot #
- matplotlib.pyplot. boxplot ( x , notch =なし, sym =なし, vert =なし, whis =なし, position =なし, widths =なし, patch_artist =なし, bootstrap =なし, usermedians =なし, conf_intervals =なし, meanline =なし, showmeans=なし、 showcaps =なし、 showbox =なし、 showfliers =なし、 boxprops =なし、 labels =なし、 flierprops =なし、 medianprops =なし、 meanprops =なし、 capprops =なし、 whiskerprops =なし、 manage_ticks = True、 autorange = False, zorder =なし, capwidths =なし, * , data =なし) [source] #
箱ひげ図を描きます。
ボックスはデータの第 1 四分位数 (Q1) から第 3 四分位数 (Q3) まで伸びており、線は中央値にあります。ひげはボックスから四分位範囲 (IQR) の 1.5 倍伸びています。フライヤー ポイントは、ひげの端を過ぎたポイントです。参照については、 https://en.wikipedia.org/wiki/Box_plotを参照してください。
Q1-1.5IQR Q1 median Q3 Q3+1.5IQR |-----:-----| o |--------| : |--------| o o |-----:-----| flier <-----------> fliers IQR
- パラメータ:
- x配列または一連のベクトル。
入力データ。2D 配列の場合、 xの各列に対して箱ひげ図が描画されます。1D 配列のシーケンスの場合、 xの配列ごとに箱ひげ図が描画されます。
- ノッチブール、デフォルト: False
ノッチ付き箱ひげ図 (
True
) または長方形箱ひげ図( ) を描画するかどうかFalse
。ノッチは、中央値周辺の信頼区間 (CI) を表します。ブートストラップのドキュメントに は、ノッチの位置がデフォルトでどのように計算されるかが記載されていますが、それらの位置は conf_intervalsパラメーターを設定することによってオーバーライドされる場合もあります。ノート
CI の値が下位四分位数よりも小さいか上位四分位数よりも大きい場合、ノッチはボックスを超えて広がり、独特の「反転」した外観になります。これは予想される動作であり、他の統計視覚化パッケージと一致しています。
- sym str、オプション
フライヤー ポイントのデフォルト シンボル。空の文字列 ('') はチラシを非表示にします。の場合
None
、チラシはデフォルトで「b+」になります。flyerpropsパラメーターによって、より詳細な制御が提供されます。- vert bool、デフォルト: True
- whis float または (float, float)、デフォルト: 1.5
ひげの位置。
フロートの場合、下のヒゲは より上の最低データム にあり、上のヒゲは より下の最高データムにあります。ここで、Q1 と Q3 は 1 番目と 3 番目の四分位数です。の既定値は、箱ひげ図の Tukey の元の定義に対応します。
Q1 - whis*(Q3-Q1)
Q3 + whis*(Q3-Q1)
whis = 1.5
浮動小数点数のペアの場合、ひげを描画するパーセンタイルを示します (例: (5, 95))。特に、これを (0, 100) に設定すると、ひげがデータの全範囲をカバーします。
autorangeが Trueの場合、whisは自動的に (0, 100) (データの範囲全体をカバーする) に設定されます。
Q1 == Q3
ひげを超えると、データは外れ値と見なされ、個々のポイントとしてプロットされます。
- ブートストラップint、オプション
ノッチ付き箱ひげ図の中央値付近の信頼区間をブートストラップするかどうかを指定します。ブートストラップが None の場合、ブートストラップは実行されず、ノッチはガウス ベースの漸近近似を使用して計算されます (McGill, R.、Tukey, JW、および Larsen, WA, 1978 および Kendall and Stuart, 1967 を参照)。それ以外の場合、ブートストラップは、中央値をブートストラップして 95% 信頼区間を決定する回数を指定します。1000 から 10000 の間の値をお勧めします。
- usermedians 1D 配列のような、オプション
length の 1D 配列のようなもの
len(x)
。そうでない各エントリはNone
、対応するデータセットの中央値を強制します。であるエントリNone
の場合、中央値は通常どおり Matplotlib によって計算されます。- conf_intervals配列のような、オプション
shape の 2D 配列のようなもの。None ではない各エントリは、対応するノッチの位置を強制します (ノッチがの場合にのみ描画されます)。であるエントリの場合、ノッチは他のパラメータ (例: bootstrap ) で指定された方法で計算されます。
(len(x), 2)
True
None
- 配列のような位置、オプション
ボックスの位置。ティックとリミットは、位置に合わせて自動的に設定されます。N は描画されるボックスの数です。
range(1, N+1)
- float または array-like幅
ボックスの幅。デフォルトは 0.5 です。それよりも小さい場合は です。
0.15*(distance between extreme positions)
- patch_artist bool、デフォルト: False
False
Line2D アーティストでボックスを生成する場合。それ以外の場合、ボックスはパッチ アーティストで描画されます。- ラベルシーケンス、オプション
各データセットのラベル (データセットごとに 1 つ)。
- manage_ticks bool、デフォルト: True
True の場合、目盛りの位置とラベルは箱ひげ図の位置に合わせて調整されます。
- autorange bool、デフォルト: False
True
25 パーセンタイルと 75 パーセンタイルが等しくなるようにデータが分散されている場合、whisは(0, 100) に設定され、ひげの端がデータの最小値と最大値になります。- meanline bool、デフォルト: False
True
(およびshowmeansが) の場合、 meanprops (以下を参照)True
に従ってボックスの全幅にわたる線として平均をレンダリングしようとします 。showotchesも True の場合はお勧めできません。それ以外の場合、平均はポイントとして表示されます。- zorder float、デフォルト:
Line2D.zorder = 2
boxplot の zorder。
- 戻り値:
- 口述
boxplot の各コンポーネントを、
Line2D
作成されたインスタンスのリストにマッピングする辞書。その辞書には次のキーがあります (垂直ボックスプロットを想定):boxes
: 有効な場合、四分位数と中央値の信頼区間を示す箱ひげ図の本体。medians
: 各ボックスの中央にある水平線。whiskers
: 最も極端な、外れ値ではないデータ ポイントに伸びる垂直線。caps
: ひげの先端にある横線。fliers
: ひげ (フライヤー) を超えて伸びるデータを表すポイント。means
: 平均を表す点または線。
- その他のパラメータ:
- showcaps bool、デフォルト: True
ひげの先端のキャップを表示します。
- showbox bool、デフォルト: True
中央のボックスを表示します。
- showfliers bool、デフォルト: True
上限を超える外れ値を表示します。
- showmeans bool、デフォルト: False
算術平均を表示します。
- capprops dict、デフォルト: なし
キャップのスタイル。
- capwidths浮動小数点数または配列、デフォルト: なし
キャップの幅。
- boxprops dict、デフォルト: なし
ボックスのスタイル。
- whiskerprops dict、デフォルト: なし
ひげのスタイル。
- flyerprops dict、デフォルト: なし
チラシのスタイル。
- medianprops 辞書、デフォルト: なし
中央値のスタイル。
- meanprops dict、デフォルト: なし
平均のスタイル。
- データのインデックス可能なオブジェクト、オプション
指定された場合、すべてのパラメーターは string も受け入れます。これは(例外が発生しない限り)
s
と解釈されます。data[s]
こちらもご覧ください
violinplot
確率密度関数の推定値を描画します。