選択肢1. 相関係数は、つねに-1<r<1の範囲にある。 不適切です。-1,1も含まれます。 選択肢2. 相関係数が0から1に近づくほど、散布図上において2つのデータは直線関係になる。 適切です。 選択肢3. 相関係数が0であれば、2つのデータは互いに独立である。 不適切です。独立であるとは断定できないです。 選択肢4. 回帰分析における決定係数は、相関係数の絶対値である。 不適切です。絶対値ではなく、負の影響も考慮すべきです。 選択肢5. 相関係数の絶対値の大きさに応じて、2つのデータの間の因果関係は変わる。 不適切です。絶対値ではなく、負の影響にも意味があります。 [解答]②   参考: 過去問ドットコム   この問題は、相関係数に関する知識を問うものです。相関係数(ピアソンの積率相関係数)は、2つのデータの関係を表す指標であり、特定の範囲と特性を持っています。各選択肢を確認して、最も適切なものを選びます。 ### 選択肢の確認 1. **相関係数は、つねに -1 < r < 1 の範囲にある。** 不適切です。-1,1も含まれます。 2. **相関係数が 0 から 1 に近づくほど、散布図上において 2 つのデータは直線関係になる。** - 相関係数が 1 に近づくと、2 つのデータは強い正の直線関係を示します。この記述も正しいです。 3. **相関係数が 0 であれば、2 つのデータは互いに独立である。** - 相関係数が 0 であることは、線形の関係がないことを示しますが、必ずしもデータが独立であるとは限りません。非線形の関係がある可能性もあるため、この記述は不正確です。 4. **回帰分析における決定係数は、相関係数の絶対値である。** - 決定係数 \( R^2 \) は相関係数の絶対値の2乗であり、相関係数の絶対値そのものではありません。したがって、この記述も不正確です。 5. **相関係数の絶対値の大きさに応じて、2 つのデータの間の因果関係は変わる。** - 相関係数は2つのデータの相関の強さを示しますが、因果関係(どちらが原因でどちらが結果であるか)を示すものではありません。この記述は誤りです。
相関係数の求め方
相関係数(ピアソンの積率相関係数)は、2つのデータセットの間の線形関係の強さと方向を表す指標です。相関係数 \( r \) は -1 から 1 の範囲をとり、以下のように解釈されます: - \( r = 1 \): 完全な正の線形関係 - \( r = -1 \): 完全な負の線形関係 - \( r = 0 \): 線形関係がない ### 相関係数の求め方(数式) 2つのデータセット \( X = \{x_1, x_2, \dots, x_n\} \) と \( Y = \{y_1, y_2, \dots, y_n\} \) が与えられている場合、相関係数 \( r \) は次の式で求められます: \[ r = \frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^{n} (x_i - \bar{x})^2} \cdot \sqrt{\sum_{i=1}^{n} (y_i - \bar{y})^2}} \] ここで: - \( n \) はデータの数 - \( x_i \) および \( y_i \) はそれぞれのデータセットの各データポイント - \( \bar{x} \) および \( \bar{y} \) はそれぞれのデータセットの平均値(平均は \( \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} \) で計算) ### 手順 1. 各データセット \( X \) と \( Y \) の平均を求めます。 2. 各データポイントとその平均との差を計算し、掛け合わせます。 3. その積を合計します(分子)。 4. \( X \) と \( Y \) のそれぞれのデータセットの分散を求め、平方根を取ります(分母の部分)。 5. 分子を分母で割ることで、相関係数 \( r \) が求められます。 この方法で計算すると、相関の強さと方向を表す値が得られます。