
選択肢1. 相関係数は、つねに-1<r<1の範囲にある。
不適切です。-1,1も含まれます。
選択肢2. 相関係数が0から1に近づくほど、散布図上において2つのデータは直線関係になる。
適切です。
選択肢3. 相関係数が0であれば、2つのデータは互いに独立である。
不適切です。独立であるとは断定できないです。
選択肢4. 回帰分析における決定係数は、相関係数の絶対値である。
不適切です。絶対値ではなく、負の影響も考慮すべきです。
選択肢5. 相関係数の絶対値の大きさに応じて、2つのデータの間の因果関係は変わる。
不適切です。絶対値ではなく、負の影響にも意味があります。
[解答]②
参考:
過去問ドットコム
この問題は、相関係数に関する知識を問うものです。相関係数(ピアソンの積率相関係数)は、2つのデータの関係を表す指標であり、特定の範囲と特性を持っています。各選択肢を確認して、最も適切なものを選びます。
### 選択肢の確認
1. **相関係数は、つねに -1 < r < 1 の範囲にある。**
不適切です。-1,1も含まれます。
2. **相関係数が 0 から 1 に近づくほど、散布図上において 2 つのデータは直線関係になる。**
- 相関係数が 1 に近づくと、2 つのデータは強い正の直線関係を示します。この記述も正しいです。
3. **相関係数が 0 であれば、2 つのデータは互いに独立である。**
- 相関係数が 0 であることは、線形の関係がないことを示しますが、必ずしもデータが独立であるとは限りません。非線形の関係がある可能性もあるため、この記述は不正確です。
4. **回帰分析における決定係数は、相関係数の絶対値である。**
- 決定係数 \( R^2 \) は相関係数の絶対値の2乗であり、相関係数の絶対値そのものではありません。したがって、この記述も不正確です。
5. **相関係数の絶対値の大きさに応じて、2 つのデータの間の因果関係は変わる。**
- 相関係数は2つのデータの相関の強さを示しますが、因果関係(どちらが原因でどちらが結果であるか)を示すものではありません。この記述は誤りです。
相関係数の求め方
相関係数(ピアソンの積率相関係数)は、2つのデータセットの間の線形関係の強さと方向を表す指標です。相関係数 \( r \) は -1 から 1 の範囲をとり、以下のように解釈されます:
- \( r = 1 \): 完全な正の線形関係
- \( r = -1 \): 完全な負の線形関係
- \( r = 0 \): 線形関係がない
### 相関係数の求め方(数式)
2つのデータセット \( X = \{x_1, x_2, \dots, x_n\} \) と \( Y = \{y_1, y_2, \dots, y_n\} \) が与えられている場合、相関係数 \( r \) は次の式で求められます:
\[
r = \frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^{n} (x_i - \bar{x})^2} \cdot \sqrt{\sum_{i=1}^{n} (y_i - \bar{y})^2}}
\]
ここで:
- \( n \) はデータの数
- \( x_i \) および \( y_i \) はそれぞれのデータセットの各データポイント
- \( \bar{x} \) および \( \bar{y} \) はそれぞれのデータセットの平均値(平均は \( \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} \) で計算)
### 手順
1. 各データセット \( X \) と \( Y \) の平均を求めます。
2. 各データポイントとその平均との差を計算し、掛け合わせます。
3. その積を合計します(分子)。
4. \( X \) と \( Y \) のそれぞれのデータセットの分散を求め、平方根を取ります(分母の部分)。
5. 分子を分母で割ることで、相関係数 \( r \) が求められます。
この方法で計算すると、相関の強さと方向を表す値が得られます。