2023/3/28

わかりやすい単純(復元・非復元)サンプリング

サンプリングを考える場合は、 復元と非復元を考える必要があります。 さらに言えば復元の場合は、毎回全てのデータがある状態でサンプリングなので、1個前にサンプリングしたデータがどんなものであれ、毎回全てが候補になります。 しかし、非復元の場合は、1回取ったものは元に戻さないので、だんだんとあるデータの出る確率が相対的に上がっていきます。そりゃそうですよね。なので、この場合は1個前だけではなく過去に取ったデータに影響を受けているので、独立ではありません。   ただ単純にサンプリングをすることは簡単で ...

ReadMore

2023/3/21

予測区間のt検定

予測区間を考えるには、 そもそも回帰係数は今あるデータから算出したものになるわけですが、 偶然のデータで導かれたものなので、 もしかすると別のデータの組み合わせだと回帰係数がかなりズレたものになる可能性もあります。 それは外れ値を含んだデータで回帰分析をした時などですね。 それは単回帰分析であれば回帰診断図などで判定することもできますが、回帰係数に対してt検定をすることで、判定をすることなども可能です。 今回はそんな回帰係数のt検定について、考えていきたいと思います。   予測区間 \begin ...

ReadMore

2023/3/21

回帰係数のt検定

回帰係数\(\hat{\beta_{}}\)は \begin{eqnarray} E[\hat{\beta_{}}] &=& \beta \\ V[\hat{\beta_{}}] &=& \frac{\sigma^{2}}{\displaystyle \sum_{i=1}^{n}(x_{i} - \bar{x})^{2}} \\ \end{eqnarray} そして、確率変数でもある回帰係数を標準化すると、   \begin{eqnarray} Z &=& \displaystyle \frac ...

ReadMore

2023/3/21

わかりやすい二元配置分散分析

分散分析の概要と、1元配置分散分析については以下で説明をしました。 わかりやすい分散分析 ここでは要因が2つになった二元配置分散分析について学んでいこうと思います。 先に結論を話すと、一元配置分散分析と実はほとんど計算方法は変わらないです。 なので、いきなりですが具体的な計算をしてみようと思います! 具体的に計算をしてみます 以下のようなデータを考えてみます! 作業人(要因A)、機械(要因B) \(B_{1}\) \(B_{2}\) \(Aの平均\) \(A_{1}\) 16,18,19,19,18 12 ...

ReadMore

gcp

2023/3/7

BigQueryのパーティショニング

https://cloud.google.com/bigquery/docs/creating-partitioned-tables?hl=ja パーティショニングの検証用環境。文字列をパーティショニングに指定 パーティショニングとして、スケジュールで 以下のようにevent_nameを指定してパーティショニングをしてみます。 SELECT event_name, event.key, event.value.string_value, user_pseudo_id FROM `yoshida-labo. ...

ReadMore

© 2023 Yosshi Labo. Powered by AFFINGER5