Get Started. It's Free
or sign up with your email address
Rocket clouds
Week 1 by Mind Map: Week 1

1. Main concerns

1.1. Is sample representative

1.2. Is there systematic bias

1.3. what randomness exist in the data

2. Example goals

2.1. Estimate uncertanty

2.2. Population quantity is a benchmark value

2.3. Infer mechanistic relationships

2.4. Determine the impact of a policy

3. Tools

3.1. Randomization in terms of variables

3.2. Random sampling

3.2.1. Instead can have

3.2.2. Random models

3.3. Hypothesis testing

3.4. Confidence intervals

3.5. Probability models

3.6. Study design

3.7. Nonparameteric bootstrapping

3.8. Permutation, randomization and exchengeability testing

4. Probability

4.1. Sample space (Tetha)

4.1.1. Collection of possible outcomes

4.2. Event (E)

4.2.1. subset of sample space

4.3. Simple or elementary event (w)

4.3.1. particular result of experiment

5. Random variable

5.1. numeric outcome of an experiment

5.2. PMF - probability mass function

5.2.1. Способ получить вероятность выпдения события X по формуле. Т.е. PMF - это y(X), которая дает вероятность наступления события X

5.2.2. Это работает когда random variable - Дискретная. Например, броски монетки

5.3. PDF - probability density function

5.3.1. Идея таже самая, что и у PMF, но для непрерывных значений random variable

5.3.2. Площадь под кривой должна равняться 1

5.4. CDF - cumulative distribution function

5.4.1. Неважно, непрерывное ли X или дискретное

5.4.2. F(x) = P(X <= x)

5.4.2.1. Показывает вероятность того, что random variable меньше заданного ограничения x

5.5. Survival function

5.5.1. Это похоже на CDF, но наоборт, что вероятность больше заданного x

5.5.2. S(x) = P(X > x)

5.5.2.1. Ну и S(x) = 1 - F(x)

5.6. Quantiles

5.6.1. F(xalpha) = alpha

5.6.2. Т.е. это точка alpha, такая что вероятность ,удет равна заданной нами

5.6.3. Типа обратной задачи. Когда мы знаем площадь под кривой и нам надо найти точку x, от которой эта площадь отсчитана была

6. Expected values

6.1. Еще называют mean

6.2. центр распределения случайной переменной

6.3. Можно сравнить с центром тяжести физического объекта

6.4. E[X] = SUM(xp(x))

6.4.1. Причем эти квадратные скобки по сути эквивалентны круглым - один хрен

6.5. Использует библиотеку manipulate

6.5.1. Ищет x

6.5.2. Смотрит где Imbalance минимально

6.6. Для continious random variable все тоже самое, но опять же речь идет о площади под графиком

6.7. Долго и упорно выводил формулу для mean

7. Variance

7.1. measure of spread

7.2. Var(X) = E[(X - mean)^2]

8. Independence

8.1. Вероятность пересечения событий A и B равна вероятности P(A) x P(B)

8.2. Такое далеко не всегда так

8.3. IID - Independent and Identically distributed

8.4. Covariance: Cov(X,Y) = E[(X - meanx)(Y - meany)] = E[XY] - E[X]E[Y]

8.5. sigma / sqrt(n) - standard error of sample mean

8.6. sqr(sigma) / n = common variance