问题
小明家住在公交站旁边,每天通过公交车出行。公交车在行车路线上循环开动永不停歇,而小明则随机均匀的到达公交站等车。试想,如果公交车每两班之间的时间间隔是精确的 10 分钟,那么小明多次等车后会发现自己的平均等车时间是 5 分钟。现在,假设公交车的到站数量满足泊松分布,即每两班之间的时间间隔满足均值为 10 分钟的指数分布,请问小明多次等车后观察到的平均等车时间应当为多少?
解答
在下文中,我将使用 $p(t)$ 来表示公交车每两班之间时间间隔满足的概率分布,用 $q(t)$ 表示小明所落入的时间区间满足的概率分布,且用 $\langle \cdots \rangle_p$ 和 $\langle \cdots \rangle_q$ 分别表示概率分布 $p$ 和 $q$ 下的均值。根据问题信息,$p(t)$ 是均值为 10 分钟的指数分布,因此有 $\langle t \rangle_p = 10 \text{ min}$. 根据指数分布的性质,我们还可以得到 $\operatorname{Var}[t]_p = 100 \text{ min}^2$.
首先,由于小明是均匀且随机的到达公交站,因此小明有更大的概率落入时间间隔更长的区间。所以直觉上看,小明落入的时间区间的平均长度应当大于公交车两班之间的平均时间间隔,即 $\langle t \rangle_q > \langle t \rangle_p$. 由这一分析可知,$q(t)$ 应当正比于 $t$,且同时应当正比于 $p(t)$. 因此有 $q(t) \propto t p(t)$. 可以计算出归一化因子为
$$ \int_0^{+\infty} tp(t)\mathrm{d}t = \langle t \rangle_p. $$
因此,我们可以写出 $q(t)$ 的显示表达式
$$ q(t) = \frac{t p(t)}{\langle t \rangle_p}. $$
有了这一表达式,我们便可以计算出小明所落入的时间区间的平均长度,即
$$ \begin{aligned} \langle t \rangle_q &= \int_0^{+\infty} t q(t) \mathrm{d}t \\ &=\frac{1}{\langle t \rangle_p} \int_0^{+\infty} t^2 p(t) \mathrm{d}t \\ &= \frac{\langle t^2 \rangle_p}{\langle t \rangle_p} \\ &= \langle t \rangle_p + \frac{\operatorname{Var}[t]_p}{\langle t \rangle_p}, \end{aligned} $$
其中最后一行使用了方差的定义 $\operatorname{Var}[t]_p = \langle t^2 \rangle_p - \langle t\rangle_p^2$. 带入 $\langle t \rangle_p$ 和 $\operatorname{Var}[t]_p$ 的具体数据即可计算得到 $\langle t \rangle_q = 20 \text{ min}$,也就是说小明所到达的那个时间区间的平均值为 20 分钟。由于对称性,小明平均需要等待的时间和平均错过上一班车的时间相等,且其和应当为 $\langle t \rangle_q$. 因此,小明观察到的平均等待时间为 10 分钟,且小明平均错过上一班车的时间也为 10 分钟。
注意到,我们推导出的公式 $\langle t \rangle_q = \langle t \rangle_p + \frac{\operatorname{Var}[t]_p}{\langle t \rangle_p}$ 与概率分布 $p(t)$ 的具体形式无关。由于方差的正定性质,不难发现对于随机到站的公交车, $\langle t \rangle_q$ 总是大于 $\langle t\rangle_p$,也就是说涨落总是会让等待时间变长。当且仅当 $\operatorname{Var}[t]_p$ 趋于 0,即分布 $p(t)$ 趋于 $\delta(t)$ 的时候,$\langle t \rangle_p = \langle t \rangle_q$,这很符合直觉。
后记
此问题为笔者在马里兰大学访问期间 Christopher Jarzynski 在午餐时间让学生们一起思考的有趣问题。