内容参考自Marc Barthelemy《The Structures and Dynamics of Cities —— Urban Data Analysis and Theoretical Modeling》,本书结合了统计物理学和城市经济学的理论,提供了对城市和城市系统的跨学科和现代的研究视角,经典的实证和理论模型在本书中得到评述。
计量地理学/城市经济学的高度抽象模型/复杂参数模拟城市演变–>统计物理学+空间经济学+计量地理学–对城市研究的跨学科视角
首要目标是理解城市这一对象,识别塑造和演进城市的首要因素。
The goal of a science of cities will be reached when, considering a specific case, we can basically say what will happen and which ingredients it is necessary to introduce in a model in order to get more detailed information and predictions.
Here, understanding means that we can construct a consistent story, based on a few ingredients, that explains a selection of facts observed in reality.
Indeed, we would like to assess quantitatively the impact of various factors, which means that we want to write mathematical relations between different quantities.
The main point here is to identify the most important parameters, not only to understand the past, but also to be able to construct a model that indicates with reasonable confidence the future evolution of a city and allows the impact of various policies to be tested.
cities exist in order to connect people.
一些核心要素:个体交互(individual interact)、交通、政策等等
如何定义一个城市仍是问题:根据行政区定义虽然直接但已经outdated,无法捕捉城市蔓延现象,于是基于城市中心和连接中心的通勤率(commuter fraction)等参数对城市进行定义,或使用连片建成区这样的non-ambiguous对象进行定义(如使用City Clustering Algorithm进行自下而上的城市识别。)
不同时间尺度和空间尺度研究的城市问题是不同的,但这些尺度经常混合在一起,使得从均衡角度考虑城市问题和单独考虑某个问题是困难的。承认不同的过程彼此相关联,以上论述成为城市建模的关键问题,研究时考虑时空间尺度也成为必要。
This almost continuous spectrum makes it difficult to consider cities as being in equilibrium but also to view these processes as decoupled from each other. This is a very important problem in city modeling and necessitates a careful discussion of spatial and temporal scales, acknowledging the possibility that various processes are interfering with each other.
以下聚焦一些特定变量进行分析:
We see from this discussion that important information about the structure of cities and mobility patterns can be encoded in the nontrivial values of exponents characterizing the evolution of macroscopic quantities such as area, total commuting distance, and so on. In this respect, this kind of macroscopic measure can then serve as a guide for finding the correct theoretical model.
statistical physics: 可以追溯到19实际的热力学(thermodynamics)研究,建立起了微观描述和宏观观察之间的联系。
相转换——一种涌现行为(emergent behavior):is not easily predictable from the properties of elementary constituents. 涌现行为由个体交互产生,即使这种交互是简单的。 In addition, the emergent behavior depends not on all the details describing the system, but rather on a small number of parameters that are actually relevant at large scales.
A city is an emergent phenomenon resulting from agents interacting with each other. 研究城市问题转变为研究可以解释城市中涌现行为的个体交互和微观动机的组分的识别问题。
本书的视角是以generic aspect来研究城市的,不局限于各个城市的历史以及区位,试图发现城市的普遍规律。 Devoting to a specific area is however, less relevant to the task of finding dominant mechanisms and parameters that govern city evolution. At the root of this is the brief that all cities are various expressions of the same object.
不同的问题需要在对应的尺度下进行求解:研究水流不应该从分子尺度下进行,而应该从宏观上使用Navier-Strokes方程求解。Each problem has its own scale and a set of principles. And its level might require a whole new conceptual structure.
物理学对系统认知的准则:Physics is not a catalogue of disparate models, but rather a small set of mechanisms which once applied to a particular system, have great predictive power. Very roughly in physics. When we say that we understand the system, it usually means that:
In particular, from 1, we can predict the response of the system when we apply a perturbation to try to modify it. In the case of cities, we could thus offer some general large scale insights when facing different planning alternatives. Understanding the main forces and being able to predict the effect of various changes in an urban system would thus be an important goal for a science of cities.
统计物理学的首要关注点就是对系统的微观描述和以少量参数描述系统的宏观行为。如用温度来描述相转换。
The idea that only a few parameters are actually relevant for describing the macroscopic behavior is probably the one that will prove most useful across other disciplines.
对于城市建模存在着两种流派:
在一般的复杂系统中参数的量同样有着类似的问题:
在物理学中,通常认为有着较小参数量且较大预测结果数的模型是一个好的模型。近些年来城市数据的可获取性的急剧提高为在城市研究中建立这样一个minimal model提供了可能性,但前提是能够对城市演进的多层机理有清晰的认知。
物理学家通常先以最少量的参数提出模型,然后通过实证观察来校核模型,通过添加参数或提出新的机理来修正模型,但这种方式在LUTI类模型中是不适用的。原因是这类模型中的参数量过于巨大,以至于难以评估各个参数之间的相关性,有如此多参数的模型基本可以视作黑箱(black box)模型,以至于其对现实现象的不错效果与其说是解释,不如说是过拟合。
此外,物理学家构建模型不依恋于(never clung to)预先存在的工具,而是通过现象来调整数学工具。但在城市经济学中,源自优化理论和近些年来交通优化理论的数学工具可能反而成为他们对现实描述的适应的障碍。如McCall的job search理论就是一个例子。
传统城市经济学模型的不足:
接下来对上述四点进行更详细的讨论,包括均衡状态假设以及效用函数的选择问题。
组分的相关性在城市经济学研究中常常被忽视,虽然在计量社会学中这种考虑早已存在(Schelling, 1971),但是大多数城市经济学理论只考虑一种典型的agent,即无需考虑其他agent的行为,只考虑自身效用的最大化。
A crucial assumption in urban economics is that of equilibrium, which is somehow surprising.
城市经济学中另一个重要的问题是效用函数的选择问题。这里首先介绍一个不依赖效用函数的good case,再介绍一个依赖效用函数的special case.
A good case: the bid-rent gradient.
城市地租模型的经典模型:Alonso-Muth-Mills模型。模型假定城市单中心单出行方式,在区位$x$处租房面积为$s(x)$的预算约束为:
\[Y=z+C_R(x)+T(x)\]其中$Y$是收入,$C_R(x)$和$T(x)$是区位的租金成本和交通成本,$z$代表其他成本(composite commodities)。假设单位面积的租金$R(x)$依赖区位$x$,$C_R(x)=R(x)s(x)$。假设交通成本只与距区位中心的距离有关,$T(x)=V\mid x\mid/v$,其中$V$为单位时间成本,$v$为交通模式的平均速度。城市经济学中,标准假设是优化效用最大化,效用函数只与$s$和$z$有关:
$U=U(z,s)$
使用拉格朗日乘子法进行求解,等价于:
\[\max_{z,s}(U(z,s)-\lambda(Y-z-C_R-T))\]也可以将约束引入效用函数中,即最大化$U(Y-R(x)s-T(x),s)$即可,令$\frac{d U}{d s}=0$,得到:
\[\partial_1 U(-R(x))+\partial_2 U=0\] \[R(x)=\frac{\partial_2 U}{\partial_1 U}\]$\frac{d U}{d x}=0$,得到:
\[\partial_1U(-s\frac{dR}{dx}-R\frac{ds}{dx}-\frac{V}{v})+\partial_2U\frac{\partial s}{\partial x}=0\\ -s\frac{dR}{dx}-\frac{V}{v}=0\\ \frac{d R}{d x}=-\frac{V}{vs(x)}\]上述得到的$\frac{d R}{d x}=-\frac{V}{vs(x)}$在任意效用函数下都适用,表明单位租金和区位的关系是减函数,人需要在交通成本和租金之间做权衡。
problem arise: solving the problem.
想要完全求解该模型,需要给出特定的效用函数,如何给?如可以写为:
\[U(z,s)=\alpha\log z+\beta\log s\\ \alpha + \beta = 1\\ Y=e^{\frac{u}{\alpha}}s^{-\frac{\beta}{\alpha}}+sR(x)+T(x)\\ ...\]This is obviously a crucial question since the utility formalization is a pillar of urban economics, but unless we can bring empirical evidence to support it, it’s scientific validity can be challenged.
The crucial game changer in research on cities is data.
从小时间尺度到大时间尺度,手机信令数据,社会经济数据,历史数据都是城市研究中的数据吗,对应不同的研究问题。
如果没有正确的理论框架,则常见两类错误:
This example clearly illustrates the dangers of interpreting data without a theoretical guide and in the absence of the feedback loop between theory and data.
不同研究领域的专门化对于理解城市是无益的,有时甚至会造成误解及沟通艰难。障碍主要体现在:
对此,作者呼吁:The outsider should definitely know the subject and the literature of the domain, but experts in that domain should not reject the outsider too hastily, and should consider the results on a purely scientific basis.
The locations of homes, activities, and businesses shape a city, and identifying the mechanisms that govern these spatial distributions is crucial for our understanding of these systems.
本章首先对商店和公共设施进行讨论,然后对多中心的识别和度量进行讨论,接着对Fujita-Ogawa模型和edge-city模型进行分析。
如机场、邮局、医院等公用设施依据局部的人口密度在空间上进行分布从而优化其效率。这些设施组成了城市结构的重要部分且帮助塑造人口的空间分布。区域$D$内,以$\rho (x)$表示位置$x$处的人口密度,N个公用设施的位置为${x_1,x_2,…x_N}$,则以如下自然的考虑作为优化目标(人口到各个公用设施的最小距离之和最小):
\[F(x_1,x_2,...,x_N)=\int{\rho(x)\min\mid x-x_i\mid }dx\]考虑使用各个设施点的Voronoi图替代上式中的最小距离,对于$x$处,其所在的设施点Voronoi cell面积如果为$a(x)$,则其到各设施点的最小距离为到所在Voronoi cell源点的距离与$g$(例如$\sqrt{a(x)}$)成正比,where g is a geometrical factor of order 1 that depends on the shape of the Voronoi cell.【geometrical factor of order 1的意思是,使用该因子进行度量,其变化与单元的线性尺寸(如边长或距离)成正比】
则优化目标可以表示为:
\[F(a(x))\sim \int \rho(x)\sqrt{a(x)}d^2 x\\ s.t. \int_D \frac{1}{a(x)}d^2 x = N\]约束条件是有$N$个设施点。
使用拉格朗日乘子法进行求解,令:
\[\frac{\partial}{\partial{a(x)}}[\int \rho(x)\sqrt{a(x)}d^2 x+\lambda(\int_D \frac{1}{a(x)}d^2 x - N)]=0\]得到:
\[\frac{\rho(x)}{\sqrt{a(x)}}=\frac{2\lambda}{a(x)^2}\\ a(x)\sim(\frac{\lambda})^{\frac{2}{3}}\]得到设施的密度:
\[\rho_f(x)=\frac{1}{a(x)}=\frac{N}{\int \rho(x)^{\frac{2}{3}}}\rho(x)^{\frac{2}{3}}\]得到Voronoi cell面积、平均半径、其中人口数的关系:
\[a(x)\sim \rho(x)^{-\frac{2}{3}}\\ r(x)\sim \rho(x)^{-\frac{1}{3}}\\ n(x)\sim \rho(x)a(x) \sim \rho(x)^{\frac{1}{3}}\]可以根据上述理论对公用设施的空间分布的合理程度进行简单评估。
不同类型的商店间可能会吸引或排斥彼此,这种交互作用决定了商店的空间分布。假设一个城市中有两类商店A和B,其数量分别为$N_A$和$N_B$,总数为$N_{tot}$,则位置$x$处的A类型商店的$M$指数定义为:
\[M_{AB}(x,r)=\frac{n_B(x,r)/n_{tot}(x,r)}{N_B/N_{tot}}\]其中$n_B(x,r),n_{tot}(x,r)$分别表示$x$处B类型商店的数量和商店的总数量,该指数计算了局部密度和全局密度的比值,如果M指数远大于1,则说明$x$处A和B的吸引作用更明显。分子中的分母也可以表示为$n_{tot}(x,r)-n_A(x,r)$,将局部的A商店间的吸引也考虑在内。基于上述局部指数可以计算得到全局的局部指数平均值$M_{AB}(r)$,其方差也包含有用的信息。
令$a_{AB}=\log M_{AB}$,使用$i$表示商店的可能区位,$\sigma_i$表示商店类别,$\pi_{\sigma_i\sigma_j}=1 \quad\text{if}\quad \sigma_i == \sigma_j\quad\text{else} -1$,则可定义如下目标函数:
\[K=\sum_{i,j}a_{\sigma_i\sigma_j}\pi_{\sigma_i\sigma_j}\]定义$x$处的环境质量,$n_{ij}(x)$是$x$处类型为$i$的商店邻域内的$j$类型商店的数量,A large index thus corresponds to an environment in which the “favorite” neighbors of i are over-represented.
\[Q_i(x)=\sum_{j}{a_{ij}(n_{ij}(x)-\bar{n_{ij}})}\]定义:中心——热点(hotpot),两个尺度:数据单元的大小和聚合单元的大小,参数方法需要提供阈值$\delta$,单元某指标值$\rho(i)>\delta$时被识别为局部大值单元,然后进行聚合,得到中心。
一种识别和计量热点的非参数方法:
该模型讨论了个人和公司的区位选择,其提出旨在提供对个体求职和公司利润最大化的均衡的解释——单中心的空间组织不总是稳定,多中心的结构可以被观测到。
对于个人,其效用函数$U(S,Z)$依赖于住房面积$S$和复合商品(composite commodity)$Z$,这里,
\[Z=W(y)-R(x)-T(x,y)\]其中,$W(y),R(x),T(x,y)$分别表示就业区位$y$下的收入,居住区位$x$下的租金,$x$和$y$之间的通勤成本,忽视拥堵效应,简单定义$T(x,y)=td(x,y)$,$t$表示单位通勤距离的成本,$d$表示通勤距离。
假设住房面积固定,则最优化效用函数将等价于优化$Z$,如果继续假设住房相同,则在均衡状态下将得到相同的最优$U^,Z^$。
另一方面,公司进行利润的最大化:
\[\Pi(y)=F(y)-R(y)-L(y)W(y)\]$\Pi(y),F(y),R(y),L(y)W(y)$分别表示区位$y$下的利润,区位$y$下的区位潜力(locational potential),区位$y$下的租金,工作在区位$y$的人数。经典的假设是$L(y)$是常数$L_0$,则人数$N$和公司$M$数有如下关系:$N=ML_0$,区位潜力在原始模型中被描述为:
\[F(y)=\int{K(y-y')b(y')dy'}\]其中$b(x)$是公司的密度,$K(x)$是核函数,如$K(y)=ke^{-\alpha\mid y\mid}$,假设所有公司也是相同的,则最优利润也在均衡状态下得到。接下来讨论如何得到均衡状态。
定义函数$y=J(X)$描述在$x$处居住在$y$处工作的比例,则均衡状态时有:
\[W(J(x))-t\mid x-J(x)\mid=\max_y(W(y)-t\mid x-\mid )\]关于Fujita-Ogawa model的拓展:
###