Are the absent always wrong? Dealing with zero values in urban scaling

    (), Vol. 46 (9), pp. 1663-1677

    Présentation (FED) : Les lois d’échelle indiquant une « surreprésentation » de certaines caractéristiques par rapport à un critère de taille des villes sont critiquées, en particulier du fait de l’exclusion de certaines données lorsqu’une caractéristique est absente (les valeurs nulles ne sont pas prises en compte). Une exploration des effets de cette exclusion est effectuée ici, et plusieurs solutions sont proposées pour surmonter cette limite. Dans le cas des investissements étrangers dans les villes françaises montre que des conclusions erronées pourraient être tirées lors de l'adoption de l'approche classique excluant les valeurs nulles. Les auteurs proposent des méthodes d'analyse qui traitent spécifiquement des valeurs nulles, ce qui change la conclusion sur la diffusion de l'investissement étranger dans le système urbain français.

    Abstract (authors) : Both theoretical and empirical studies have shown the ability of scaling laws to reveal processes of emergence in urban systems. Nevertheless, a controversy about the robustness of results obtained with these models on empirical cases remains, regarding for instance the definition of the ‘city’ considered or the way the estimations are performed. Another source of bias is highlighted in this contribution, with respect to the non-ubiquitous character of some urban attributes (i.e. their partial absence from several cities of the system). The problem with the zero count for cities where these attributes are absent is that the technical necessities of usual estimation procedures make the analysis ignore them altogether even when they represent some valid information. This could seriously impact the results. A precise exploration of the effects of this arbitrary filtering is conducted here, and several solutions are proposed to overcome this limitation. In a case study about foreign investment towards French cities, we show that some erroneous conclusions about a hierarchical diffusion could be drawn when adopting the classical ordinary least squares approach. The framework we suggest specifies how it is possible to avoid misinterpretations deriving from the exclusion of zero values by using methods of analysis which deal with zero values specifically. The conclusion of a diffusion of foreign investment in the French urban system is then rejected.