CEPII, Recherche et Expertise sur l'economie mondiale
TRADHIST


Description


La base TRADEHIST a pour but de permettre l’analyse dans une perspective historique longue du processus de mondialisation à travers des données commerciales internationales bilatérales. L'ensemble des données recueillies comprend cinq types de variables: i) flux commerciaux nominaux bilatéraux; ii) importations et exportations nominales totales au niveau national; iii) PIB nominal; iv) taux de change; v) facteurs bilatéraux connus pour favoriser ou entraver le commerce, y compris la distance géographique, les frontières communes, les liens coloniaux et linguistiques, ainsi que les tarifs bilatéraux. Nous utilisons ensuite cet ensemble de données pour estimer, à l’aide de l’estimation d'équations de gravité, l'évolution des coûts commerciaux au cours des deux derniers siècles. La base TRADEHIST constitue un ensemble unique de données en termes de couverture temporelle et géographique : sur la période 1827 à 2014 (soit 188 ans), cette base offre plus de 1,9 million d'observations commerciales bilatérales, 42 000 observations sur le commerce total et environ 14 000 pour les PIBs et les taux de change.


Merci de lire le document de travail du CEPII. Si vous n’y trouvez pas la réponse à vos questions, contactez-nous.
 


Référence à citer : Fouquin, M. et Hugot, J. (2016) Two Centuries of Bilateral Trade and Gravity Data: 1827-2014. CEPII Working Paper, N°2016-14.
 

Responsable & contact : Jules Hugot, tradehistcepii.fr

Licence : Etalab 2.0

Téléchargement
>>>


STATA 12.0 version
  • TRADHIST_WP.dta  [ base de données originale associée document de travail du CEPII ]

STATA 13.0 version

Excel versions [Mise à jour: Nov. 10, 2016 - Documentation ici]
  • Commerce agrégé
  • Tarifs agrégés
  • Taux de change
 


Méthodologie
>>>


La base TRADEHIST a été construite pour analyser les deux grandes vagues de la mondialisation: la Première Mondialisation de 1824 à 1913 et la Deuxième Mondialisation après la Seconde Guerre mondiale. La base regroupe cinq types de variables: i) les flux commerciaux à prix courants bilatéraux, ii) les exportations et importations nominales globales au niveau des pays, iii) le PIB nominal, iv) les taux de change et v) les facteurs bilatéraux connus pour favoriser ou entraver les échanges, notamment la distance géographique, les frontières communes, les liens coloniaux et linguistiques, ainsi que les tarifs bilatéraux. Ces données sont uniques en termes de couverture temporelle et géographique.

Nous adoptons une approche systématique de collecte de toutes ces données, à l'exception des tarifs. Pour chaque variable, nous fusionnons les sources (secondaires) préexistantes avec des données supplémentaires directement extraites de sources primaires, y compris des publications gouvernementales, des livres et des articles universitaires. Au final, nous rassemblons plus de 1,9 million d'observations commerciales bilatérales pour les 188 années allant de 1827 à 2014. Nous fournissons également environ 42 000 observations sur le commerce global (c'est-à-dire les importations et les exportations totales au niveau des pays) et environ 14 000 observations sur les PIBs et les taux de change. Les paires de pays pour lesquelles nous avons collecté le commerce bilatéral sont également associées à la distance du grand cercle et à la distance maritime la plus courte entre elles, ainsi qu'à un ensemble de variables muettes reflétant les liens coloniaux et linguistiques. Les valeurs nominales ont été systématiquement converties en livre sterling afin de rendre les données comparables au niveau international.

Notre contribution la plus importante consiste à élargir les données commerciales bilatérales disponibles, tant en termes de couverture temporelle que géographique. Sur les 1,9 million d'observations commerciales bilatérales, plus de 1,6 million se concentrent sur la période 1948-2014. Par ailleurs, environ 97 % de ces observations proviennent de l'ensemble de données de la Direction des statistiques commerciales (Fonds monétaire international, 2002 et 2015). Notre contribution se concentre donc sur la période antérieure à 1948, pour laquelle nous fournissons environ 185 000 nouvelles observations, sur les 240 000 observations que nous rapportons. Pour cette période, nous avons plus que quadruplé la quantité de données disponibles. La structure des données est bilatérale : chaque observation porte sur un flux commercial spécifique au cours d'une année donnée. Chaque observation est donc spécifique à une paire de pays, à la direction et à l'année. Le panel qui en résulte est très déséquilibré, car le nombre de flux commerciaux bilatéraux disponibles augmente considérablement avec le temps. Le pays d'origine et le pays de destination sont respectivement identifiés par les variables « iso_o » et « iso_d ». Les variables monadiques – qui ne sont spécifiques qu'au pays et à l'année - sont dupliquées chaque fois que cela est nécessaire et attachées au pays d'origine ou au pays de destination en conséquence. Les variables relatives au pays d'origine (de destination) sont identifiées par le suffixe _o(_d). Ces variables comprennent les exportations et les importations agrégées, le PIB et le taux de change.