増えまくる《訪日観光客》をデータで分析する 「いつから増えたのか」「日本人旅行者とインバウンド旅行者の行き先の違い」

小西 葉子
上席研究員(特任)

コロナを経た旅行者の変化

日本経済の中で、最近需要が高まり、景気に好影響を与えているものの1つは間違いなくインバウンド市場です。コロナ後、急激に訪日旅行者は増えていますし、増加のスピードも、好みの変化も速く、ビジネスチャンスが多分にあります。

しかも、コロナ禍の出入国制限で、一般の観光客が入国できなくなるという自然実験のような環境にもなりました。ここでは、大きな構造変化が起こった場合におけるグラフの描き方の工夫を紹介しながら、コロナ前から、コロナ禍、コロナ後の旅先の変化を見ていきます。

まず、図31で2003年以降の日本政府観光局(JNTO)の訪日外客数の推移を見てみましょう。

図31:訪日旅行者数の推移と近似値

期間を2003〜2014年、急増している2015年からコロナ前の2019年、コロナ禍からコロナ後の2020年以降の3色に分け、エクセルのツールでそれぞれに近似直線を引きました。

2003〜2014年は近似直線の水準も傾きも2015年以降よりかなりフラットになっています。2011年は東日本大震災の影響で、2010年より少なくなりましたが、その後は震災前のペースで増えていることがわかります。

2015年は水準が一段高くなり、近似直線の傾きからそれまでの増え方よりスピードが格段に上がっていることがわかります。2015年は、インバウンド観光市場で構造変化が起こったと言えそうです。なにがあったのかを定性的にみてみましょう。

2015年がインバウンドブームの始まり

2015年は、1月19日から中国人に対するビザ発給要件の緩和がありました。訪日旅行者の4人に1人は中国からという点からみても、2015年を機に訪日需要が高まったと言えます。

また、財務省の発表によると2015年の日本の旅行収支は約1.1兆円で53年ぶりに黒字になり、JNTOによると、2015年の訪日外客数は、前年比47.1%増の1974万人で45年ぶりに訪日旅行者数が出国日本人数(アウトバウンド)を上回りました。つまり、定量的にみても、定性的にみても2015年がブームの開始時といってよいでしょう。

図31の2003〜2014年の近似直線①は、2003〜2014年の訪日旅行者数に対して、2002年を0とし、2014年までの各年との差で説明した回帰直線の結果です。2014年以降は直線①に2002年からの差の年数を当てはめた数字で予測しています。

直線①での2015年の訪日旅行者数を予測すると、1102万人で、実際の1974万人とは倍近く乖離しています。このことからも、2015年はインバウンドブームによる構造変化があったといえそうです。

直線①での2020年予測は、1335万人、直線②では3654万人でした。2019年の実績値が3188万人であることから考えても直線②の値は現実的です。もしも2020年が平時で、オリンピックが開催されていたなら、2012年に立てられた目標4000万人が達成されたのではと予想できます。

しかし、実際は、コロナショックが起こり、2020年は412万人に急激に減少し、2022年までの出入国制限により、当時の政府の見立ても図31の予測も大幅な下方修正が必要なことがわかります。

つまり、線形回帰分析では、急激な構造変化を予測することは不可能に近いことがわかります。また2023年には、コロナ前の2016年程度に急激に訪日旅行者が戻ってきました。この空白の数年を含む直近の2024年までの期間をどうやって分析するのかは、悩ましい問題で知恵が必要です。

コロナ禍を含みながら分析する手法の1つは、規模の情報を捨てて、順位の情報で分析することです。もちろんどの国からも全く入国者がいなければ順位を出すことも難しいのですが、図31より、最も少なかった2021年でも25万人の入国者がいることはわかりますので、順位を出すことはできます。ここからは、順位で見ていきましょう。

もしも観光地としての各地域の魅力が季候、地理的特性、文化など長期間かけて複合的に形成されたもので決まってしまうなら、近くの県とは似たような特徴を持ち、観光地人気ランキングは固定的で変化が少なくなるはずです。

宿泊滞在先順位のランクロック

図32と図33は観光庁の「宿泊旅行統計調査」の日本人旅行者と外国人旅行者の都道府県別の延べ宿泊者数(人数×宿泊日数)について、インバウンドブームが加速した2015年からコロナ禍を経た2023年の順位をグラフにしたものです。

図32:宿泊先順位のランククロック(日本人)/図33:宿泊先順位のランククロック(インバウンド)

なぜ旅行者数ではなく延べ宿泊者数かというと、一般に旅費の3割程度が宿泊費と言われ、日帰りや立ち寄りよりも、宿泊してもらったほうが、多くの消費をしてもらえることから、観光業では、宿泊者数(Guest数)がアウトカムとして重要視されるからです。

この図は、2015年から2023年の滞在先人気ランキングの変動をランククロックで描画しています。人気ランキングをあらわすとき、よく使われるのが表です。

でも、複数年のランキングを載せても地域間の順位変化を比較しにくいです。時間方向の変化を表現するには線グラフが便利ですが、期間が長くなると始点と終点を目で比較するのが大変です。

その点、この図だと時計の12時の位置から2015年、2016年と進み、2023年で1周するため、始点と終点の比較が容易です。中心が1位の地域で順位が下がるほどに外側に広がっていきます。47都道府県の順位が期間中一定なら全ての線が同心円状になります。線がクロスしたり、色が途中で変わるのは、各地域の順位が変化していることを表します。

まず、ぱっと図32と図33を比較して、どんなことが読み取れるでしょうか? 時計の6時の位置に2019年が来るように描いたので、右側がコロナ前、左側がコロナ禍~コロナ後になります。上下で比較すると、日本人旅行者はコロナ前もそれ以降も滞在先の順位が安定していることがわかります。

一方、インバウンド旅行者は、コロナ禍~コロナ後で交差が増え、順位変動が激しいことがわかります。さらに、1位が東京なのは同じですが、それ以降は色味が異なっていて、ランキング内容が異なっていそうだなということも慣れてくるとわかります。

色味を見てみると、日本人旅行者は、首都圏からアクセスがしやすい南東北、北関東の色味が高順位の内側に多いことがわかります。一番外側の順位が低いところは中国地方の色味が強いです。一方で、インバウンド旅行者では、東北~北関東の色は順位が低い外側に散見し、東アジアから近い九州地方の色味が内側に見えます。

日本人の行き先や人気は固定的だが…

つまり、日本人にとっての行き先や人気は固定的ですが、インバウンド旅行者は、日本人とは異なる嗜好を持ち、その魅力は短期的にも変化し、コロナ前と同じく人気な場所もあれば、需要が戻ってこない地域があることがわかります。地域による受け入れ側の努力が、観光地としての人気に影響する余地があると私は解釈します。

グラフを描くうえでのメリットは、順位は規模の情報を含まないので、急激な旅行者の増減が起こる大きな構造変化があったとしても、分析しやすいことです。

順位の変動をランククロックで見ることで、日本人旅行者とインバウンド旅行者の違いが見えましたが、地域の成長度合いはどうなっているでしょうか? 成長率の計算は「人数」という規模の情報を使います。終点はコロナ禍を含むと何年にするかでころころ変わってしまうので、ここではコロナ前までの期間で分析します。

2011年から2019年の延べ宿泊者数の「年平均成長率(Compound Annual Growth Rate:CAGR)」を計算すると、日本人旅行者は2.4%、インバウンド旅行者は25.8%でした。2時点の間に複数年ある場合は、前年同期比ではなく年平均成長率で計算したほうがより現実に合った結果になります。

インバウンド旅行者は、順位の変動も規模の変動も大きいようです。実際、どこが成長していたのかを見てみましょう。

どの地域が成長していたのか?

図34は縦軸に日本人旅行者の延べ宿泊者数の年平均成長率、横軸にインバウンド旅行者の年平均成長率とする散布図です。まず両者の軸のレンジ(範囲)に注目しましょう。

図34:日本人/インバウンド旅行者のCAGRの散布図(2011〜2019年)

日本人旅行者の成長率がマイナス4%から10%と狭いのに対し、横軸の範囲は0%から50%と広いです。インバウンド旅行者が減少している都道府県は無く、全ての都道府県が10%を超えています。

散布図は、右上がり、右下がりの傾向は見て取れず、なんとなく円のように分布しています。相関係数を計算すると、日本人旅行者とインバウンド旅行者の成長率の相関係数はマイナス0.097で統計的な検定を行うと相関関係がないことがわかりました(5%水準で非有意)。人数ではないので、人気度の相関ではなく、成長の度合い同士は相関がないということです。

バブルの色は、インバウンド旅行者数の成長率の値によって、10%~20%は緑、20%~30%は青、30%~40%はオレンジ、40%以上は赤で色分けしています。最も成長率が高かったのは、香川県で46.4%、最も低かったのは茨城県で11.9%でした。

さらにもうひと重ねしてみましょう。バブルの大きさで2011年時点でのインバウンド旅行者の人数を表しました。インバウンド旅行者の上位滞在先は、1位から東京都、大阪府、千葉県、北海道、京都府、愛知県、神奈川県、福岡県、沖縄県、兵庫県でした。

成長率が40%以上の香川県(滞在先順位34位)、奈良県(滞在先順位39位)とその近くに分布している黄色の範囲を見てみましょう。バブルが小さく2011年の滞在者数が少なかったという特徴が見えます。言い換えると、初期時点の滞在客数が小さい県が大きく成長し、負の相関がありそうです。もし、この構造が続くならば、初期時点でインバウンド旅行者が少ない地域でも今後多くの観光客が訪れる可能性があるので、希望が持てますね。

経済学では、初期状態の経済水準と成長率に負の相関があると、水準が低い地域は早く成長し、もともと水準が高い地域では成長が鈍化することにより、時間が経過すると全ての地域の成長率が一定の状態になると考えます(定常状態に収束する)。このような現象を、β収束と呼び、なんだか難しく聞こえますが、仕組みは散布図に初期の規模を重ねると見えてくるので、相関以外に言えることがないかな?とか、成長率でグラフを描いた際には見てみるといいと思います。

これらの地域の取組みの一部ですが、香川県は3年に1度「瀬戸内国際芸術祭」を開催し、県の観光HPの多言語化も進んでいます。佐賀県や青森県は海外の人気映画やドラマのロケ地となっています。現状インバウンド旅行者の4割は関西地方を訪れるため、奈良県はその需要を獲得しています。グラフは、47都道府県のどこを見るか、深掘るかのヒントになり、新しい気づきを得るきっかけをくれます。

もう1つ、黄色の地域だけ抽出すると右上がりの傾向がありそうですね。推測の範囲を超えませんが、肌感覚としては、9年の期間でインバウンド旅行者が増えた地域に日本人旅行者の関心も増えて、日本人の成長率も高くなったのではと考えると納得感があります。

一見無相関な散布図の一部に相関があることも

一見、無相関な散布図の一部に相関がありそうな場所を探すこともポイントです。相関の強弱が分析にとって重要な場合は、性質が似ている(この場合は初期時点の人数が少ない)もので分析することが大事だからです。

統計学をよく使う人は、データのばらつきが大きいと相関が弱くなることが多いので、残念がります。でも、ビッグデータだったり、範囲が大きいデータに対して、線形関係のみを見る相関係数では、そもそも何を見ているのかよくわからないことも多々あります。そんなときに、ある切り口(今回は初期水準)の情報を重ねると、共通の特徴を持つサブサンプルが見つかり、範囲を絞ることで相関関係が見えることがあります。

このアプローチは、回帰分析の説明変数の見つけ方に通じます。回帰分析では、なんだかわからないけれど共通項がありそうな状態のとき、例えば地域分析で地域ごとのダミー変数を使います。でも今回のように、地域の差がより具体的にわかる切り口がグラフから見つかっていると、より適した変数を選択できます。この感覚が腹落ちすると、統計分析がぐっと身近になると思います。

同じことを「表」で表現しようとすると、行数は47都道府県、列数は各年の滞在者数、成長率になります。目で比較するのはなかなか大変で、どんなに工夫してもイメージが湧きにくいという難点があります。その点グラフは、47都道府県全体の様相が見られますし、成長率同士の相関や初期の規模と成長率の関係を見ることもできます。どちらが良いというわけではなく、伝えたいことが最も伝わる手段を使うことが大事です。

2025年4月24日 東洋経済オンラインに掲載

2025年5月7日掲載