中島厚志のフェローに聞く

第4回「データ分析における土台づくり――データ整備の重要性」

本シリーズは、RIETI理事長 中島厚志 が研究内容や成果、今後の課題などについてRIETIフェローにたずねます。

シリーズ第4回目は、RIETIデータ整備プロジェクトのサブリーダーである 小西葉子 研究員を迎えて、実証研究のためのデータ構築の重要性、モデル構築の大変さとやりがいなどについてお話しいただきました。

サービス産業の生産性の分析への取り組み

中島 厚志理事長 写真 中島 厚志 (理事長):
小西さんは、サブリーダーとしてRIETIのデータ整備プロジェクトに取り組むと同時に多くの研究にも取り組まれています。まずはその研究から聞きたいですが、サービス産業の生産性分析に力を注いでいるのは、どういうところに関心を持ったからですか。

小西 葉子研究員 写真 小西 葉子 (研究員):
生産性分析自体は非常に王道の歴史のある分析で、国を牽引する産業の中心は製造業だという考え方があり、理論研究も実証研究も製造業を対象にしたものが多いです。データ自体も、経済産業省が製造業に関しては多くの充実したデータを提供しているので、実証研究でTFPを生産性の指標として計測したものが中心です。

一方、サービス業の生産性というと、データの制約から先行研究や官庁、国際機関のレポートなどでも労働生産性(付加価値額/労働者数)が用いられることが多いです。

中島:
どちらかというと収益性を見る指標で日本のサービス業が評価されることになっていますね。

小西:
そうですね。それで図らずも国際比較されてしまって、日本は生産性が低い、サービス業は駄目だという議論がされるのですが、日本のサービス業は本当にそんなに生産性が低くてクオリティが低いのかなという疑問がありました。確かに労働生産性やTFPも1つの指標ではありますが、ほかにも何か評価する指標があってもいいのではないかと思いました。

ただ、サービス業の生産性は、業種ごとに違う可能性もあります。また消費と供給が同時に起こるという特徴もあります。ですから、まだ今は製造業で言う技術進歩のようなものを取り出すというよりは、何か分からないけれども隣の店ではなくてこの店をもう一度選んでくれた、その理由は生産性なのか、おもてなしなのか、価格なのかは分からないけれど、とにかく満足して隣ではなくうちの店に来くれたという行動をベースに、複合的な生産性のようなものが取り出せて、その後でそれぞれの要因に分解していくということでもいいのかなと思っています。

中島:
確かに、サービス業の評価は多種多様でありうるわけですね。

小西:
それにキャパシティを超えているかどうかの情報も分かりません。最近、製造業について生産動態統計調査の最大生産能力(キャパシティ)のデータを使用して、需要に影響を受けない事業所の生産性を直接計測しました。こういうデータがもしサービス産業にもあれば、恐らく同じように計測することもできるだろうと思っています。

中島:
それはどのようなデータでしょうか。

小西:
例えば予約の電話や来客を断った時の記録です。その断った人数や件数が、お店やサービス提供者のその時点でのキャパシティになると考えられます。私たちには実際にどれだけ売れたとかという情報はありますが、そのサービスを提供している企業なり個人がどれだけの生産能力と技術を持っているかは、データから見ることができないのです。そこをモデリングして計測したいというのが研究を始めたきっかけです。

中島:
それは経済モデルで分かるのですか。

小西:
何とかモデルで識別できるようにして、それに合ったデータを探して、データからも識別したいと思っています。

中島:
なるほど。サービス産業の生産性を、今までは製造業と同じような計り方で評価していたけれども、多分それでは不十分だろうというのがスタートで、次に、提供しているサービスに必要な技術は何かをデータも含めてうまく見いだしていかなければ、サービス産業の生産性を計るのはなかなか難しいかもしれないということですね。

小西:
そうですね。サービス産業とくくってしまうと1つの産業のように見えますが、サービス産業は本当に多種多様です。卸・小売業もサービス業ですが、対個人サービスの美容院や病院などとは構造が違います。また教育や金融業もまた全く違った技術構造を持っていると思われますので、ある程度は個別に業種を見ていって、その業種が提供している付加価値とは一体何なのかという源泉を探ることも必要だと思っています。

中島:
いろいろな経済分析があって、しかも非常に厚みのある研究成果が出ているのに、サービス産業についてはまだまだ手探りのところが多いということですね。必要なデータをきちんとそろえるというところもまだ不十分で、製造業のようにはきちんと計測できないところがある。

逆に言えば、多種多様なサービスがあるのであれば、日本の各サービス業の競争力や世界の中での位置付けの本当の評価は、データ面からも分析としてもまだまだこれからということですね。

全体写真

何を知りたいのかを考えるモデル構築

中島:
ところで、複合的な生産性を取り出すということになると、まさに数値化してそれを取り出して分析するということになります。サービス業をうまく要因を見つけ出して経済モデルを作って解析できれば、それは日本のサービス業が競争力を上げる、効率を上げる、などの指標を提供するという意味で、ものすごい貢献がありますね。

小西:
先ほども言いましたが、サービス業に特化した理論モデルや生産性指標はありません。でも業種によっては製造業と同じでいいものもあるとは思います。製造業だと供給側である企業の情報だけで生産性を計測するのですが、同じことをサービス業でしても、過疎地に出店しているか激戦区に出店しているかで、全く同じ技術力でも売上額が変わってしまうという問題もあります。それに企業データしかみていないと、顧客が他の所で受けているサービスについての情報が見られないので、その企業の生産性を正確に計ることは難しいわけです。

中島:
そのモデルの話なのですが、今はモデルを作ること自体に相当苦労されているということですが、そこについて教えてください。

小西:
たとえば美容院であれば、提供側が1人1人の美容師さんだとすると、何人切ることができるかという生産関数は想定できますが、その人数を決めるのはお客さんの来店行動です。そもそも美容院の付加価値とは、来たときよりも美しくと考えられるので、技術の部分に顧客の主観的な満足度が入ってきます。ですから、それを同時に記述したようなモデルを作らないと、片方だけでは正確に計ることができないのです。

美容院というとすごく狭く聞こえるのですが、価格が決まっていて技術者のスキルによって提供時間の長さが変わるような対個人サービスであれば、恐らくこのモデルが応用可能なので、あとは各業種について必要なデータがあるかどうかになります。

中島:
つまり、サービス産業を広範囲に分析するためには、きちんとしたデータがどれだけそろうかも重要ということですか。

小西:
そうですね。データがあれば、そこからアイデアが浮かんできて、それを経済モデルにフィードバックすることもできると思います。そういう意味で、理論モデル、データのどちらか片方だけ精緻に作っていけば、何かが分かるという問題ではないと思っているからです。対象のことをよく考えて観察して、経済モデルを作ることは、研究者ならとても楽しいことです。それに加えて豊かなデータがあれば、より経済モデルを現実に擦り合わせられるような情報抽出ができると思っています。

中島:
しかし、今はデータがいくらでも溢れていますよね。しかも最近は、ID-POSなど個人データが大量に入手できるようになってきています。そのことで画期的な成果というか、サービス産業がいよいよ本格的に分析できるということに近づきつつあるといえるのか。それとも、データはたくさんあっても、それはまだまだ十分役に立たないのか。その辺はどういうことになっているのでしょうか。

小西:
10年前にはマイクロデータに簡単にはアクセスできなかったのですが、今は新しいことに挑戦できるデータがたくさん世の中に出てきている状態で、研究することは可能だと思います。今は実際にそれをどう使って何を知ろうとするか考えて、データハンドリングできる研究者数が追いついていないぐらいだと思います。

中島:
そうすると、データが集まってモデルを作るというときには、そのモデルというのは単に何かを入れれば、ぽっと結果が出てくるというものではなくて、何を語らせようとするモデルかという思想で作らなくてはいけないということですか。

小西:
そうですね。何を知りたいか、何を識別しようとしているのかを考えていないと、ただ単に統計手法を使ってざっくりと何かを見ようとしても、何を見ているのか分からなくなります。

計量経済学に軸足を置いた実証分析

中島 厚志理事長 写真 中島:
普通、経済モデルでは、経済理論に基づいて枠組みを作り、数字をそこに入れて、どのような結果を出すのかを分析します。それが一般的な経済学者の分析の仕方だと思うのですが、いまのお話だと逆にデータからモデルを作る方法もあるように聞こえます。小西さんはどうとらえているのですか。

小西:
今は大規模データを使って、モデルなしで、データを可視化して、数量化して語らせるという分析ももちろん可能です。その一方で、経済学でよく使われている経済モデルにデータを当てはめて、経済理論が正しいかどうかを仮説検証しながらその結果を分析するという形もあって、私は両方あっていいと思っています。

もしも自分のモデル・仮説が実際のデータとうまく合わなかったら、いったん理論モデルから離れて、データに自由に語らせてもいいと思います。ただ、それだと大体の挙動は分かっても、インプリケーションを出すときに仮説がないので難しいです。そういうときにはそのデータからの知見を活かしてモデルを作って仮説を置いてという方に戻ってもいいと思います。自分はこの主義だから片方だけというのはすごくもったいなくて、データ解析をする人であれば割と柔軟に両方できるような教育が行われるようになればいいと思っています。

中島:
なるほど。そこで小西さんの専門の計量経済の話に移りたいのですが、今のお話だと、経済理論の検証でもあるし、データに語らせることでもある。また自身で新しい理論モデルを作ることもある。

小西さんは、今までの専門もあって経済モデルを研究の中心に置いているということは分かりますが、立ち位置が、理論経済学者とは違うし、かといって実証分析ばかりしているという立場でもないようです。小西さんの立ち位置について、少し説明していただけませんか。

小西:
経済学の各専門分野で経済理論の検証として実証分析をしてインプリケーションを出している方がいらっしゃいますが、私自身は計量経済学を専門にしていてその応用として今は生産性を研究対象にしています。実証やデータ解析をしている方が「何かうまく出ないんだよね」と言うときの「うまく出ない」というのは、経済モデルとのギャップを指しています。それはそもそも、経済モデルが間違っている場合もありますし、推定手法や関数形が間違っているかもしれない、またはデータや変数の作り方が間違っている場合もあります。その時に、データ構築法や変数の定義を丁寧に行ったり、推定モデルの関数形の妥当性を調べたり、新たな推定方法や検定方法を提案してギャップを解消するということが、モチベーションになっています。経済学の理論モデルが正しいことを前提に、実証で起きうる問題を可能な限り排除して自分が見たいものを計測するというのが、私の好きなことです。

中島:
それはある意味、実証研究の縁の下の力持ち的な分野という感じも受けますし、逆にそれがベースにないと経済分析で出てくる結果もあやふやになってしまうということで、極めて土台となる部分に聞こえます。それはサービス業に限らず製造業にも当てはまるようですね。

小西 葉子研究員 写真 小西:
そうですね。生産性を取り出しているつもりでも、データの方に需要情報が入ってしまっていたら、その結果は需要が下がれば生産性が下がるという形になってしまって、何か政策を打とうとするときに、本当は需要を拡大しなければいけないのに補助金を出してしまったりする。これは製造業でも起きる問題ですが、サービス産業だとより深刻です。こういう点を私はしっかり整理して、改善したいのです。そこが不正確なのに、そこから先を議論するのは非常に危険だと思います。

中島:
そういう点では、今の経済実証分析を見直す研究分野は他にもありそうですね。

小西:
そうですね。多分そうだと思います。

中島:
その中で、サービス産業というのは、先ほどのお話を聞いても、結構難しいと思います。あえて難しいところにチャレンジしているのですか。

小西:
はい。経済学の理論モデルを作るところから始まるので、いつもより難しいと思いますが、同時にとても楽しいです。

中島:
ぜひ頑張っていただきたいと思います。

そもそも研究分野自体も難解だし、かつ、チャレンジしている分野もさらに難解ということだと思うのですが、こういうことをやってみようという関心は、そもそもどこから出てきたのですか。

小西:
学部や大学院で経済学の理論を学んでいたときに、経済成長に興味がありました。教育投資や社会インフラを整えることはすぐに結果は出なくても、持続的に成長するためには必要な投資だと考えられます。でも、実証分析をすると投資の効果がマイナスなことも多く、理論と実証分析のギャップが何によって起こっているのかに、すごく興味を持ちました。それで、もっと現実を知りたいと思い、データ解析ができるような勉強をしたくて、計量経済学や統計学に興味を持ったのが始まりです。

博士課程では、その勉強をするのに大変恵まれた環境にありました。統計数理研究所で共同研究や勉強をさせていただく機会があったのですが、そこでは統計学をベースにして生物学、医学、教育学や工学など、それぞれの分析対象やデータに合った理論や手法があることを知りました。いろいろな分野のアプローチを見ることができたことが大きいと思います。

中島:
今までのお話ですと、実証的に分析してみて経済理論と合わない場合、理論モデルの修正、実証方法の修正、データの修正の全てが重要ということですね。

小西:
そうですね。

まず実証分析ではデータはきちんと作らなくてはいけませんし、その次の段階として理論モデルと結果にギャップがあれば、モデルを修正したり、推定方法を変えたりしながら改善しましょうということです。そういう土台や枠組みをきちんと作った上で出てきた実証結果は本物だから、それを使ってみんながいろいろ議論できるようになったらいいなと思っています。

RIETIでの研究の楽しさ

中島:
最後に、小西さんには今伺ったような立場から、ご自身の研究に加えて、RIETIデータ整備プロジェクトにも大きく貢献しているのですが、RIETIでの研究の大変さと楽しさ、やりがいといったものを教えていただけますか。

小西:
RIETIにいれば、省庁のデータにもアクセスがいいですし、自分で調査したりデータを集めたりという作業もしやすいので、非常に恵まれた環境にいると思います。大学で研究していたら、自分の研究に必要なデータのことだけを考えていたと思うのですが、RIETIでデータ整備をしていると、自分だけではなくて、ほかの研究の精度にも貢献できて、いろいろな可能性が広がることに使命ややりがいを感じています。

具体的には、マイクロデータはすぐに分析できる形で提供されるわけではないので、複数の統計のマッチングや、事業所や企業を時間方向につなげてパネルデータ化しました。他のプロジェクトの実証研究が速やかに始められるようなデータ構築ができたことは、実証研究をやっている者としては非常に意義があったと思っています。

中島:
それは小西さんならではのご意見ですね。ほかの研究でも迅速に正確に実証分析が始められるように、RIETIではデータのインフラ整備をしています。その結果だけ見るとまさに氷山の一角で、その氷山の下では膨大な試行錯誤や結果の検証が行われて、綿密で骨の折れる猛烈な重労働という意味で、本当に縁の下の力持ち的な仕事だと思うのです。

しかし、それをプラスに受け止めていることは、実証分析などを間違いのない形でタイムリーに行い、きちんと政策につなげる使命を負っているRIETIにとっても大変ありがたいことで、ぜひ今後とも一段と成果を上げてもらえればと願っています。

今日はどうもありがとうございました。

全体写真 小西:
ありがとうございました。

2013年1月25日開催
2013年4月5日掲載

2013年4月5日掲載