本研究プロジェクトは, ウェブデータやプローブデータなどの "ビッグデータ" に対して, データサイエンスの手法を適用し, 具体的なビジネスや課題解決の提案を行うことを目指した.
幾つかのテーマについて研究を進め, 成果を学外に公表した.
(I) 走行情報プローブデータによる車両毎の運転特性の抽出と応用. 普及の進む第2世代有料道路料金収受システムETC2.0が蓄積している車両の走行履歴と挙動履歴を分析することで, ETC2.0の活用によって実現可能なサービスの提案を行うことを目指した. 具体例として, 危険運転の定量化の方法論を提案した. 2015年4月からの1年間, 関東近郊の観光スポット10地点について実証分析を行い, その有用性を検討した.
(II) 中古服市場に関する市場価格の要因分析. 中古服の大手e-コマースサイトからwebスクレーピングにより, 販売価格データおよび商品情報を収集し, 中古服市場価格の要因分析を行った. メーカーによって価格が制御されない「中古」市場の中でも, 消費者の感覚的判断に基づいて購買行動が行われる傾向の強い衣料を扱う中古服市場は特殊市場である. 本研究は統計/機械学習手法による分析を行い, 同市場の特徴について報告した.
(III) 中古車市場に関する市場価格の要因分析. 大手中古車情報サイトからwebスクレーピングにより, 販売価格データおよび商品情報を収集した. 先行研究と異なり, 分析対象を全国に広げ, 車種を特殊なもの以外全てをカバーすることで, 車種や地域に拘らず, 包括的に価格を定量評価できるようになった. 機械学習手法を導入することで価格の予測値の改善を図った. 業者に対して価格設定における有益な示唆の提供を試みた.
(Ⅳ) 国内クラウドファンディングにおける資金調達の成功要因分析. 近年発展している購入型クラウドファンディングについて, 国内大手サイトのデータを実証分析し, 資金調達の成功要因を調査した. 過去年度学事振興資金により実施した研究プロジェクト成果を刊行した.
This research project aimed to apply data science methods to "big data" such as web data and probe data, and to provide solutions to various business problems.
(I) Extraction of drivers' maneuver characteristics of individual vehicles and its applications:
We aimed to explore a new, effective use of the second generation ETC (Electronic Toll Collection System) probe data, containing the position information history of the vehicle and the abrupt driving maneuver history, and to consider potential services that could be realized with the data. In this project, we proposed a methodology to quantify abrupt driving maneuver of individual drivers. Analysis was conducted focusing on ten most popular tourist areas in the Greater Tokyo Area ("Kanto region") for one year from April 2015. We investigated its efficacy with a view towards business applications.
(II) Analysis of factors affecting price determination in B2C second-hand clothing markets:
With a large-scale dataset consisting of sales prices and various product information, collected by web scraping a largest e-commerce site of second-hand clothing in Japan, we investigated factors affecting price determination in the market. Second-hand clothing markets are rather unique; for one thing, prices in second-hand markets are not generally controlled by original manufactures; consumers tend to purchase clothes more with emotion than with rationality for another. In this project, we adopted statistical/ machine learning approaches to analyze the dataset and report empirical characteristics of the market.
(III) Analysis of factors affecting price determination in second-hand automobile markets:
Sales price data and product information were collected by web scraping from a major used car information site. Unlike the previous research, the analysis target was expanded nationwide and all models except for special ones. Such an extensive coverage has made us possible to quantitatively evaluate the price comprehensively regardless of the vehicle type and the region. By introducing a machine learning method, we aimed to improve the prediction of the sales prices. We tried to provide business suggestions for dealers based on the analysis.
(Ⅳ) Analysis of success factors in crowdfunding in Japan:
Analyzing data of a major domestic reward-based crowdfunding platform, we empirically investigated factors for the projects to be successfully funded from the crowds as planned.
|