
ビジネスパーソンのためのデータ・AIリテラシー/③データ加工
ビジネスパーソンがデータやAIを活用するうえで、知っておかなければならない知識やよく直面する課題を、用語解説を交えてやさしくお伝えします。この動画では、AIによる分析の精度を上げるために重要な「データ加工」について取り扱います。データ加工のポイントを事例を交えながら、一緒に学んでいきましょう。監修:DataRobotDataRobot はAI活用を民主化するため2012年に設立、同社が提供する「DataRobot AI Cloud」は次世代の AIである 。AI Cloud は、あらゆるデータタイプ、あらゆるユーザー、あらゆる環境を統合し、業界・業種を問わずすべての組織に対して重要で価値あるビジネスインサイトを提供することをビジョンとしている。DataRobotはAI Cloudのリーダーとして、あらゆる組織の本番環境へのAI導入を加速しており、Fortune 50の3分の1を含む、業界や業種を超えたグローバルな顧客から信頼を得ている。「DataRobot AI Cloud」は、今日の市場において最も広く展開され、実証されたAIプラットフォームの1つであり、世界中の顧客に対して1.4兆件以上の予測を提供している。DataRobotを体験されたい方はこちらから(30日間のフリートライアル)https://www.datarobot.com/jp/trial/?utm_source=globis&utm_medium=partner&utm_campaign=FreeTrial23JP-globisDataRobot お問合せ:https://www.datarobot.com/jp/resources/contact_us_g/グロービス経営大学院の「ビジネス・データサイエンス」クラスに「DataRobot AI Cloud」を提供中。グロービス経営大学院 ビジネス・データサイエンス 講座詳細:https://mba.globis.ac.jp/curriculum/detail/dsb/
会員限定
より理解を深め、他のユーザーとつながりましょう。
18人の振り返り
watanabe-tat
専門職
POSデータ分析におけるデータ蓄積は、①データレイクにPOSレジからのCSVデータを貯め②データクレンジング後にデータウェアハウスであるデータベースに確認して③分析用に必要データに集約したデータマートで分析する。またスキャンパネルデータは、データの質と量の観点で、会員情報の履歴を残すことを留意したい。このような方針で、クロスセクションデータの保管を進めたい。
tama56
販売・サービス・事務
説明にあった「過去のデータ」について、ただの記録としか見ていないと、単なる履歴になるが、視点を変えると、とても貴重なデータになることが理解できた。
sss_kobayashi
その他
クレンジングの先を意識して対応しないと、クレンジングだけで終了してしまうので要注意
masuhide
経営・経営企画
業務上様々なシーンで構築されたデータの活用を求められますが、それらデータの質と量、区分では時系列的なもの、種類など、のちに利用することを考えつつ蓄積しk手行く重要性を学びました。学習データは重要なポイントですね。
mg0582
IT・WEB・エンジニア
データを闇雲に集めるのではなく、利用できるデータを集める技術も今後は求められていく
yamaurari
経営・経営企画
提案の中にAIが出てくる可能性があり、学ばせていただきました。とくにITに詳しくないお客様であればデータを整理・適切に蓄積するというところに面白みを感じず、優先順位を下げることが多々あります。そういった際にこういう有識者からの意見があると進めやすいです。ありがとうございます。
stani
専門職
データの蓄積について学んだ。
jintan-papa
営業
データの精度や集め方が分析を左右するという認識を新たにした。
7031
経営・経営企画
当り前ですが、データを集めるにあたって、陳腐化しないよ目的をもってデータ蓄積をすることが重要だと改めて感じました
darumamistral
コンサルタント
RFM分析に活用できるのはないかと考えています。
k_yuna
販売・サービス・事務
少し難しい内容でした。
muramatsu0720
IT・WEB・エンジニア
POSデータ分析におけるデータ蓄積は、①データレイクにPOSレジからのCSVデータを貯め②データクレンジング後にデータウェアハウスであるデータベースに確認して③分析用に必要データに集約したデータマートで分析する。またスキャンパネルデータは、データの質と量の観点で、会員情報の履歴を残すことを留意したい。このような方針で、クロスセクションデータの保管を進めたい。
sm054307
経営・経営企画
データを集めるにあたって、陳腐化しないように
集める情報、目的をもってデータ蓄積をすることが重要と感じた
i323
その他
データ量を集めるだけではデータは生きず、目的や質、クレンジングするといった手間が必要なことが分かった。
jshinmura
IT・WEB・エンジニア
データ蓄積は、クロスセクションデータ、時系列データ、パネルデータの3種類がある。クロスセクションデータはある時点でのデータの断面を切り取った複数の項目についてのデータ、時系列データは、ある項目を時系列で追ったデータ、パネルデータは、その両方を持ちあわせているデータがあることを学びました。また、ECサイトなどで過去のデータは捨ててしまっているが、実はそれらはデータ蓄積の観点からはとてももったいない顧客のライフステージの履歴だったりするので、その後のレコメンドなど様々な利用用途の可能性がある貴重なデータであると認識すべきであることを学びました。
naoki_sasano
メーカー技術・研究・開発
より精度の高い予測モデルを作ろうとした場合、現在の収集データとは別の属性データを収集することが重要であることを理解した。
stengnabe
その他
データを蓄積して解析に活かしていきたい。
mkh8510
メディカル 関連職
データの蓄積において、いらないと思われる部分を切り捨て、整頓した状況がデータウェアハウスであることを理解しました。
しかし、講義でもありましたが、そろえられたデータが使用に耐えられるものである必要があります。業者任せの導入では、実際のデータがどう蓄積されていくかを確認する作業が必須となりますが、人数のいない部署では、確認作業ができない状況であり、使えないデータの蓄積、データウェアハウスのソフト維持費、HDDの容量の増大など、負の遺産のなる可能性があると考えます。
今、AIの活用や、NVIDIAが儲かっているなど、ニュースがあふれているが、遅れないようにかつ、導入が正しいか天秤にかけて、進めていく必要がある。