T_NAKAの阿房ブログ

アクセスカウンタ

zoom RSS 「ga063 社会人のためのデータサイエンス演習」の導入のサマリー

<<   作成日時 : 2016/04/24 00:01   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

ga063: 社会人のためのデータサイエンス演習を受講しています。
まだ第1週ですが、今回は課題無しの導入部ということなので、備忘録として私なりにまとめてみました。
本来は登録して受講可能となるため、ここで内容をつまびらかに開示してしまうことはルール違反でしょう。
ここは、あくまで私なりのまとめで情報としては薄いものですので、詳細は登録して受講されることをお勧めします。

最初に感想を言っておきましょう。
全体的には、そうなんだろうな、、とは思いますが、今回の講座とどう結びつくのか?あまり明確ではないように思えます。
機械学習なんて、今回の講座のレベルでは追い付かないのでは?
PPDAC など PDCA の変形だし、ロジックツリーも品質管理でいうところの特性要因図・連関図法・系統図法というのとほぼ同じで、そんなに新しいものじゃなさそうですね。
という訳で、私にはあまり大きな発見はありませんでした。。

Week 1 データサイエンスとは

1-1. ”データサイエンス”力の高い人材育成について

・"evidence-based" という考え方
・データは net 上に多く存在 → 必要なものはデータを有効に利用できるデータサイエンス力
・統計学のスキルがある大学卒業生はアメリカが約2万5000人、中国は約1万7000人に対し日本は約3000人
・すべてのデータ分析に高度な数学的知識が必ずしも必要というわけではない
・ちょっとした統計の知識とノウハウを身につけることでデータ分析のかなりのことができる → いわば普段使いのデータサイエンス
⇒ これがこの講座のねらい

1-2. データサイエンスが必要とされる背景

・インターネット上に様々な個人のデータや企業のデータが溜まってきている → ビッグデータ時代の到来
・活用事例
  @POS データ分析→利益最大化
  A政府からのオープンデータをゲームアプリに活用
  Bナビゲーションシステムのオープンデータから避難情報
・The Internet of Things(IoT) : 社内外データの収集
・ビッグデータの3つ特性
  Variety 〜データの多様性〜
  Volume 〜量の膨大さ〜
  Velocity 〜スピード〜
・企業における2つの変化
  顧客との対面接触機会の減少 ・・ 顧客の行動心理が分かり辛くなる
  社内のデータ量の増加 ・・ 顧客に関するデータが増加
・データの活用が企業競争力
  「データに基づき問題を解決する能力が求められている」

1-3. データサイエンスに求められるスキルや知識

・求められる能力
  取得可能なデータの収集・蓄積
  状況変化に関する重要な知見や洞察を導出
  分析結果に基づいたオペレーションの改善
・データサイエンティストに求められるスキル
  ビジネス 力 ・・ 課題背景を理解した上でビジネス課題を整理し、解決する力
  データエンジニアリング 力 ・・ データサイエンスを意味ある形に使えるようにし、実装、運用できるようにする力
  データサイエンス 力 ・・ 情報処理、人工知能、統計学なのど情報科学系の知恵を理解し、使う力

1-4. データサイエンスの将来

・データサイエンスの領域
  1つの軸:解析技術、非構造化データ処理、基礎技術 など
  別の軸:探索的、静的、動的 など
・人工頭脳に注目すると機械学習を中心として、パターン発見・言語処理・画像処理・音声処理・予測・時系列分析など
  →以前からある技術が少しずつ良くなってきている状況
  ディープラーニング → Google の猫
    猫の画像を多数入力すると、自動的に猫の特徴量を自動的に抽出
  画像認識精度が人間以上になってきている → 監視カメラを人間が見ていなくても良くなるかも。。
・既存産業における今後の発展
  農業/食品加工(料理)の自動化

1-5. PPDACサイクルに沿った問題解決の進め方

・循環型の問題解決プロセス
・PPDACサイクル(ニュージーランドで用いられる。PDCAサイクルが基本となった。)
  Problem(問題の発見):問題の明確化と定量化できる指標の決定/KGI(Key Goal Indicator )の決定
  Plan(調査の計画):分析結果の要因は数値からは読み取れないため分析設計前に仮説を立てておく
  Data(データの収集・加工):分析目的に対して精度の高いデータを準備
  Analysis(分析):分析結果から施策に活用するためのヒントを見出す
  Conclusion(結論):今までのフェーズで出てきた知見をもとに次につながるアクションプランを考える
 統計的思考が求められるのは Plan(調査の計画)→ Data(データの収集・加工)→ Analysis(分析)

1-6. 分析の設計手法

・ロジックツリー
  物事を論理的に分析・検討する際にその論理展開を樹形図に表現して考えていく思考技法
  課題の全体把握が容易にでき、議論のズレを修正しやすい
  表層に見えている問題から課題を発見する

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
「ga063 社会人のためのデータサイエンス演習」の導入のサマリー T_NAKAの阿房ブログ/BIGLOBEウェブリブログ
文字サイズ:       閉じる