英文名 | Data Science | |
---|---|---|
科目概要 | グリーン環境創成科学科2年前期 [金曜日2時限]、2群科目、必修、講義、2単位(30時間) | |
担当者 | (◎は科目責任者,※は実務経験のある教員) ◎村田 裕樹 | |
講義室 | ||
備考 | 科目ナンバリング:VG201-BC09 |
データ分析・データ可視化・データサイエンスの手法について学習する。また、コンピュータのハードウェアとソフトウェア、数と情報の表現について理解する。
大量かつ多様なデータを処理・分析するため、データサイエンスの重要性が社会で増している。本講義では「データ分析」「データ可視化」「データサイエンスの手法」を学習するとともに、コンピュータの「構造(ハードウェア)」、それを動かすための「機能(基本・応用ソフトウェア)」を理解する。さらに、グリーン環境を創成するためのデータサイエンス活用方法について、研究事例を紹介する。
1)「指定教科書」を使って講義する。理解度を確認するため「小テスト」を2回程度実施する。
2)「講義の改善」(フィードバック)=>「小テスト」の成績、「授業評価」のアンケート調査結果、および「現代社会」のニーズ動向をそれぞれ反映し、次年度の講義の改善に努める。
◎DP1:グリーン環境創成科学の理解、豊かな教養と高い倫理観
回 | 項目 | 内容 | 担当者 |
---|---|---|---|
1 | ガイダンス、データサイエンス入門 | 受講のねらいと諸注意、データサイエンスについて ・データ量の増加、計算機の処理性能の向上、AIの非連続的進化 ・第4次産業革命、Society 5.0、データ駆動型社会 | 村田 裕樹 |
2 | データ分析(1) | ヒストグラム・箱ひげ図・平均値と分散 ・調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど ・データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値) ・相関と因果(相関係数、擬似相関、交絡) | 村田 裕樹 |
3 | データ分析(2) | 散布図と相関係数、回帰直線、ヒートマップ ・調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど ・データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値) ・相関と因果(相関係数、擬似相関、交絡) | 村田 裕樹 |
4 | データ可視化(1) | Excelを用いたデータ可視化 ・データ可視化:複合グラフ、2軸グラフ、多次元の可視化、関係性の可視化、地図上の可視化 ・データ解析ツール(スプレッドシート) ・表形式のデータ(csv) | 村田 裕樹 |
5 | データ可視化(2) | Pythonを使ったデータ可視化 ・データ可視化:複合グラフ、2軸グラフ、多次元の可視化、関係性の可視化、地図上の可視化 ・データ解析ツール(スプレッドシート) ・表形式のデータ(csv) | 村田 裕樹 |
6 | データ可視化(3) | Rを使ったデータ可視化 ・データ可視化:複合グラフ、2軸グラフ、多次元の可視化、関係性の可視化、地図上の可視化 ・データ解析ツール(スプレッドシート) ・表形式のデータ(csv) | 村田 裕樹 |
7 | <基礎知識の確認> | 小テスト(1)と解説 | 村田 裕樹 |
8 | データサイエンスの手法(1) | クロス集計、回帰分析 | 村田 裕樹 |
9 | データサイエンスの手法(2) | クラスタリング、決定木 ・流通、製造、金融、サービス、インフラ、公共、ヘルスケア等におけるデータ・AI利活用事例紹介 | 村田 裕樹 |
10 | データサイエンスの手法(3) | ニューラルネットワーク、機械学習とAI(人工知能) ・流通、製造、金融、サービス、インフラ、公共、ヘルスケア等におけるデータ・AI利活用事例紹介 | 村田 裕樹 |
11 | <基礎知識の確認> | 小テスト(2)と解説 | 村田 裕樹 |
12 | 数と情報の表現 | 数の表し方、2進法、データ圧縮、誤り訂正符号、ビット列の解釈 ・データ倫理:データのねつ造、改ざん、盗用、プライバシー保護 | 村田 裕樹 |
13 | コンピュータのハードウェアとソフトウェア | ハードウェアの構成要素、入力装置、出力装置、入出力インターフェース、記憶装置、演算装置、スペックの読み方、ソフトウェア ・情報セキュリティ:機密性、完全性、可用性 | 村田 裕樹 |
14 | グリーン環境創成のためのデータサイエンス、総括 | 研究事例紹介、基礎知識のまとめ、本試験対策 ・AI最新技術の活用例(深層生成モデル、敵対的生成ネットワーク、強化学習、転移学習など) | 村田 裕樹 |
1)データ分析について理解している
2)データを可視化することができる
3)データサイエンスの手法を理解している
4)コンピュータの仕組みが理解している
5)数と情報の表現について理解している
小テスト(2回、30%)、本試験(70%)に基づき成績を評価する。なお、欠席は-5点、遅刻は-2点として評価点に換算する。
「予習」: 区分ごとに小テスト(2回)を課すので「講義の要点」をノートにまとめておくこと。教科書に加え、図書館やインターネットにて他の参考資料にも親しむこと。
「復習」: 小テストの結果で不得手な箇所を確認、理解すること。特にデータの分析・可視化について理解を深めるため、実際にコンピュータで作業して確認する必要がある。
本講義は、情報化社会における基礎科目として重要な科目の1つであり、これを習得するには日々の努力が不可欠である。
実務経験の授業への活用方法:データサイエンスが実社会でどう使えるのか、より良い環境を創成した経験を踏まえて講義する。
種別 | 書名 | 著者・編者 | 発行所 |
---|---|---|---|
教科書 | データサイエンス入門(第3版) | 竹村彰通・姫野哲人・高田聖治 編 和泉志津恵・市川治・梅津高朗・北廣和雄・齋藤邦彦・佐藤智和・白井剛・高田聖治・竹村彰通・田中琢真・姫野哲人・槙田直木・松井秀俊 共著 | 学術図書出版社 |
教科書 | 情報科学概論(第2版) | 田中琢真 著 | 学術図書出版社 |
参考書 | データ可視化学入門 | 江崎貴裕 | ソシム |