
実践Data Scienceシリーズ Pythonではじめる データ分析のための前処理入門
ジッセンデータサイエンスシリーズ パイソンデハジメル データブンセキノタメノマエショリニュウモン
- 著: 菅 由紀子
★データ分析の現場の、即戦力になる!★
・データの前処理からモデリングに至るまでのデータ分析のプロセスを体系的に解説
・位置情報・テキスト・音声・画像などの非構造化データも扱う
・現場での課題解決を意識し、架空の旅行代理店データを用いたストーリー形式で解説
・生成AIを用いたデータハンドリング、特徴量エンジニアリング、不均衡データへの対処法、クラウド技術の活用など、最新のトレンドにも対応
・コードを公開しているから、すぐに実践できる!
【バーチャルデータサイエンティスト アイシア=ソリッド推薦!】
実際の分析事例を軸に前処理の技法を見ることで、
地に足のついた実践的な知識を得られる良書!
不均衡データへの対処や位置情報データの扱いなど、
実務頻出なのに解説が少ないテーマも扱っており、
データのプロや、プロを目指す人のための書籍と言えます。
本書を読み終わったらすぐに実践に飛び込めるでしょう!
【おもな内容】
1 前処理とは何か
2 前処理に向けたデータ理解
3 データクレンジングとしての前処理
4 データの基本事項確認としての前処理
5 データのソート・抽出
6 データの集計
7 データ結合
8 データ変換
9 モデリングのためのデータ変換
10 非構造化データの前処理――テキストデータ
11 非構造化データの前処理――位置情報
12 クラウド技術の活用と機械学習の実行
- 前巻
- 次巻
オンライン書店で購入する
目次
1 前処理とは何か
2 データとは何か
3 データクレンジングとしての前処理
4 データの基本事項確認としての前処理
5 データのソート・抽出
6 データの集計
7 データ結合
8 データ変換
9 モデリングのためのデータ変換
10 非構造化データ処理の前処理――テキストデータ
11 非構造化データ処理の前処理――位置情報
12 クラウド技術の活用と機械学習の実行
書誌情報
紙版
発売日
2025年07月17日
ISBN
9784065395868
判型
B5変型
価格
定価:3,300円(本体3,000円)
ページ数
272ページ
著者紹介
菅 由紀子 株式会社Rejoui 代表取締役・広島大学客員教授・データサイエンティスト協会スキル定義委員 中央大学経済学部卒業後、株式会社サイバーエージェントにてマーケティングリサーチ事業の立ち上げに従事。その後、株式会社ALBERTにて、多様な業界のデータ分析プロジェクトを担当し、データサイエンティストとして多数のプロジェクトに従事。2016年に株式会社Rejouiを創業し、データ分析・AI活用コンサルティング、データサイエンス教育、DX推進支援事業を展開。官公庁・企業・大学と連携し、データサイエンス教育の普及やデータ活用の社会実装に取り組む。 データサイエンティスト協会スキル定義委員として、データサイエンティストのスキル標準策定にも貢献するほか、日本全国各地でデータ活用の促進や次世代人材の育成を精力的に行っている。その功績が認められ、2021年度日本統計学会統計教育賞を受賞。
オンライン書店一覧
関連シリーズ
-
ソフトウェアの挑戦
-
Pythonではじめる時系列分析入門
-
プログラミング〈新〉作法
-
Polarsとpandasで学ぶ データ処理アイデアレシピ55
-
RustによるWebアプリケーション開発
-
ゼロから学ぶGit/GitHub
-
Pythonでスラスラわかる ベイズ推論「超」入門
-
Juliaプログラミング大全
-
Kaggleに挑む深層学習プログラミングの極意
-
ゼロから学ぶRust
-
ROS2とPythonで作って学ぶAIロボット入門
-
Pythonではじめるベイズ機械学習入門
-
Rではじめる地理空間データの統計解析入門
-
ゼロからはじめるデータサイエンス入門
-
Pythonではじめるテキストアナリティクス入門
-
Python数値計算プログラミング
-
1週間で学べる!Julia数値計算プログラミング
-
問題解決力を鍛える!アルゴリズムとデータ構造
-
ゼロからつくるPython機械学習プログラミング入門
-
これからのロボットプログラミング入門
-
モンテカルロ統計計算
-
スパース回帰分析とパターン認識
-
Rで学ぶ統計的データ解析
-
ゼロから学ぶPythonプログラミング
-
Pythonで学ぶアルゴリズムとデータ構造
-
PythonではじめるKaggleスタートブック
-
最適化手法入門
-
RとStanではじめる ベイズ統計モデリングによるデータ分析入門
-
データ分析のためのデータ可視化入門
-
ProcessingによるCGとメディアアート
-
入門者のPython
-
Web学習アプリ対応 C言語入門
-
ホログラフィ入門
-
pixivエンジニアが教えるプログラミング入門
-
使える! MATLAB/Simulinkプログラミング
-
最新 使える!MATLAB
-
今日から使える! MATLAB 数値計算から古典制御まで
-
OpenCVによる画像処理入門
-
OpenCVによるコンピュータビジョン・機械学習入門
-
LabVIEW画像計測入門
-
IDLプログラミング入門―基本概念から3次元グラフィックス
-
GPUプログラミング入門 -CUDA5による実装