はじめに

このチュートリアルの概要

このチュートリアルでは、Webスクレイピングという技術を使い、Web上の記事から中身を自動抽出する方法について学んでいきます。

このチュートリアルの対象受講者

  • Web上のデータ収集に時間をかかりすぎていて、「自動でデータ収集してみたいな」と思っている方
  • ログインが必要なサイトから、データを取得したいと思っている方

このチュートリアルでできるようになること

このチュートリアルでは、スクレイピング を利用して、以下のことができるようになります。

  1. ブログ記事を指定して、記事名、更新日、記事のURLを取得できるようになる
  2. ブログのURLを指定して、そのブログの全記事を取得できるようになる

必須条件

  • Pythonの基礎的な文法について理解しておきましょう。(ProgateのPython I ~ Python IV が完了しているレベルを目安に学習を進めましょう。)
  • スクレイピングは、HTMLを抽出することになります。HTMLやCSSの基礎を理解しておきましょう。(ProgateのHTML&CSS 中級編が完了しているレベルを目安に学習を進めましょう。)

このチュートリアルのステップ

以下の流れで学習を進めていきます。

  1. Webスクレイピングでできることを理解する
  2. 指定したブログ記事から、記事の内容をCSVにしてエクスポートする
  3. ブログの全記事をスクレイピングしてCSVにエクスポートする

それでは、さっそく進めていきましょう!

ノートをとる

メモが保存されました
メモ一覧を見る